Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Www.nr.no Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral 15.09.04.

Liknende presentasjoner


Presentasjon om: "Www.nr.no Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral 15.09.04."— Utskrift av presentasjonen:

1 Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral

2 Husker du? ► Stokastisk forsøk ▪Et eksperiment der utfallet ikke er kjent på forhånd ► Stokastisk variabel ▪Tallstørrelse knyttet til utfallet av et stokastisk forsøk ► Sannsynlighetsfordeling: ▪Angir sannsynligheten for de forskjellige mulige verdiene til en stokastisk variabel X, P(X=x) ▪Forventningsverdi, E(X), og varians, Var(X) ▪Binomisk forsøksrekke og binomisk fordeling ▪Poissonprosess og Poissonfordeling

3 Dagens temaer ► Hypotesetesting ▪Tankegangen bak hypotesetesting ▪p-verdi og signifikansnivå ▪Type I- og type II-feil ▪Teststyrke ▪Énsidig og tosidig test ► Eksempelbasert framstilling!

4 Hypotesetesting ► Eksempler på problemstillinger som kan tenkes besvart gjennom hypotesetesting ▪Effekten av et nytt medikament ◦Sammenlikning mot et eksisterende legemiddel ◦Sammenlikning mot placebo ▪Krybbedød ◦Påvirker barnets liggestilling sjansen for krybbedød? ▪Radioaktive utslipp ◦Er det grunnlag for å påstå at en lokal opphopning av krefttilfeller skyldes utslipp fra et atomkraftverk?

5 Hypotesetesting ► Ønsker å si noe om hele populasjonen på grunnlag av et utvalg ► Slike utsagn får nødvendigvis noe usikkerhet i seg Populasjon Utvalg Trekker (tilfeldig) utvalg fra populasjonen Bruker beregninger på utvalget til å si noe om populasjonen

6 Hypotesetesting, eksempel 1 ► Uttesting av et nytt legemiddel mot depresjon ▪Et utvalg på 9 personer deltar i en studie hvor effekten av medikamentet testes mot et placebo ▪To prøveperioder: Hver person får medikamentet i én periode og placebo i én periode (overkrysningsstudie) ▪Personene får enten placebo i første og medikamentet i andre prøveperiode eller omvendt (randomisering) ▪Ingen får vite når de får medikamentet og når de får placebo (blindstudie) ▪Til slutt blir de spurt om i hvilken periode de følte seg best

7 Hypotesetesting, eksempel 1 ► Vurdering av testpersonenes svar ▪Hvis medikamentet ikke har effekt, er sannsynligheten for å føle seg best i ”medikamentperioden” lik 0.5 (og tilsvarende for ”placeboperioden”) I dette tilfellet ville man kanskje forvente at 4, 5 eller 6 personer følte seg best i ”medikamentperioden” (eller ”placeboperioden”) (jfr. usikkerheten som ligger i å representere en hel populasjon med et begrenset utvalg).

8 Hypotesetesting, eksempel 1 ► Tolkning av mulige prøvesvar: ▪Anta nå at 8 personer ble bedre av medikamentet. Gir dette grunnlag for å hevde at medikamentet har (positiv) effekt? Ganske sikkert! ▪Merk 1! Hvis alle 9 personene hadde blitt bedre av medikamentet, så ville konklusjonen vært enda sikrere. ▪Merk 2! Men hva hvis det var bare 7 eller 6 personer? Da virker det verre å svare et klart JA eller NEI på spørsmålet om effekt av medikamentet.

9 Hypotesetesting, eksempel 1 ► Formalisering av problemstillingen: ▪Det er to mulige hypoteser H 0 : placebo og medikamentet har samme effekt H A : medikamentet har bedre effekt enn placebo ▪H 0 kalles nullhypotesen og H A alternativhypotesen (betegnes også H 1 ) ▪Våre data: 8 personer ble bedre av medikamentet ◦Forkaster dette H 0 ? ◦Beviser dette H A ?

10 Hypotesetesting, eksempel 1 ► Statistisk modell, eksempel 1: ▪Anta at H 0 er riktig (dvs. medikament og placebo har samme effekt) ◦Rimelig tilnærming: Hvis denne antagelsen gir en svært liten sannsynligheten for å få de dataene vi faktisk har observert, så forkaster vi H 0. ◦Hvis H 0 er riktig, så har medikamentet ingen effekt. ·Sannsynligheten for å føle seg best i ”medikamentperioden” er da lik 0.5 for hver enkelt person, uavhengig av de andre. ·=> vi har en binomisk forsøksrekke! ◦Antagelsen om ”at H 0 er riktig” omtales ofte som ”under H 0 ”

11 Hypotesetesting, eksempel 1 ► Altså: ▪Under H 0 har vi en binomisk forsøksrekke med ◦Antall enkeltforsøk n = 9 ◦I hvert enkeltforsøk er P(bedring) = p = 0.5 ◦X = antall (av de 9) som føler seg bedre av medikamentet. X kalles for teststørrelsen (eller testobservatoren), og er en oppsummering av dataene som vi bruker for å teste. ◦Skriver X ~ binomisk(9, 0.5). Da er sannsynlighetsfordelingen til X gitt ved

12 Hypotesetesting, eksempel 1 P(X = x) for X ~ binomisk(9, 0.5)

13 Hypotesetesting, eksempel 1 ► Hvor sannsynlige er de observasjonene vi har gjort innenfor en slik ramme, dvs. under H 0 ? ▪Ut fra den statistiske modellen vi nå har satt opp, får vi at ▪Denne sannsynligheten er så liten at det ikke synes rimelig at dataene kan ha kommet fra en binomisk forsøksrekke med p = 0.5. => det er grunnlag for å hevde at medikamentet og placebo IKKE har samme effekt, og H 0 forkastes!

14 Hypotesetesting, eksempel 1 ► Generell framstilling: ▪Vi setter opp en konservativ / nøytral nullhypotese (H 0 ). I vårt tilfelle vil dette være at medikamentet har samme effekt som placebo, dvs. p = 0.5 ▪Alternativet, som er det vi vil teste nullhypotesen mot, er at medikamentet har bedre effekt, dvs. p > 0.5 ▪Vi tester derfor H 0 : p = 0.5 mot H A : p > 0.5 ▪Vi forkaster H 0 dersom vårt observerte resultat er lite sannsynlig under H 0

15 Hypotesetesting, eksempel 1 ► p-verdi ▪Sannsynligheten for å få et minst like ekstremt resultat som det vi har observert, gitt at H 0 er sann, kalles for p- verdien eller signifikanssannsynligheten (i vårt eksempel var p-verdien ) ▪Nullhypotesen forkastes hvis p-verdien er veldig liten, som er ekvivalent med at resultatet av forsøket (8 personer med positiv effekt) er veldig usannsynlig hvis H 0 er riktig

16 Hypotesetesting, eksempel 1 ► Signifikansnivå ▪Signifikansnivået er grensen for hvor liten p-verdien kan være før H 0 forkastes, som betyr at H 0 forkastes hvis p-verdien er mindre enn signifikansnivået. Hvis utfallet blir at H 0 forkastes, sier man at testen ga et signifikant resultat. ▪I vanlige tester settes signifikansnivået typisk til 5%, i strengere tester til 1%. ▪Merk! Hvis signifikansnivået i vårt eksempel var satt lik 1%, ville vi ikke forkastet nullhypotesen om at medikamentet ikke hadde noen effekt (fordi p-verdien var > 1%).

17 Hypotesetesting, eksempel 1 ► Signifikansnivå, forts. ▪Signifikansnivået velges, og dette bør gjøres før studien gjennomføres (for å unngå at testoppsettet brukes til å oppnå det resultatet man eventuelt ønsker) ▪I stedet for å bestemme et absolutt signifikansnivå og enten forkaste eller ikke forkaste H 0 ut fra dette, kan det være hensiktsmessig bare å oppgi testens p-verdi. Dermed overlates det til brukeren å vurdere beviskraften hun vil tillegge p-verdien.

18 Hypotesetesting, eksempel 1 ► Forkastningsområde ▪Til et valgt signifikansnivå α hører et forkastningsområde: Finn (den minste) x α slik at P(X > x  | H 0 ) ≤ α {x : x > x  } er da forkastningsområdet. Hvis vår observerte X ligger i forkastningsområdet, forkaster vi H 0. ▪I vårt eksempel: P(X > 8 | H 0 ) = P(X > 7 | H 0 ) = P(X > 6 | H 0 ) = På nivå α = 5% får vi derfor x  = 7, og med observert X = 8 dermed forkastning av H 0.

19 Hypotesetesting, eksempel 1 ► Oppsummering av hypotesetestingsprosedyren ▪Vi har en konservativ / nøytral hypotese, H 0, som vi har mistanke om at ikke stemmer. Vi vil undersøke om våre data gir grunnlag for å påstå at dette er tilfelle. ▪Dette gjør vi ved å anta H 0 og ◦enten finne den tilhørende p-verdien (dvs. sannsynligheten for å få vårt observerte resultat eller et enda mer ekstremt resultat, gitt at H 0 er riktig), og forkaste H 0 hvis p-verdien er veldig lav (dvs. lavere enn signifikansnivået). ◦eller beregne forkastningsområdet og forkaste H 0 hvis vår observerte X ligger i dette området

20 Type I- og type II-feil Naturens ukjente sannhet: H 0 sannH A sann Vår beslutning Ikke forkast H 0 Riktig konklusjon Type II-feil Forkast H 0 Type I-feil Riktig konklusjon

21 Type I- og type II-feil ► Feilsannsynligheter ▪α = P(Type I-feil), dvs. sannsynligheten for å forkaste H 0 selv om den er sann. Denne vil være lik det signifikansnivået vi har besluttet å bruke. ▪β = P(Type II-feil), dvs. sannsynligheten for ikke å forkaste H 0 selv om den er usann. Årsaken til type II-feil er oftest at datamaterialet (n) er for lite. ▪Type I-feil regnes som mer alvorlig enn type II-feil. Det er derfor signifikansnivået (som er lik P(type I- feil)) settes lavt (typisk som 5% eller 1%). P(type II- feil) vil vanligvis være større.

22 Teststyrke ► Hvilken mulighet har vi for å avdekke at H 0 er gal? ▪1 – β er sannsynligheten for å forkaste H 0 når den er usann (dvs. når p > 0.5) ▪Denne sannsynligheten kalles teststyrken og er en funksjon av parameteren vi tester (p).

23 Énsidig og tosidig test ► Så langt har vi sett på en énsidig test, dvs. H 0 : p = 0.5 mot H A : p > 0.5 ► I situasjoner hvor man f. eks. tester et nytt legemiddel mot et eksisterende, kan man i utgangspunktet ikke vite om det nye middelet er bedre eller dårligere enn det eksisterende. ► Dette leder til en tosidig testsituasjon, dvs. H 0 : p = 0.5 mot H A : p ≠ 0.5 ► Tosidige tester tar ikke på forhånd stilling til i hvilken retning en eventuell forskjell vil gå.

24 Énsidig og tosidig test ► For å beregne forkastningsregion og p-verdi må vi nå ta hensyn til at avviket fra H 0 kan oppstå i begge retninger. ► Med signifikansnivå 0.05 får vi forkastningsområde x x ► Uttrykket for p-verdien må også ta hensyn til (like) ekstreme utslag i den andre enden av verdiområdet til X.

25 Énsidig og tosidig test ▪I vårt eksempel: Forkastningsområde: P(X 8 | H 0 ) = P(X 7 | H 0 ) = P(X 6 | H 0 ) = 0.18 På nivå α = 5% får vi derfor x = 2 og x = 7. Observert X = 8 gir dermed forkastning av H 0. p-verdi: Denne gir også forkastning.

26 Énsidig og tosidig test ► Merk! Nullhypotesen er den samme i begge testsituasjonene, men siden alternativhypotesen er forskjellig, blir p- verdier og forkastningsområder generelt forskjellige. Følgelig kan også konklusjonene med hensyn til forkastning av H 0 eller ikke bli annerledes enn ved en énsidig test. I vårt eksempel vil f. eks. et signifikansnivå på 2.5% lede til forkastning av H 0 ved en énsidig test (p-verdi = ), mens p-verdien beregnet fra den tosidige testen (0.039) ikke gir grunnlag for forkastning.


Laste ned ppt "Www.nr.no Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral 15.09.04."

Liknende presentasjoner


Annonser fra Google