Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

1 Kap 11 Hypotesetesting. 2 Hypotesetesting Hypotese:Utsagn (påstand) om virkeligheten. Hypotese innen statistikk:Utsagn (påstand) om en ukjent parameter.

Liknende presentasjoner


Presentasjon om: "1 Kap 11 Hypotesetesting. 2 Hypotesetesting Hypotese:Utsagn (påstand) om virkeligheten. Hypotese innen statistikk:Utsagn (påstand) om en ukjent parameter."— Utskrift av presentasjonen:

1 1 Kap 11 Hypotesetesting

2 2 Hypotesetesting Hypotese:Utsagn (påstand) om virkeligheten. Hypotese innen statistikk:Utsagn (påstand) om en ukjent parameter i en statistisk modell. Hypotesetesting:Statistisk metode for å ta stilling til hypoteser på grunnlag av resultater fra et forsøk eller en undersøkelse. Def

3 3 Hypotesetesting Eks: Promille 1 Det er tatt blodprøve av en mann som er mistenkt for promillekjøring. Det skal undersøkes om alkoholinnholdet i mannens blod er over promillegrensen Alkoholinnholdet  (promille) estimeres ved å ta gjennomsnittet av 4 målinger. Målingene er uavhengige og normalfordelte stokastiske variable med forventning  og kjent standardavvik  = 0.05 (det benyttes en velkjent målemetode). Gir resultatet grunnlag for å påstå at  > 0.50 ? I såfall vil mannen bli dømt for promillekjøring. La oss anta at alkoholinnholdet i mannens blod er akkurat på grensen, dvs  = Er da X >= et usannsynlig høyt resultat? Hvis ikke, må tvilen komme mannen til gode, og han bør ikke dømmes.

4 N(0.50, ) Hypotesetesting Eks: Promille Sannsynligheten for at X >= gitt at promillen  = Sannsynligheten er uakseptabelt høy. Dersom vi påstår at  > 0.5 for personer som har estimert alkoholinnhold i blodet som denne mannen (og høyere), så vil den metoden som er benyttet innebære at personer med alkoholinnhold 0.50 har 20% sannsynlighet for å blir dømt. Signifikanssannsynlighet

5  = 0.01 N(0.50, ) Hypotesetesting Eks: Promille 3 k=0.558 Sikkerhetsmargin:Minsteavstanden mellom X og  = 0.50 for at vi skal kunne påstå  > k Sikkerhetsmargin Vi vil bestemme k slik at sannsynligheten for å påstå  > 0.50 dersom  i virkeligheten er 0.50, er meget liten, la oss si 1%.

6 6 Hypotesetesting Generelt Nullhypotesen: Alternativ hypotese: Påstår H 1 dersom: Signifikansnivået: k : Kritisk verdi

7 7 Hypotesetesting Generelt Konklusjon på testen Virkeligheten Påstå H 1, dvs dom Ikke påstå H 1, dvs frifinnelse Ikke skyldig (  <=0.50)Skyldig (  >0.50) Mannen er uskyldig og dømmes feilaktig (sannsynlighet høyst 1%) Mannen frikjennes med rette Mannen dømmes med rette Mannen er skyldig og frikjennes feilaktig

8 8 Hypotesetesting Generelt Konklusjon Virkeligheten Forkaster ikke H 0 H 0 sann A Forkaster H 0 H 1 sann B C D A:Riktig B:Feil H 0 er sann, men testen forkaster den(Alvorlig feil) C:FeilH 1 er sann, men testen forkaster ikke H 0 D:Riktig Forkastningsfeil Godtakingsfeil Styrkefunksjon P(A)+P(B)=1 P(C)+P(D)=1

9 9 Hypotesetesting Generelt Konklusjon Virkeligheten Forkaster ikke H 0 H 0 sann A Forkaster H 0 H 1 sann B C D Ønsker å holde P(B) og P(C) liten, først og fremst P(B). Ønsker å holde P(B) og P(C) liten, først og fremst P(B). Trekker i hver sin retning. Eks:1.Det er alvorligere at en person uten promille over 0.5 dømmes enn at han går fri med for høy promille. 2.Det er alvorligere at en syk person som er alvorlig syk blir erklært frisk enn at en frisk person blir innkalt til en ekstra undersøkelse.

10 10 Hypotesetesting Målemetoden 1 Nullhypotesen: Alternativ hypotese: Påstår H 1 dersom: Signifikansnivået: k : Kritisk verdi n målinger av  : X 1, X 2,…, X n Målingene er uavhengige og normalfordelte stokastiske variable med ukjent forventning  og kjent varians  2. Standardestimator for  : Angir sannsynligheten for forkastningsfeil

11 11 Hypotesetesting Målemetoden 2 Signifikansnivået: Påstå H 1 dersom: 00  N( ,0,  2 ) k 0  N(0,1 2 ) uu

12 12 Hypotesetesting Målemetoden 3 Sikkerhetsmarginen: Sikkerhetsmarginen s avhenger av ,  og n som følger: -Jo lavere signifikansnivå  vi velger, dvs liten sannsynlighet for å påstå H 1 når H 0 er riktig, desto større blir u  og desto større sikkerhetsmargin må vi ha. -Jo større standardavviket  for en enkeltmåling er, desto større sikkerhetsmargin må vi ha. -Jo flere uavhengige målinger vi har, dvs stor n, desto mindre sikkerhetsmargin trenger vi.

13 13 Hypotesetesting Målemetoden 4 Eks: Promille 4 Nullhypotesen: Alternativ hypotese: Påstår H 1 dersom: Kritisk verdi: k : Kritisk verdi

14 14 Hypotesetesting Målemetoden Mindre enn testverdi Nullhypotesen: Alternativ hypotese: Signifikansnivået: Kritisk verdi: 00  N( ,0,  2 ) k 0  N(0,1 2 ) -u  uu

15 15 Hypotesetesting Målemetoden Mindre enn testverdi Eks: Lakseoppdrett Nullhypotesen: Alternativ hypotese: Med signifikansnivå 5% skal vi påstå H 1 dersom: En fiskeoppdretter har et stort antall laks i et basseng. Etter planen skulle laksen på et tidspunkt nådd en gjennomsnittsvekt på 4.5 kg, men oppdretteren har mistanke om at gjennomsnittsvekten  for laksen i bassenget er lavere. For å undersøke dette tar han opp 13 laks og veier dem. Målt vekt X for en tilfeldig laks fra bassenget antas å være normalfordelt med forventning  og standardavvik  = 0.70 kg. Målte vekter av forskjellige lakser er uavhengige variabler. Vi påstår H 1. Målingene tyder på at laksen ikke har nådd gjvekten 4.5 kg Målte vekter X i : Vi får:

16 16 Styrkefunksjonen Def Ved test av en hypotese H 1 om en ukjent parameter , er styrkefunksjonen  for testen definert ved: Styrkefunksjonen gir sannsynligheten for å påstå H 1 som funksjon av . Funksjonsverdien  (  ) kalles styrken i punktet .  angir testmetodens evne til å avsløre hvorvidt H 1 er sann. Ideelt om  var 1.0 når H 1 er riktig. Dette er ikke mulig, men vi ønsker at  skal være så stor som mulig. Hvis vi har flere alternative testmetoder med samme signifikansnivå, vil vi velge den metoden som har størst styrke under H 1.

17 17 Styrkefunksjonen Eks: Promille 5 Styrkefunksjon Sannsynligheten for å påstå H 1 på grunnlag av analyse av blod med alkoholinnhold  : 0.50 k=   (  )  = Sannsynligheten for forkastningsfeil.  (  ) = Sannsynligheten for å bli dømt når promillen er . 1-  (  )= Sannsynligheten for frifinnelse når promillen er . = Sannsynligheten for godtakingsfeil.

18 18 Styrkefunksjon Sannsynligheten for å påstå H 1 på grunnlag av analyse av blod med alkoholinnhold  : 0.50 k= Styrkefunksjonen Eks: Promille 6 -Funksjonen er voksende. Jo større alkoholinnholdet i blodprøven er, desto større blir sannsynligheten for dom. -  (0.50) = Dette følger av kravet om signifikansnivå 1%. Testen er konstruert slik at sannsynligheten for å påstå  > 0.50 er 0.01 når  = For   0.50 er   (  )  0.0. Dette betyr at sannsynligheten er liten for fellende dom ved   For   0.62 er  (  )  1.0. Det betyr at sannsynligheten for fellende dom er nær 1 når   For personer med alkoholinnhold i blodet fra ca 0.50 til ca 0.62 er både dom og frifinnelse reelle muligheter. For eksempel er  (0.58) = Det betyr at en person med alkoholinnhold  = 0.58 i blodet har sannsynlighet for å bli dømt og sannsynliget for å bli frifunnet.

19 19 Eks: Politisk gallup Nullhypotesen: Alternativ hypotese: Med signifikansnivå 5% skal vi påstå H 1 dersom:  er andelen i populasjonen av velgere som vil stemme Arbeiderpartiet. Av 1200 uttrukne velgere er Y antall som vil stemme Arbeiderpartiet. Skal teste om oppslutningen om Arbeiderpartiet er under 40%, dvs om  < Styrkefunksjonen for testen blir : Styrkefunksjonen Estimator:

20 20 Styrkefunksjonen   (  ) Eks: Når  < 0.36 kan vi med sannsynlighet 0.90 eller mer påstå H 1. Er oppslutningen 38%, så er det kun 41.7% sjanse for at vi vil påstå at partiets oppslutning er under 40%. Eks: Politisk gallup Styrkefunksjonen

21 21 Eks: Politisk gallup Styrkekrav La oss si at vi ønsker en test med styrke minst 0.90 når  = Vi vil bestemme utvalgsstørrelsen n slik at dette blir oppfylt. Når utvalgsstørrelsen endres, må vi bestemme ny kritisk verdi for testen. Den nye k-verdien finnes ved å erstatte utvalgsstørrelsen på 1200 med n i den k-verdien vi har fra før. Styrkefunksjonen for den nye testen : Med signifikansnivå 5% skal vi påstå H 1 dersom:

22 22 Eks: Politisk gallup Styrkekrav Styrkefunksjonen for den nye testen : Med signifikansnivå 5% skal vi påstå H 1 dersom: Vårt styrkekrav blir nå :

23 23 Eks: Politisk gallup Styrkekrav Den nye Styrkefunksjonen for den nye testen : Den nye k-verdien for testen blir : Vi skal altså gjennomføre en meningsmåling med n = 5093 velgere og påstå H 1 dersom :

24 24 Eks: Politisk gallup Styrkekrav Den nye Styrkefunksjonen for den nye testen :   (  )  ny (  )  nyny

25 25 Signifikanssannsynlighet Promille-eksempel: Nullhypotesen / Alternativ hypotese : Måling: Anta at H 0 gjelder, hva er da sannsynligheten for å få et resultat som er eller mer? Sannsynligheten p kalles signifikanssannsynligheten eller P-verdien for testen. Signifikanssannsynligheten er sannsynligheten for å få et resultat som er lik eller mer ekstremt enn den observerte verdien dersom H 0 gjelder.

26 26 Hypotesetest Signifikansnivå - Signifikanssannsynlighet Hypotesetest vha Signifikansnivå: Hypotesetest vha Signifikanssannsynlighet: k  x p x  k p

27 27 Signifikanssannsynlighet Generell formulering Observert : Signifikanssannsynlighet : Påstår H 1 dersom p < 

28 28 Hypotesetesting Signifikansnivå Målemetoden Mindre enn testverdi Eks: Lakseoppdrett Nullhypotesen: Alternativ hypotese: Med signifikansnivå 5% skal vi påstå H 1 dersom: En fiskeoppdretter har et stort antall laks i et basseng. Etter planen skulle laksen på et tidspunkt nådd en gjennomsnittsvekt på 4.5 kg, men oppdretteren har mistanke om at gjennomsnittsvekten  for laksen i bassenget er lavere. For å undersøke dette tar han opp 13 laks og veier dem. Målt vekt X for en tilfeldig laks fra bassenget antas å være normalfordelt med forventning  og standardavvik  = 0.70 kg. Målte vekter av forskjellige lakser er uavhengige variabler. Vi påstår H 1. Målingene tyder på at laksen ikke har nådd gjvekten 4.5 kg Målte vekter X i : Vi får:

29 29 Hypotesetesting Signifikanssannsynlighet Målemetoden Mindre enn testverdi Eks: Lakseoppdrett Nullhypotesen: Alternativ hypotese: Signifikanssannsynlighet : Vi påstår H 1. Målingene tyder på at laksen ikke har nådd gjvekten 4.5 kg Målte vekter X i : Vi får: x  k p

30 30 Signifikanssannsynlighet Binomisk modell Eks: Bivirkninger 1 Legemidler gir i gjennomsnitt bivirkninger til halvparten av pasientene. Et nytt legemiddel en håper skal gi færre bivirkninger er prøvd ut på 10 pasienter, hvorav 3 fikk bivirkninger. Gir dette resultatet grunnlag for å påstå at det nye legemiddelet gir færre bivirkninger (signifikansnivå 5%) ? X = Antall av de 10 pasientene som får bivirkninger q=Sannsynligheten for at en tilfeldig pasient får bivirkninger.

31 31 Signifikanssannsynlighet Binomisk modell Eks: Bivirkninger 2 Nullhypotesen: Alternativ hypotese: Signifikanssannsynlighet: Konklusjon:Vi kan ikke påstå at det nye legemiddelet er bedre enn det gamle.

32 32 Signifikansnivå Signifikanssannsynlighet Oppsummering Signifikansnivå 1.Velg signifikansnivå  2.Bestem kritisk verdi c ut fra  3.Sammenlign den observerte x av testvariabelen X og c Signifikanssannsynlighet 1.Velg signifikansnivå  2.Observer verdien x av testv. X 3.Beregn sannsynligheten p for å få observert resultat, gitt at H 0 er riktig. Sammenlign p og .

33 33 Hypotesetest Signifikansnivå - Signifikanssannsynlighet Signifikansnivå(vanlig metode): -Sammenligner en estimator for den aktuelle testparameteren med en kritisk verdi k. -Fokuserer på testmetoden. Best egnet til å forklare og til å forstå hypotesetesting. -Mest praktisk å ha en kritisk verdi å forholde seg til ved hypotesetest for flere datasett (sml promilletest). Signifikanssannsynlighet (alternativ metode): -Basert på signifikanssannsynligheten p (P-verdien). -Fokuseres på resultatet av forsøket. -Gir sannsynligheten for å få et resultat som er lik eller mer ekstremt enn det vi faktisk har fått. -Innebærer vanligvis mindre regnearbeid (spesielt ved diskrete mod.).

34 34 t-fordelingen og t-tester n målinger X 1, X 2, …, X n Konfidensintervall for  med sikkerhet 100(1-  ) %: Målemodellen Påstå  >  0 i en test med signifikansnivå  dersom: Skal analysere modellen når både  og  er ukjente parametre.

35 35 t-fordelingen og t-tester Erstatter  2 med standardestimatoren: Målemodellen Estimator for  (som før): Standardisering (med kjent  ): Standardisering (med ukjent  ): Sannsynlighetsfordelingen til T kalles t-fordelingen med n-1 frihetsgrader.

36 36 t-fordelingen og t-tester Målemodellen Standardisering (med kjent  ): Standardisering (med ukjent  ): Sannsynlighetsfordelingen til T kalles t-fordelingen med n-1 frihetsgrader. N(0,1) t

37 37 Tabell over t-fordelingen m …  Eks:

38 38 t-fordeling

39 39 t-fordelingen og t-tester Målemodellen Standardisering (med kjent  ): Standardisering (med ukjent  ): Når  er kjent tester vi H 0 :  =  0 mot H 1 :  >  0 med signifikansnivå  ved å påstå H 1 dersom :  t ,n- 1 t n-1

40 40 t-fordelingen og t-tester Målemodellen T 0 er t-fordelt når H 0 er riktig, dvs for  =  0. Dermed er: Sannsynligheten for å påstå H 1 når H 0 er riktig, er , og testen har altså signifikansnivå . Den tilsvarende t-testen med signifikansnivå  for hypotesten H 0 :  =  0 mot H 1 :  <  0 er å påstå H 1 dersom :  -t ,n-1 t n-1

41 41 t-fordeling Målemetoden Mindre enn testverdi Eks: Lakseoppdrett Hypoteser: 95% konfidensintervall: En fiskeoppdretter har et stort antall laks i et basseng. Etter planen skulle laksen på et tidspunkt nådd en gjennomsnittsvekt på 4.5 kg, men oppdretteren har mistanke om at gjennomsnittsvekten  for laksen i bassenget er lavere. For å undersøke dette tar han opp 13 laks og veier dem. Målt vekt X for en tilfeldig laks fra bassenget antas å være normalfordelt med ukjent forventning  og ukjent standardavvik . Målte vekter av forskjellige lakser er uavhengige variabler. Vi påstår H 1. Målingene tyder på at laksen ikke har nådd gjvekten 4.5 kg Målte vekter X i :

42 42 t-fordeling Utvalgsstørrelse Målemodellen Konfidensintervallet for  med sikkerhet 100(1-  )% er gitt ved: Krav: Intervallet skal være der d er en gitt verdi: Minste antall observasjoner n: Minste utvalgsstørrelse n avhenger av: - dFastsatt intervall-lengde - u  /2 Sikkerhet -  Standardavvik  kjent  ukjent

43 43 t-fordeling Utvalgsstørrelse Målemodellen Beregn antall laks som må tas opp og veies for å få et 95% konfidensintervall på formen X  0.25kg når  er ukjent. Vi benytter S = som et foreløpig estimat. Alternativt:

44 44 Tosidig test Målemodellen Nullhypotesen: Alternativ hypotese: Påstår H 1 dersom: Signifikansnivået: k : Kritisk verdi n målinger av  : X 1, X 2,…, X n Målingene er uavhengige og normalfordelte stokastiske variable med ukjent forventning  og kjent varians  2. Standardestimator for  :

45 45 Tosidig test Målemodellen Nullhypotesen: Alternativ hypotese: Påstår H 1 dersom: Signifikansnivået: n målinger av  : X 1, X 2,…, X n Målingene er uavhengige og normalfordelte stokastiske variable med ukjent forventning  og ukjent varians  2. Standardestimator for  :

46 46 Tosidig test Målemodellen Eks: Tomatbønner En hermetikkfabrikk har en pakkemaskin som brukes til å fylle hermetikkbokser av ulike slag. Ett av produktene er bokser med tomatbønner som skal ha et netto innhold på 425 gram. Bedriften har erfaring med at nettovekten X (gram) i en tilfeldig boks kan oppfattes som en normalfordelt stokastisk variabel med forventning  0 = 425 gram og standardavvik  = 5.0 gram når maskinen fungerer som den skal. Hver gang det startes opp med produksjon av hermetikkbokser med tomatbønner, gjennomføres en kontrollprosedyre som innebærer at en på grunnlag av målte nettovekter i 20 bokser tester om forventet nettovekt  inneholdt i en boks fra produksjonen som pågår, er forskjellig fra 425 gram. Bedriftens kontrollproblem kan formuleres som følgende hypotesetest: H 0 :  = 425 H 1 :   425 De målte vektene X 1, X 2,…, X n av vektene i de 20 hermetikkboksene som åpnes og veies, antas å være uavhengige normalfordelte variabler med forventning  og standardavvik . Som signifikansnivå for testen bruker bedriften 5%.

47 47 Tosidig test Målemodellen Eks: Tomatbønner Påstår H 1 dersom: Standardestimator for  : Målte vekter X i : Kjent standardavvik  = 5.0 gram Observert: Konklusjon:Kan ikke påstå H 1

48 48 Tosidig test Målemodellen Eks: Tomatbønner Signifikanssannsynlighet: Standardestimator for  : Målte vekter X i : Kjent standardavvik  = 5.0 gram Konklusjon:Kan ikke påstå H 1

49 49 Tosidig test Målemodellen Eks: Tomatbønner Påstår H 1 dersom: Signifikanssannsynlighet: Standardestimator for  : Målte vekter X i : UKjent standardavvik  Observert: Konklusjon:Kan ikke påstå H 1 Problematisk

50 50 Tosidig test Binomisk modell Eks: Produksjonsmetode En bedrift som produserer panelplater, har erfaring for at 10% av platene må kasseres. Bedriften har nylig tatt i bruk en ny maskin og bruker nå en noe annen produksjonsmetode enn før. På grunnlag av en testproduksjon på n = 150 enheter vil bedriften teste om kasseringsprosenten er endret. Vi lar p være sannsynligheten for at en tilfeldig plate blir kassert når den nye produksjonsmetoden benyttes, og vil teste om p  Bedriftens testproblem kan formuleres som følgende hypotesetest: H 0 : p = 0.10 H 1 : p  0.10 Som signifikansnivå for testen bruker bedriften 5%.

51 51 Tosidig test Binomisk modell Eks: Produksjonsmetode Standardestimator for p : Påstår H 1 dersom: Observert: Konklusjon:Påstår H 1

52 52 Oppsummering I Nullhypotese

53 53 Oppsummering II Nullhypotese Styrkefunksjon: Signifikanssannsynlighet:

54 54 ENDEND


Laste ned ppt "1 Kap 11 Hypotesetesting. 2 Hypotesetesting Hypotese:Utsagn (påstand) om virkeligheten. Hypotese innen statistikk:Utsagn (påstand) om en ukjent parameter."

Liknende presentasjoner


Annonser fra Google