MET 2211 Statistikk og dataanalyse Forelesning 23.09.2003 Kapittel 8: Ikke-parametriske tester
Hypoteseprøving i et nøtteskall Studer testobservatoren T Reflekter over hva det innebærer om T har meget høy eller meget lav verdi Ved ensidig test, må du fokusere på det som er aktuelt. Det er som regel greiest å definere T slik at du ser etter signifikant lave verdier To ekvivalente fremgangsmåter: Finn kritisk verdi og forkast H0 hvis testobservator har en mer ekstrem verdi Beregn p-verdien og forkast H0 hvis den er mindre enn det valgte signifikansnivået Ensidig test: signifikansnivå kalles a. p-verdi = halesannsynligheten fra og med observasjonen Tosidig test: signifikansnivå kalles 2a. p-verdi = 2´halesannsynligheten fra og med observasjonen 01.01.2019 MET 2211 - Fred Wenstøp
p-verdi og kritisk verdi p-verdi (areal) T Kritisk verdi for T: c = 3 Hvis p-verdi < a, må også T være mer ekstrem enn c 01.01.2019 MET 2211 - Fred Wenstøp
Binomisk test Eksempel: tekopper Data: n Ja/Nei-er 12 tekopper Nullhypotese H0: p = p0 P(bomme) = p = 0,5. Hun gjetter. Alternativ H1: p < ¹ > p0 p < 0,5 Hun kjenner forskjell Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: #JA eller #NEI Min(#JA, #NEI) T = antall bom = 2 (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(12;0,5;0,05)=3 =BINOMDIST(2;12;0,5;1)=0,019 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 2 < c = 3; eller p-verdi = 0,019 < sig.nivå = 0,05 01.01.2019 MET 2211 - Fred Wenstøp
Mediantesten Idegrunnlag Dataene er målinger Nullhypotesen er at populasjonsmedianen er lik et bestemt tall Ideen er at Hvis nullhypotesen er riktig, venter vi at halvparten av observasjonene faller på hver side av Da er vi med andre ord tilbake til et spesialtilfelle av den binomiske test, der p0 = ½ 01.01.2019 MET 2211 - Fred Wenstøp
Mediantesten Guttepulser H03 C =56 01.01.2019 MET 2211 - Fred Wenstøp
Mediantesten Guttepulser (data h03) n målinger 131 guttepulser Nullhypotese H0: = 70,5 (landsmedianen) Alternativ H1: < 70,5 (de er sprekere enn vanlig) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # < eller # > Min(# <, # >) T = antall over = 39 (bruk COUNTIF) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(131;0,5;0,05)= 56 =BINOMDIST(39;131;0,5;1)=0,00 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 39 < c = 56; eller p-verdi = 0 < sig.nivå = 0,05 01.01.2019 MET 2211 - Fred Wenstøp
Hypotesetesting og konfidensintervall n = 131 observasjoner * ** *** ****** * ** | *** * * ** * * 70,5 T = 39 observasjoner (funnet med countif) 68 ] Høyregrenseintervall x(56) = 68 H0 Enten : forkast H0 hvis det er færre enn 56 observasjoner til høyre for 70,5. Da må konfidensintervallet bomme. SPSS Eller: forkast H0 hvis x(56) ligger til venstre for 70,5. Da bommer konfidensintervallet. Statark 01.01.2019 MET 2211 - Fred Wenstøp
Fortegnstesten Idegrunnlag Eksempel: datafil Cornflakes Dataene kommer som regel fra relaterte stikkprøver De er opplysning om hvorvidt hvert enkelt observasjonsobjekt har forbedret seg eller blitt verre n plusser og minuser (nuller telles som en halv hver vei) Nullhypotesen er at medianforbedringen er null Da venter vi omtrent like mange mange plusser som minuser i observasjonene Vi er igjen tilbake til et spesialtilfelle av den binomske test med p = ½ 01.01.2019 MET 2211 - Fred Wenstøp
Fortegnstesten Eksempel: Cornflakes Data: n fortegn 13 salgsdifferanser Nullhypotese H0: Hyllehøyde spiller ingen rolle Alternativ H1: Hyllehøyde selger mer Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # + eller - > Min(# +, # -) T = antall minuser = 3 (Forkast H0 når T er liten nok) Kritisk verdi c c fra tabell 3b 1 –2a = 0,9; c = 4 Konklusjon: Forkast H0: T<c H0 forkastes: T = 3 < c = 4 01.01.2019 MET 2211 - Fred Wenstøp
Wilcoxons tegnrangtest Idegrunnlag og eksempel Er datagrunnlaget målinger, kaster fortegnstesten bort mye informasjon La oss i stedet for fortegnene bruke rangene Da forlater vi binomialfordelingen Men prinsippet blir det samme T- = 2+3,5 = 5,5 T+ = 49,5 01.01.2019 MET 2211 - Fred Wenstøp
Wilcoxons tegnrangtest Eksempel: slankekur Data: n differanser 10 vektforbedringer (før - etter) Nullhypotese H0: = 0 (kuren virker ikke) Alternativ H1: > 0 (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: T+ eller T- Min(T+, T-) T - = 5,5 (Statark eller SPSS) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 8b, Statark SPSS c = 11 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T - = 5,5 < c = 11 01.01.2019 MET 2211 - Fred Wenstøp
Mann-Whitneytesten Idegrunnlag Datagrunnlaget er to uavhengige stikkprøver n1 og n2 observasjoner Dataene må kunne sammenlignes Som oftest målinger H0 stikkprøvene trukket fra samme populasjon dvs at populasjonsmedianene er like Testobservatorene MW1 og MW2 Antall ganger verdier i den første stikkprøven er større enn i den andre, og omvendt. I alt n1 ´ n2 sammenligninger Hvis H0 er riktig, venter vi omtrent n1 ´ n2 hver vei 01.01.2019 MET 2211 - Fred Wenstøp
Mann-Whitneytesten Eksempel: slankekur Data: n1 og n2 målinger 10 vekter før og 10 vekter etter Nullhypotese H0: (kuren virker ikke) Alternativ H1: (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: MW1 eller MW2 Min(MW1 ; MW2) MW2 = 42,5 (Statark eller SPSS) (Forkast H0 når MW2 er liten nok) c eller p-verdi: c: tab. 4b, Statark SPSS c = 28 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 beholdes: MW2 = 42,5 > c = 28 01.01.2019 MET 2211 - Fred Wenstøp