Kapittel 8: Ikke-parametriske tester

Slides:



Advertisements
Liknende presentasjoner
Øvelse i caseløsning Fred Wenstøp, BI
Advertisements

Hva trenger jeg av data, og hvordan skal jeg innhente disse?
Enhalet og tohalet hypotesetest
Kapittel 10 Inferens om gjennomsnitt AAKRE-V SPSS v 10.0 MET 8006 STATISTIKK OG DATAANLYSE Kapittel 10 Inferens om gjennomsnitt Pål Aakre, BI Oslo.
SPSS v Kapittel 8 AAKRE/MET Parvise sammenligninger Cornflakes-eksempelet fra læreboken tab Vi legger inn dataene i Dataeditoren, som.
STATISTISK GENERALISERING
MET 2211 Statistikk og dataanalyse
Eksempel AOA (Activity On Arc)
Corporate Finance Planlegging og kontroll. Investeringsprosessen Vi har hittil bare behandlet en snever del av investeringsprosessen, kun regneteknikker.
Fred Wenstøp: Statistikk og dataanalyse kapittel 1-9 Prøve-eksamen
Fred Wenstøp: Statistikk og dataanalyse Selvtest Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
Fred Wenstøp: Statistikk og dataanalyse Selvtest
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse Forelesning Kapittel 14: Variansanalyse.
Simpel regresjon Plott av variablene Y mot X
Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Bærekraftig utvikling - forskerspiren
Diskrete stokastiske variable
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral
Hypotesetesting, og kontinuerlige stokastiske variable
Siste forelesning er i morgen!
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Operasjonsanalytiske emner Prognosemodeller basert på Tidsserieanalyse Rasmus RasmussenBØK710 OPERASJONSANALYTISKE EMNER1 Del 23Forecasting 1 - Mønster.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
MET 2211 Statistikk og dataanalyse
MET 8006 Statistikk Forelesning nr. 1 Kapittel 1: Oversikt
MET 2211 Statistikk og dataanalyse
Forelesning nr. 2 Kapittel 3: Å generalisere fra en stikkprøve
Repetisjon, del I Metode
MET 2211 Statistikk og dataanalyse
Kapittel 7: Hypoteseprøving
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
SIV : Kategoriske variabler og normaltilnærmelsen
MET 2211 Statistikk og dataanalyse
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
Tester med SPSS prosedyrer og utskrifter
MET 8006 Statistikk Kapittel 13: Regresjon.
MET 2211 Statistikk og dataanalyse
MET 8006 Statistikk Kapittel 13: Regresjon.
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Kapittel 11 Kategoriske variabler og normaltilnærmelsen
To relaterte stikkprøver
SIV : Metodevalg Stokastiske variabler
MET 2211 Statistikk og dataanalyse
SIV : Regresjon Kapittel 13 17/01/2019 Fred Wenstøp.
Relaterte stikkprøver Uavhengige stikkprøver
MET 2211 Statistikk og dataanalyse
SIV : t-testen for to stikkprøver
MET 2211 Statistikk og dataanalyse
SIV : Variansanalyse Kapittel 14 17/02/2019 Fred Wenstøp.
SIV : Kapittel 4 Statistisk metode 18/02/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
Å beskrive og generalisere fra en stikkprøve
SIV : Kapittel 7 Hypoteseprøving 22/02/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
Kapittel 6: Sannsynlighetsfordelinger
Kapittel 12: Korrelasjon
Kapittel 10 Inferens om gjennomsnitt
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

Kapittel 8: Ikke-parametriske tester MET 8006 Statistikk Kapittel 8: Ikke-parametriske tester

Hypoteseprøving i et nøtteskall Studer testobservatoren T Reflekter over hva det innebærer om T har meget høy eller meget lav verdi Ved ensidig test, må du fokusere på det som er aktuelt. Det er som regel greiest å definere T slik at du ser etter signifikant lave verdier To ekvivalente fremgangsmåter: Finn kritisk verdi og forkast H0 hvis testobservator har en mer ekstrem verdi Beregn p-verdien og forkast H0 hvis den er mindre enn det valgte signifikansnivået Ensidig test: signifikansnivå kalles a. p-verdi = halesannsynligheten fra og med observasjonen Tosidig test: signifikansnivå kalles 2a. p-verdi = 2´halesannsynligheten fra og med observasjonen 10.11.2018 MET 8006 - Fred Wenstøp

p-verdi og kritisk verdi p-verdi (areal) T Kritisk verdi for T: c = 3 Hvis p-verdi < a, må også T være mer ekstrem enn c 10.11.2018 MET 8006 - Fred Wenstøp

Binomisk test Eksempel: tekopper Data: n Ja/Nei-er 12 tekopper Nullhypotese H0: p = p0 P(bomme) = p = 0,5. Hun gjetter. Alternativ H1: p < ¹ > p0 p < 0,5 Hun kjenner forskjell Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: #JA eller #NEI Min(#JA, #NEI) T = antall bom = 2 (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(12;0,5;0,05)=3 =BINOMDIST(2;12;0,5;1)=0,019 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 2 < c = 3; eller p-verdi = 0,019 < sig.nivå = 0,05 10.11.2018 MET 8006 - Fred Wenstøp

Mediantesten Idegrunnlag Dataene er målinger Nullhypotesen er at populasjonsmedianen er lik et bestemt tall Ideen er at Hvis nullhypotesen er riktig, venter vi at halvparten av observasjonene faller på hver side av Da er vi med andre ord tilbake til et spesialtilfelle av den binomiske test, der p0 = ½ 10.11.2018 MET 8006 - Fred Wenstøp

Mediantesten Guttepulser H04 C =33 T = 31 10.11.2018 MET 8006 - Fred Wenstøp

Mediantesten Guttepulser (data h03) n målinger 80 guttepulser Nullhypotese H0: = 70,5 (landsmedianen) Alternativ H1: < 70,5 (de er sprekere enn vanlig) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # < eller # > Min(# <, # >) T = antall over = 31 (bruk COUNTIF) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(80;0,5;0,05)= 33 =BINOMDIST(31;80;0,5;1)=0,028 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 31 < c = 33; eller p-verdi = 0,028 < sig.nivå = 0,05 10.11.2018 MET 8006 - Fred Wenstøp

Grafisk oppsummering n = 80 observasjoner H0 70,5 * ** *** ****** * ** | *** * * ** * * ] Høyregrenseintervall T = 31 observasjoner (funnet med countif) x(33) = 70 Enten : forkast H0 hvis det er færre enn 33 observasjoner til høyre for 70,5. Da må konfidensintervallet bomme. SPSS, Statark vi-7b Eller: forkast H0 hvis x(33) ligger til venstre for 70,5. Da bommer konfidensintervallet. Statark vi-4 10.11.2018 MET 8006 - Fred Wenstøp

Fortegnstesten Idegrunnlag Eksempel: datafil Cornflakes Dataene kommer som regel fra relaterte stikkprøver De er opplysning om hvorvidt hvert enkelt observasjonsobjekt har forbedret seg eller blitt verre n plusser og minuser (nuller telles som en halv hver vei) Nullhypotesen er at medianforbedringen er null Da venter vi omtrent like mange mange plusser som minuser i observasjonene Vi er igjen tilbake til et spesialtilfelle av den binomske test med p = ½ 10.11.2018 MET 8006 - Fred Wenstøp

Fortegnstesten Eksempel: Cornflakes Data: n fortegn 13 salgsdifferanser Nullhypotese H0: Hyllehøyde spiller ingen rolle Alternativ H1: Hyllehøyde selger mer Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # + eller - > Min(# +, # -) T = antall minuser = 3 (Forkast H0 når T er liten nok) Kritisk verdi c c fra tabell 3b 1 –2a = 0,9; c = 4 Konklusjon: Forkast H0: T<c H0 forkastes: T = 3 < c = 4 10.11.2018 MET 8006 - Fred Wenstøp

Wilcoxons tegnrangtest Idegrunnlag og eksempel Er datagrunnlaget målinger, kaster fortegnstesten bort mye informasjon La oss i stedet for fortegnene bruke rangene Da forlater vi binomialfordelingen Men prinsippet blir det samme T- = 2+3,5 = 5,5 T+ = 49,5 10.11.2018 MET 8006 - Fred Wenstøp

Wilcoxons tegnrangtest Eksempel: slankekur Data: n differanser 10 vektforbedringer (før - etter) Nullhypotese H0: = 0 (kuren virker ikke) Alternativ H1: > 0 (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: T+ eller T- Min(T+, T-) T - = 5,5 (Statark eller SPSS) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 8b, Statark SPSS c = 11 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T - = 5,5 < c = 11 10.11.2018 MET 8006 - Fred Wenstøp

Mann-Whitneytesten Idegrunnlag Datagrunnlaget er to uavhengige stikkprøver n1 og n2 observasjoner Dataene må kunne sammenlignes Som oftest målinger H0 stikkprøvene trukket fra samme populasjon dvs at populasjonsmedianene er like Testobservatorene MW1 og MW2 Antall ganger verdier i den første stikkprøven er større enn i den andre, og omvendt. I alt n1 ´ n2 sammenligninger Hvis H0 er riktig, venter vi omtrent n1 ´ n2 hver vei 10.11.2018 MET 8006 - Fred Wenstøp

Mann-Whitneytesten Eksempel: slankekur Data: n1 og n2 målinger 10 vekter før og 10 vekter etter Nullhypotese H0: (kuren virker ikke) Alternativ H1: (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: MW1 eller MW2 Min(MW1 ; MW2) MW2 = 42,5 (Statark eller SPSS) (Forkast H0 når MW2 er liten nok) c eller p-verdi: c: tab. 4b, Statark SPSS c = 28 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 beholdes: MW2 = 42,5 > c = 28 10.11.2018 MET 8006 - Fred Wenstøp