Kapittel 8: Ikke-parametriske tester

Slides:

Advertisements

Liknende presentasjoner

Øvelse i caseløsning Fred Wenstøp, BI

Advertisements

Hva trenger jeg av data, og hvordan skal jeg innhente disse?

Enhalet og tohalet hypotesetest

Kapittel 10 Inferens om gjennomsnitt AAKRE-V SPSS v 10.0 MET 8006 STATISTIKK OG DATAANLYSE Kapittel 10 Inferens om gjennomsnitt Pål Aakre, BI Oslo.

SPSS v Kapittel 8 AAKRE/MET Parvise sammenligninger Cornflakes-eksempelet fra læreboken tab Vi legger inn dataene i Dataeditoren, som.

STATISTISK GENERALISERING

MET 2211 Statistikk og dataanalyse

Eksempel AOA (Activity On Arc)

Corporate Finance Planlegging og kontroll. Investeringsprosessen Vi har hittil bare behandlet en snever del av investeringsprosessen, kun regneteknikker.

Fred Wenstøp: Statistikk og dataanalyse kapittel 1-9 Prøve-eksamen

Fred Wenstøp: Statistikk og dataanalyse Selvtest Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!

Fred Wenstøp: Statistikk og dataanalyse Selvtest

Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!

MET 2211 Statistikk og dataanalyse

MET 2211 Statistikk og dataanalyse

MET 2211 Statistikk og dataanalyse Forelesning Kapittel 14: Variansanalyse.

Simpel regresjon Plott av variablene Y mot X

Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)

Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.

Bærekraftig utvikling - forskerspiren

Diskrete stokastiske variable

Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.

Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral

Hypotesetesting, og kontinuerlige stokastiske variable

Siste forelesning er i morgen!

Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral

Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral

Kræsjkurs Del Ii Hypotesetesting

Operasjonsanalytiske emner Prognosemodeller basert på Tidsserieanalyse Rasmus RasmussenBØK710 OPERASJONSANALYTISKE EMNER1 Del 23Forecasting 1 - Mønster.

Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.

Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.

MAT0100V Sannsynlighetsregning og kombinatorikk

Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.

MET 2211 Statistikk og dataanalyse

MET 8006 Statistikk Forelesning nr. 1 Kapittel 1: Oversikt

MET 2211 Statistikk og dataanalyse

Forelesning nr. 2 Kapittel 3: Å generalisere fra en stikkprøve

Repetisjon, del I Metode

MET 2211 Statistikk og dataanalyse

Kapittel 7: Hypoteseprøving

SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.

SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.

SIV : Kategoriske variabler og normaltilnærmelsen

MET 2211 Statistikk og dataanalyse

Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler

Tester med SPSS prosedyrer og utskrifter

MET 8006 Statistikk Kapittel 13: Regresjon.

MET 2211 Statistikk og dataanalyse

MET 8006 Statistikk Kapittel 13: Regresjon.

MET 2211 Statistikk og dataanalyse

MET 2211 Statistikk og dataanalyse

Kapittel 11 Kategoriske variabler og normaltilnærmelsen

To relaterte stikkprøver

SIV : Metodevalg Stokastiske variabler

MET 2211 Statistikk og dataanalyse

SIV : Regresjon Kapittel 13 17/01/2019 Fred Wenstøp.

Relaterte stikkprøver Uavhengige stikkprøver

MET 2211 Statistikk og dataanalyse

SIV : t-testen for to stikkprøver

MET 2211 Statistikk og dataanalyse

SIV : Variansanalyse Kapittel 14 17/02/2019 Fred Wenstøp.

SIV : Kapittel 4 Statistisk metode 18/02/2019 Fred Wenstøp.

MET 2211 Statistikk og dataanalyse

Å beskrive og generalisere fra en stikkprøve

SIV : Kapittel 7 Hypoteseprøving 22/02/2019 Fred Wenstøp.

MET 2211 Statistikk og dataanalyse

Kapittel 6: Sannsynlighetsfordelinger

Kapittel 12: Korrelasjon

Kapittel 10 Inferens om gjennomsnitt

I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.

Utskrift av presentasjonen:

Kapittel 8: Ikke-parametriske tester MET 8006 Statistikk Kapittel 8: Ikke-parametriske tester

Hypoteseprøving i et nøtteskall Studer testobservatoren T Reflekter over hva det innebærer om T har meget høy eller meget lav verdi Ved ensidig test, må du fokusere på det som er aktuelt. Det er som regel greiest å definere T slik at du ser etter signifikant lave verdier To ekvivalente fremgangsmåter: Finn kritisk verdi og forkast H0 hvis testobservator har en mer ekstrem verdi Beregn p-verdien og forkast H0 hvis den er mindre enn det valgte signifikansnivået Ensidig test: signifikansnivå kalles a. p-verdi = halesannsynligheten fra og med observasjonen Tosidig test: signifikansnivå kalles 2a. p-verdi = 2´halesannsynligheten fra og med observasjonen 10.11.2018 MET 8006 - Fred Wenstøp

p-verdi og kritisk verdi p-verdi (areal) T Kritisk verdi for T: c = 3 Hvis p-verdi < a, må også T være mer ekstrem enn c 10.11.2018 MET 8006 - Fred Wenstøp

Binomisk test Eksempel: tekopper Data: n Ja/Nei-er 12 tekopper Nullhypotese H0: p = p0 P(bomme) = p = 0,5. Hun gjetter. Alternativ H1: p < ¹ > p0 p < 0,5 Hun kjenner forskjell Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: #JA eller #NEI Min(#JA, #NEI) T = antall bom = 2 (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(12;0,5;0,05)=3 =BINOMDIST(2;12;0,5;1)=0,019 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 2 < c = 3; eller p-verdi = 0,019 < sig.nivå = 0,05 10.11.2018 MET 8006 - Fred Wenstøp

Mediantesten Idegrunnlag Dataene er målinger Nullhypotesen er at populasjonsmedianen er lik et bestemt tall Ideen er at Hvis nullhypotesen er riktig, venter vi at halvparten av observasjonene faller på hver side av Da er vi med andre ord tilbake til et spesialtilfelle av den binomiske test, der p0 = ½ 10.11.2018 MET 8006 - Fred Wenstøp

Mediantesten Guttepulser H04 C =33 T = 31 10.11.2018 MET 8006 - Fred Wenstøp

Mediantesten Guttepulser (data h03) n målinger 80 guttepulser Nullhypotese H0: = 70,5 (landsmedianen) Alternativ H1: < 70,5 (de er sprekere enn vanlig) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # < eller # > Min(# <, # >) T = antall over = 31 (bruk COUNTIF) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(80;0,5;0,05)= 33 =BINOMDIST(31;80;0,5;1)=0,028 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 31 < c = 33; eller p-verdi = 0,028 < sig.nivå = 0,05 10.11.2018 MET 8006 - Fred Wenstøp

Grafisk oppsummering n = 80 observasjoner H0 70,5 * ** *** ****** * ** | *** * * ** * * ] Høyregrenseintervall T = 31 observasjoner (funnet med countif) x(33) = 70 Enten : forkast H0 hvis det er færre enn 33 observasjoner til høyre for 70,5. Da må konfidensintervallet bomme. SPSS, Statark vi-7b Eller: forkast H0 hvis x(33) ligger til venstre for 70,5. Da bommer konfidensintervallet. Statark vi-4 10.11.2018 MET 8006 - Fred Wenstøp

Fortegnstesten Idegrunnlag Eksempel: datafil Cornflakes Dataene kommer som regel fra relaterte stikkprøver De er opplysning om hvorvidt hvert enkelt observasjonsobjekt har forbedret seg eller blitt verre n plusser og minuser (nuller telles som en halv hver vei) Nullhypotesen er at medianforbedringen er null Da venter vi omtrent like mange mange plusser som minuser i observasjonene Vi er igjen tilbake til et spesialtilfelle av den binomske test med p = ½ 10.11.2018 MET 8006 - Fred Wenstøp

Fortegnstesten Eksempel: Cornflakes Data: n fortegn 13 salgsdifferanser Nullhypotese H0: Hyllehøyde spiller ingen rolle Alternativ H1: Hyllehøyde selger mer Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # + eller - > Min(# +, # -) T = antall minuser = 3 (Forkast H0 når T er liten nok) Kritisk verdi c c fra tabell 3b 1 –2a = 0,9; c = 4 Konklusjon: Forkast H0: T<c H0 forkastes: T = 3 < c = 4 10.11.2018 MET 8006 - Fred Wenstøp

Wilcoxons tegnrangtest Idegrunnlag og eksempel Er datagrunnlaget målinger, kaster fortegnstesten bort mye informasjon La oss i stedet for fortegnene bruke rangene Da forlater vi binomialfordelingen Men prinsippet blir det samme T- = 2+3,5 = 5,5 T+ = 49,5 10.11.2018 MET 8006 - Fred Wenstøp

Wilcoxons tegnrangtest Eksempel: slankekur Data: n differanser 10 vektforbedringer (før - etter) Nullhypotese H0: = 0 (kuren virker ikke) Alternativ H1: > 0 (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: T+ eller T- Min(T+, T-) T - = 5,5 (Statark eller SPSS) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 8b, Statark SPSS c = 11 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T - = 5,5 < c = 11 10.11.2018 MET 8006 - Fred Wenstøp

Mann-Whitneytesten Idegrunnlag Datagrunnlaget er to uavhengige stikkprøver n1 og n2 observasjoner Dataene må kunne sammenlignes Som oftest målinger H0 stikkprøvene trukket fra samme populasjon dvs at populasjonsmedianene er like Testobservatorene MW1 og MW2 Antall ganger verdier i den første stikkprøven er større enn i den andre, og omvendt. I alt n1 ´ n2 sammenligninger Hvis H0 er riktig, venter vi omtrent n1 ´ n2 hver vei 10.11.2018 MET 8006 - Fred Wenstøp

Mann-Whitneytesten Eksempel: slankekur Data: n1 og n2 målinger 10 vekter før og 10 vekter etter Nullhypotese H0: (kuren virker ikke) Alternativ H1: (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: MW1 eller MW2 Min(MW1 ; MW2) MW2 = 42,5 (Statark eller SPSS) (Forkast H0 når MW2 er liten nok) c eller p-verdi: c: tab. 4b, Statark SPSS c = 28 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 beholdes: MW2 = 42,5 > c = 28 10.11.2018 MET 8006 - Fred Wenstøp