MET 2211 Statistikk og dataanalyse

Slides:



Advertisements
Liknende presentasjoner
Øvelse i caseløsning Fred Wenstøp, BI
Advertisements

MET 2211 Statistikk og dataanalyse
Hva trenger jeg av data, og hvordan skal jeg innhente disse?
Kapittel 10 Inferens om gjennomsnitt AAKRE-V SPSS v 10.0 MET 8006 STATISTIKK OG DATAANLYSE Kapittel 10 Inferens om gjennomsnitt Pål Aakre, BI Oslo.
SPSS v Kapittel 8 AAKRE/MET Parvise sammenligninger Cornflakes-eksempelet fra læreboken tab Vi legger inn dataene i Dataeditoren, som.
STATISTISK GENERALISERING
Corporate Finance Planlegging og kontroll. Investeringsprosessen Vi har hittil bare behandlet en snever del av investeringsprosessen, kun regneteknikker.
Fred Wenstøp: Statistikk og dataanalyse kapittel 1-9 Prøve-eksamen
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse Forelesning Kapittel 14: Variansanalyse.
Simpel regresjon Plott av variablene Y mot X
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Bærekraftig utvikling - forskerspiren
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Hypotesetesting, og kontinuerlige stokastiske variable
Siste forelesning er i morgen!
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Multiplikasjon - Leksjon 2: Hoderegningsstrategier store multiplikasjonsstykker Lekse til tirsdag.
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Ny kurve for symfyse-fundus mål
Statistikk 2 Sentral- og spredningsmål
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
MET 2211 Statistikk og dataanalyse
Hypotesetesting: Prinsipper
Kapittel 8: Ikke-parametriske tester
MET 8006 Statistikk Forelesning nr. 1 Kapittel 1: Oversikt
Figur 25.1 Sammenheng mellom inntekt i millioner NOK (y) og antall års utdanning (x) utover grunnskolen. I denne populasjonen er ß0 = 0.4 og ß1 =
Kapittel 14: Multippel regresjon
MET 2211 Statistikk og dataanalyse
Forelesning nr. 2 Kapittel 3: Å generalisere fra en stikkprøve
Repetisjon, del I Metode
MET 2211 Statistikk og dataanalyse
Kapittel 7: Hypoteseprøving
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
SIV : Kategoriske variabler og normaltilnærmelsen
MET 2211 Statistikk og dataanalyse
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
Tester med SPSS prosedyrer og utskrifter
MET 8006 Statistikk Kapittel 13: Regresjon.
MET 2211 Statistikk og dataanalyse
Vinmonopolet Case med vektlegging 01/01/2019 Fred Wenstøp.
MET 8006 Statistikk Kapittel 13: Regresjon.
MET 2211 Statistikk og dataanalyse
Kapittel 11 Kategoriske variabler og normaltilnærmelsen
Forelesning nr. 5 Kapittel 4: Statistisk metode
To relaterte stikkprøver
SIV : Metodevalg Stokastiske variabler
MET 2211 Statistikk og dataanalyse
Relaterte stikkprøver Uavhengige stikkprøver
SIV : Kapittel 9 Normalfordelingen 17/01/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
SIV : t-testen for to stikkprøver
MET 2211 Statistikk og dataanalyse
SIV : Variansanalyse Kapittel 14 17/02/2019 Fred Wenstøp.
SIV : Kapittel 4 Statistisk metode 18/02/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
Å beskrive og generalisere fra en stikkprøve
SIV : Kapittel 7 Hypoteseprøving 22/02/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
Kapittel 10 Inferens om gjennomsnitt
Eine og Andri på viktig oppdrag
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

MET 2211 Statistikk og dataanalyse Forelesning 23.09.2003 Kapittel 8: Ikke-parametriske tester

Hypoteseprøving i et nøtteskall Studer testobservatoren T Reflekter over hva det innebærer om T har meget høy eller meget lav verdi Ved ensidig test, må du fokusere på det som er aktuelt. Det er som regel greiest å definere T slik at du ser etter signifikant lave verdier To ekvivalente fremgangsmåter: Finn kritisk verdi og forkast H0 hvis testobservator har en mer ekstrem verdi Beregn p-verdien og forkast H0 hvis den er mindre enn det valgte signifikansnivået Ensidig test: signifikansnivå kalles a. p-verdi = halesannsynligheten fra og med observasjonen Tosidig test: signifikansnivå kalles 2a. p-verdi = 2´halesannsynligheten fra og med observasjonen 01.01.2019 MET 2211 - Fred Wenstøp

p-verdi og kritisk verdi p-verdi (areal) T Kritisk verdi for T: c = 3 Hvis p-verdi < a, må også T være mer ekstrem enn c 01.01.2019 MET 2211 - Fred Wenstøp

Binomisk test Eksempel: tekopper Data: n Ja/Nei-er 12 tekopper Nullhypotese H0: p = p0 P(bomme) = p = 0,5. Hun gjetter. Alternativ H1: p < ¹ > p0 p < 0,5 Hun kjenner forskjell Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: #JA eller #NEI Min(#JA, #NEI) T = antall bom = 2 (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(12;0,5;0,05)=3 =BINOMDIST(2;12;0,5;1)=0,019 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 2 < c = 3; eller p-verdi = 0,019 < sig.nivå = 0,05 01.01.2019 MET 2211 - Fred Wenstøp

Mediantesten Idegrunnlag Dataene er målinger Nullhypotesen er at populasjonsmedianen er lik et bestemt tall Ideen er at Hvis nullhypotesen er riktig, venter vi at halvparten av observasjonene faller på hver side av Da er vi med andre ord tilbake til et spesialtilfelle av den binomiske test, der p0 = ½ 01.01.2019 MET 2211 - Fred Wenstøp

Mediantesten Guttepulser H03 C =56 01.01.2019 MET 2211 - Fred Wenstøp

Mediantesten Guttepulser (data h03) n målinger 131 guttepulser Nullhypotese H0: = 70,5 (landsmedianen) Alternativ H1: < 70,5 (de er sprekere enn vanlig) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # < eller # > Min(# <, # >) T = antall over = 39 (bruk COUNTIF) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 3b, Statark SPSS, Statark =CRITBINOM(131;0,5;0,05)= 56 =BINOMDIST(39;131;0,5;1)=0,00 Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T = 39 < c = 56; eller p-verdi = 0 < sig.nivå = 0,05 01.01.2019 MET 2211 - Fred Wenstøp

Hypotesetesting og konfidensintervall n = 131 observasjoner * ** *** ****** * ** | *** * * ** * * 70,5 T = 39 observasjoner (funnet med countif) 68 ] Høyregrenseintervall x(56) = 68 H0 Enten : forkast H0 hvis det er færre enn 56 observasjoner til høyre for 70,5. Da må konfidensintervallet bomme. SPSS Eller: forkast H0 hvis x(56) ligger til venstre for 70,5. Da bommer konfidensintervallet. Statark 01.01.2019 MET 2211 - Fred Wenstøp

Fortegnstesten Idegrunnlag Eksempel: datafil Cornflakes Dataene kommer som regel fra relaterte stikkprøver De er opplysning om hvorvidt hvert enkelt observasjonsobjekt har forbedret seg eller blitt verre n plusser og minuser (nuller telles som en halv hver vei) Nullhypotesen er at medianforbedringen er null Da venter vi omtrent like mange mange plusser som minuser i observasjonene Vi er igjen tilbake til et spesialtilfelle av den binomske test med p = ½ 01.01.2019 MET 2211 - Fred Wenstøp

Fortegnstesten Eksempel: Cornflakes Data: n fortegn 13 salgsdifferanser Nullhypotese H0: Hyllehøyde spiller ingen rolle Alternativ H1: Hyllehøyde selger mer Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: # + eller - > Min(# +, # -) T = antall minuser = 3 (Forkast H0 når T er liten nok) Kritisk verdi c c fra tabell 3b 1 –2a = 0,9; c = 4 Konklusjon: Forkast H0: T<c H0 forkastes: T = 3 < c = 4 01.01.2019 MET 2211 - Fred Wenstøp

Wilcoxons tegnrangtest Idegrunnlag og eksempel Er datagrunnlaget målinger, kaster fortegnstesten bort mye informasjon La oss i stedet for fortegnene bruke rangene Da forlater vi binomialfordelingen Men prinsippet blir det samme T- = 2+3,5 = 5,5 T+ = 49,5 01.01.2019 MET 2211 - Fred Wenstøp

Wilcoxons tegnrangtest Eksempel: slankekur Data: n differanser 10 vektforbedringer (før - etter) Nullhypotese H0: = 0 (kuren virker ikke) Alternativ H1: > 0 (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: T+ eller T- Min(T+, T-) T - = 5,5 (Statark eller SPSS) (Forkast H0 når T er liten nok) c eller p-verdi: c: tab. 8b, Statark SPSS c = 11 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 forkastes: T - = 5,5 < c = 11 01.01.2019 MET 2211 - Fred Wenstøp

Mann-Whitneytesten Idegrunnlag Datagrunnlaget er to uavhengige stikkprøver n1 og n2 observasjoner Dataene må kunne sammenlignes Som oftest målinger H0 stikkprøvene trukket fra samme populasjon dvs at populasjonsmedianene er like Testobservatorene MW1 og MW2 Antall ganger verdier i den første stikkprøven er større enn i den andre, og omvendt. I alt n1 ´ n2 sammenligninger Hvis H0 er riktig, venter vi omtrent n1 ´ n2 hver vei 01.01.2019 MET 2211 - Fred Wenstøp

Mann-Whitneytesten Eksempel: slankekur Data: n1 og n2 målinger 10 vekter før og 10 vekter etter Nullhypotese H0: (kuren virker ikke) Alternativ H1: (man blir slankere) Signifikansnivå: a , 2a, a a = 5 % (ensidig test) Testobservator T: MW1 eller MW2 Min(MW1 ; MW2) MW2 = 42,5 (Statark eller SPSS) (Forkast H0 når MW2 er liten nok) c eller p-verdi: c: tab. 4b, Statark SPSS c = 28 p-verdien finnes kun med SPSS Konklusjon: Forkast H0: T<c, p-verdi < sig.nivå H0 beholdes: MW2 = 42,5 > c = 28 01.01.2019 MET 2211 - Fred Wenstøp