SIV : Kategoriske variabler og normaltilnærmelsen

Slides:



Advertisements
Liknende presentasjoner
Enhalet og tohalet hypotesetest
Advertisements

Kapittel 10 Inferens om gjennomsnitt AAKRE-V SPSS v 10.0 MET 8006 STATISTIKK OG DATAANLYSE Kapittel 10 Inferens om gjennomsnitt Pål Aakre, BI Oslo.
STATISTISK GENERALISERING
MET 2211 Statistikk og dataanalyse
BI 3010H05 Populasjonsgenetikk Halliburton Kap 1-3
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Kap 13 Sammenligning av to grupper
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Utdypende om design & statistikk Frode Svartdal UiTø April 2012.
Utdypende info, design & statistikk
ANOVA: Litt om design & statistikk
Forskningsrapporten Frode Svartdal UiT.
Statistikk på 20 2 timer PSY-1002
Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral
Usikkerheter og sannsynligheter Petter Mostad
Siste forelesning er i morgen!
Regresjon Petter Mostad
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Operasjonsanalytiske emner Prognosemodeller basert på Tidsserieanalyse Rasmus RasmussenBØK710 OPERASJONSANALYTISKE EMNER1 Del 23Forecasting 1 - Mønster.
M1 årskurs HVE 7. september 2009
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Undersøkelse om bruk av proteinshaker og proteinpulver blant barn og unge Gjennomført november 2015.
Validitet og reliabilitet: Fra teori –> via operasjonalisering –> til empiri Et teoretisk utsagn er en framstilling av sammenhengen mellom abstrakte begrep.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Forventning, varians og standardavvik Tilnærming.
Holdninger til konkurranseutsetting av velferdstjenester Befolkningsundersøkelse gjennomført i juni 2017 på oppdrag for NHO.
MAT0100V Sannsynlighetsregning og kombinatorikk
Bedriftsundersøkelsen 2017
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
MET 2211 Statistikk og dataanalyse
Kapittel 8: Ikke-parametriske tester
MET 8006 Statistikk Forelesning nr. 1 Kapittel 1: Oversikt
Kapittel 14: Multippel regresjon
MET 2211 Statistikk og dataanalyse
Forelesning nr. 2 Kapittel 3: Å generalisere fra en stikkprøve
Repetisjon, del I Metode
MET 2211 Statistikk og dataanalyse
Kapittel 7: Hypoteseprøving
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
Tester med SPSS prosedyrer og utskrifter
MET 8006 Statistikk Kapittel 13: Regresjon.
MET 2211 Statistikk og dataanalyse
MET 8006 Statistikk Kapittel 13: Regresjon.
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Kapittel 11 Kategoriske variabler og normaltilnærmelsen
Forelesning nr. 5 Kapittel 4: Statistisk metode
To relaterte stikkprøver
SIV : Metodevalg Stokastiske variabler
MET 2211 Statistikk og dataanalyse
SIV : Regresjon Kapittel 13 17/01/2019 Fred Wenstøp.
Relaterte stikkprøver Uavhengige stikkprøver
SIV : Kapittel 9 Normalfordelingen 17/01/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
SIV : t-testen for to stikkprøver
SIV : Kapittel 4 Statistisk metode 18/02/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
Å beskrive og generalisere fra en stikkprøve
MET 2211 Statistikk og dataanalyse
Kapittel 12: Korrelasjon
Kapittel 10 Inferens om gjennomsnitt
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

SIV 1102-4: Kategoriske variabler og normaltilnærmelsen Kapittel 11 31/12/2018 Fred Wenstøp

Oppgaver Oppgave 10-2 Oppgave 10-3 Oppgaven oppgir ikke rådata, men kun gjennomsnitt og varians for to stikkprøver. Hypoteseprøvingen foregår med Welsh formler på side 224 i læreboken. Siden variansene er relativt like, kan vi regne med noe rundt 80 frihetsgrader, men dette må dessverre regnes ut. Man kan bruke Statark til beregningene ved å åpne vindu II-8, og så skrive inn gjennomsnittene og variansene og antallene direkte i rutene og derved overskrive de formlne som allerede er der. Oppgave 10-3 Her gjelder det samme som ovenfor, men det er også spørsmål som gjelder kun én stikkprøve. Da brukes formlene på s. 235 og Statarks vindu II-6. 31/12/2018 Fred Wenstøp

Én Andel Vi gjør n eksperimenter og observerer ettall og nuller Vi ønsker å estimere p = P(1)=andelen av ettall i populasjonen a er summen av ettallene, a/n er gjennomsnittet pga sentralgrenseteoremet er a/n tilnærmet normalfordelt derfor er z standard normalfordelt og et konfidensintervall for p: 31/12/2018 Fred Wenstøp

Data fra siviløkonomstudiet Høsten 2000 Fil: Puls2000 (nedlastbar) Av 91 jenter var det 21 som røykte Av 118 gutter var det 21 som røykte Lag et 95% konfidensintervall for hver av populasjonene Test om p = 0.32 Dette er gjennomsnittet i den norske befolkningen 31/12/2018 Fred Wenstøp

Konfidensintervallets vidde Politiske meningsmålinger 1200 mennesker har blitt spurt De estimerte andeler for partiene er vist, sammen med de resulterende 95% konfidensintervall 31/12/2018 Fred Wenstøp

Stikkprøvens størrelse Du ønsker en vidde på maksimalt 2L = 0,02 og en sikkerhet på 1-2a = 95% Hvor mange må du intervjue Det verste er hvis p = 0,5, da er det størst usikkerhet 31/12/2018 Fred Wenstøp

To andeler Data a1 og n1 fra populasjon 1 a2 og n2 fra populasjon 2 21 jenter røyker ut av 91 a2 og n2 fra populasjon 2 21 av 118 gutter røyker Test om røykeandelene i populasjonene er like! Resonnementet er helt parallelt med det for to gjennomsnitt, og vi får de enkle formlene på side 253-254 i læreboka Med dem kan vi lage konfidensintervall for differansen mellom populasjonsandlene og teste på likhet mellom dem 31/12/2018 Fred Wenstøp

Kontingenstabeller Metoden med to andeler sammenligner to variabler der hver av dem kan ha kun to verdier slik som Røyker/Røyker ikke og gutt/jente, etc. Kontigenstabeller brukes når en eller begge variablene har mer enn to verdier f.eks. politisk parti og kjønn Kontigenstabeller er koblet til kji-kvadrattesten Nullhypotesen er at det ikke er sammenheng mellom verdiene til de to variablene det er ingen forskjell på hva jenter og gutter stemmer på 31/12/2018 Fred Wenstøp

Kji-kvadrattesten 100 jenter og 200 gutter har blitt spurt om hvilket part de stemmer på Hvis det ikke er forskjell på gutter og jenter, forventet vi at 2/3 av de 60 stemmene som arbeiderpartiet fikk ble gitt av gutte, etc. Kan avvikene skyldes tilfeldigheter? Det svarer kji-kvadratobservatoren på 31/12/2018 Fred Wenstøp