Siste forelesning er i morgen!

Slides:



Advertisements
Liknende presentasjoner
1 Sannsynlighetsregning Gjenfinningssystemer og verktøy II Jon Anjer.
Advertisements

Statistikk på 50 5 minutter
Sammenheng mellom flere variabler – Bivariat Analyse
Gjenfinningssystemer og verktøy II
 Bodil og Fin Ask Bearbeiding av innsamlet informasjon Bodil Ask Delvis basert på Patel & Davidson: Forskningsmetodikkens grunnlag.
Hva trenger jeg av data, og hvordan skal jeg innhente disse?
Enhalet og tohalet hypotesetest
Vurdering av statistiske analysemetoder brukt i Læringslabens undersøkelser i videregående skole i Rogaland.
ART: Dokumentasjon av behandlingseffekt
STATISTISK GENERALISERING
Statistisk metode & dokumentasjon av legemidlers effekt
Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.
Kapittel 14 Simulering.
BI 3010H05 Populasjonsgenetikk Halliburton Kap 1-3
Transformasjoner Men hva hvis relasjonen er kurvelinjær?
Mer grunnleggende matte: Forberedelse til logistisk regresjon
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
Analyse og tolkning av datamaterialet
Kap 13 Sammenligning av to grupper
Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
© Synovate Gjennomført av Synovate 21.august 2008 Catibus uke 33 Norsk Fysioterapeutforbund.
Kontrollregler Z- tabell Kontrollregler Tillatt totalfeil
Statistikk på 20 2 timer PSY-1002
Anvendt statistisk dataanalyse i samfunnsvitenskap
Bærekraftig utvikling - forskerspiren
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Diskrete stokastiske variable
Befolkningsundersøkelse juni 2014 For Skatteetaten.
Brukerundersøkelse gjennomført for Bergen kommune Foresattes tilfredshet med kommunens barnehager © TNS Gallup – Politikk & samfunn Avdelingsleder.
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral
Presentasjon av data: deskriptiv statistikk
Hypotesetesting, og kontinuerlige stokastiske variable
Mål for sentraltendens:
Usikkerheter og sannsynligheter Petter Mostad
Randomiserte kontrollerte studier
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
 Vi ønsker å tilpasse en rett linje gjennom dataskyen  Denne linjen skal ha den beste tilpasningen (minst feil) til data.
 Begreper  ANOVAAnalysis of Variance  Sum of Squares (Sammenlign med formelen for varians) Sir Ronald Aylmer Fisher
M1 årskurs HVE 7. september 2009
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Prosjekt:Elektronikkbransjen – Julegaver 2015 Prosjektleder: Morten Island Rapport av markedsundersøkelse.
3.14 X AXIS 6.65 BASE MARGIN 5.95 TOP MARGIN 4.52 CHART TOP LEFT MARGIN RIGHT MARGIN Tracking av digitalradio-andel i Norge © TNS Tracking.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Holdninger til konkurranseutsetting av velferdstjenester Befolkningsundersøkelse gjennomført i juni 2017 på oppdrag for NHO.
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
MET 2211 Statistikk og dataanalyse
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø H-2006
Kapittel 8: Ikke-parametriske tester
MET 2211 Statistikk og dataanalyse
Repetisjon, del I Metode
Kapittel 7: Hypoteseprøving
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø V-2010
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
SIV : Kategoriske variabler og normaltilnærmelsen
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Håvard Hansen Doktorgradsstipendiat Institutt for markedsføring
MET 2211 Statistikk og dataanalyse
Kapittel 11 Kategoriske variabler og normaltilnærmelsen
SIV : Metodevalg Stokastiske variabler
Figur 17.1 Histogram for alle DNB-kundene i undersøkelsen.
Oppsummering fra forrige gang
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

Siste forelesning er i morgen! Oppsummeringsforelesning den 5.mai flyttes til fredag 29.april kl. 15.15-17.00 Holdes i dette auditoriet

Slutningsstatistikk PSY 1010

Utvalg og populasjon Populasjon: alle enhetene i universet vi definerer, f eks: - Alle over 18 år i Norge (3,5 mill) Utvalg: avgrenset del av populasjonen - 200 personer over 18 år Populajson Utvalg

Eksempel: IQ gjennomsnittsskårer i populasjon og utvalg I populasjonen er og s = 15 Du trekker tre utvalg á 25 tilfeldige personer fra denne populasjonen og beregner : Utvalg 1: 103 Utvalg 2 101 Utvalg 3 98 Utvalgsfeil (tilfeldigheter) 103-100 = 3 101-100 = 1 98-100 = -2

Utvalgsfeil (sampling error) Utvalgets gjennomsnittsverdi (evt. prosentverdi) vil sannsynligvis avvike fra den ”sanne” verdien i populasjonen Vi må derfor regne med at en viss usikkerhet i de verdiene vi har regnet oss fram til basert på utvalget Vi må ta hensyn til denne feilmarginen hvis vi vil slutte noe om populasjonen ut i fra utvalget

Utvalgsfordeling og standardfeil Utvalgsfordeling (Sampling distribution): fordeling over gjennomsnittsnittsverdier til et uendelig antall utvalg trukket fra en populasjon Standardavviket i en utvalgsfordeling kalles standardfeil (standard error) Gir et mål på størrelsen på statistisk usikkerhet Standardfeilen (SX) er en funksjon av to ting: S : Hvor stort standardavviket i populasjonen er N: Størrelsen på utvalget

Normalfordelig og utvalgsfeil 50 % av utvalgenes gjennomsnittsverdier ligger under populasjonsgjennomsnittet 50 % ligger over 13,6% 34,1% 2,2 % 0,1 % -3 sX -2 sX -1 sX X +1 sX +2 sX +3 sX

Standardfeil ved ulike utvalgsstørrelser Utgangspunktet for eksempelet er at alle utvalg er trukket fra en populasjon med et standardavvik (s) på 15 N = 9 N = 25 N = 100 Altså: Størrelsen på utvalget påvirker hvor størrelsen på standardfeilen

Utvalgsfordeling med ulike utvalgsstørrelser Alle utvalg er trukket fra samme populasjon Uendelig antall utvalg med: En person skårer 115 poeng på en IQ test med m= 100 og sd = 15. Målt i prosent, hvor mange skårer laver enn personene i populasjonen? Hvor mange skårer bedre? 85 90 95 100 105 110 115

IQ og morsmelk Populasjonsgjennomsittet på IQ for 12 åringer er 100 og standardavviket er 15 En forsker har en hypotese om at morsmelk bidrar til høyere IQ Et 25 utvalg på 12-åringer som er blitt ammet fram til 2 års alder har i snitt en IQ skåre på 103 Hvor sannsynlig er det at disse har fått = 103 ved en ren tilfeldighet?

Hypotesetesting Nullhypotese (H0): Det er ingen forskjell i IQ i populasjonen mellom barns om er ammet fram til 2 års alder og de som ikke er det Dvs: forskjell skyldes utvalgsfeil / tilfeldigheter Forskningshypotese (H1): Det er en forskjell i IQ i populasjonen mellom barns som er ammet fram til 2 års-alder og andre barn Hvor sannsynlig er det at en forskjell på 3 poeng eller mer skyldes en tilfeldighet? Denne benevnes som p-verdi

Normalfordelig og utvalgsfeil Utvalgets = 103 13,6% 34,1% 2,2 % 0,1 % -3 sX -2 sX -1 sX X +1 sX +2 sX +3 sX 91 94 97 100 103 106 109

Signifikanstesting Hvor sannsynlig det er at resultatet skyldes en tilfeldighet ved utvalget (utvalgsfeil)? I vårt eksempel: en på 103 eller høyere forekommer i 15,9 % av tilfellene vi trekker utvalg med N=25 fra populasjonen (p= 0.159) Grense for å forkaste nullhypotesen kalles signifikansnivå () : Vanlig grense: mindre enn 5 % sannsynlighet for at resultatet skyldes en tilfeldighet ( = 0.05) Kan også være strengere f eks mindre enn 1 % ( = 0.01) Hvis sjansen for at resultatet skyldes en tilfeldighet er større en signifikansnivået, beholdes nullhypotesen (H0)

Type I og type II feil Aldri 100% sikre på at vi gjør riktig beslutning om å beholde eller forkaste nullhypotesen: I “virkeligheten”: Funnet skyldes en tilfeldighet Funnet skyldes ikke en tilfeldighet, er reelt Behold nullhypotesen Riktig beslutning Type II-feil Forkast nullhypotesen Type I-feil (α)

Enhalet og tohalet hypotesetest En enhalet hypotesetest er retningsbestemt H1 : Barn som ammes fram til 2 år har høyere IQ enn andre En tohalet hypotesetest er ikke retningsbestemt H1 : Barn som ammes fram til 2 år har forskjellig IQ enn andre (dette betyr at de kan har lavere IQ eller høyere IQ enn populasjonen)

En-halet og to-halet test 1.65 1.96 -1.96

Hypotesetesting II Eksempel: Vi sammenligner et utvalg menn (N = 36) med et utvalg kvinner (n = 36) på en test for sosial intelligens. Vi får følgende Nullhypotese (H0): Det er ingen forskjell mellom menn og kvinner I populasjonen (forskjellen skyldes utvalgsfeil) Forskningshypotese (H1): Det er en forskjell i sosial IQ mellom menn og kvinner i populasjonen Hvor sannsynlig er det at forskjellen på 5 poeng skyldes en tilfeldighet? Denne benevnes som p-verdi

Parametriske hypotesetester Eksemplene vi har gjennomgått nå er såkalt parametrisk statistikk. Dette forutsetter at: Utvalget er tilfeldig trukket fra populasjonen Utvalgsfordelingen er normalfordelt rundt populasjonsgjennomsnittet Et tilleggskriterium (kan dog korrigeres for): Hvis to eller flere utvalg sammenlignes, skal spredingen innen utvalgene være like

Eksempler på parametriske tester Z-test er et utvalgs gjennomsnittsverdi forskjellig fra populasjonsgjennomsnittet? t-test Er det forskjell i gjennomsnittsverdi mellom to utvalg? ANOVA (analysis og varians) Forskjell i gj.snittsverdi mellom tre eller flere utvalg? To-veis ANOVA

Ikke-parametriske tester Benyttes ofte når vi har variabler som er målt på nominal eller ordinalnivå Eller når forutsetningene for en parametrisk test ikke er oppfylt Benytter ellers samme logikk som tidligere, dvs. tar hensyn til utvalgsfeil/tilfeldighetenes spill og vurderer resultatene opp i mot dette

Eksempel på ikke-parametrisk test Er det lettere for en person med lys hudfarge å bli frikjent enn en med mørk hudfarge for en voldsforbrytelse? Begge variablene (hudfarge og frikjent/dømt) er variabler som vi ikke kan regne gjennomsnitt på Frikjent Dømt Lys hudfarge 7 3 Mørk hudfarge 2 8 I dette tilfellet benyttes en kji-kvadrat test (2) for å avgjøre om forskjellen er tilfeldig eller ikke

Signifikansnivå og praktisk betydning Et signifikant resultat er ikke nødvendigvis av stor praktisk betydning Dette er først og fremst fordi signifikanstesting er sterkt påvirket av utvalgets/utvalgenes størrelse Store utvalg = lettere å få signifikant resultat (forkaste H0) Et alternativ er å inkludere mål på effekt isteden, f eks hvor stor andel kvinner har høyere sosial IQ enn menn Eller hvor mange standardavvik skårer kvinner over menn