Hypotesetesting: Prinsipper

Slides:



Advertisements
Liknende presentasjoner
Eksperimentet Frode Svartdal UiTø © Frode Svartdal – H2005.
Advertisements

Forholdet mellom variabler: Kausalitet og korrelasjon
Statistikk på 50 5 minutter
Forskningsmetoder: Oppsummering og utdypning
Introduksjon Forskningsmetoder Frode Svartdal, UiTø H-2006
Enhalet og tohalet hypotesetest
ART: Dokumentasjon av behandlingseffekt
Grunnleggende spørsmål om naturfag
Forskningsmetoder: Oppsummering og utdypning
STATISTISK GENERALISERING
Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.
Kritisk gjennomgang av vitenskapelige studier.
Å overleve oppgaveskriving: Litteraturgjennomgang
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Frode Svartdal UiTø April 2009
Utdypende om design & statistikk Frode Svartdal UiTø April 2012.
Utdypende info, design & statistikk
ANOVA: Litt om design & statistikk
Design, evalueringsstudie 06/07
Forskningsrapporten Frode Svartdal UiT.
Randomisering av deltakere i eksperiment
Statistikk på 20 2 timer PSY-1002
Aggression Replacement Training
Fire problemer Operasjonaliseringsproblemet (måling/begrepsvaliditet)
Eksperimentell metode - I
Eksperimentelle design Ikke-eksperimentelle design
La oss begynne med begynnelsen (igjen)
Studentprosjekt Videreutdanningen Frode Svartdal UiT/Diakonhjemmet Høgskole H-2014.
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Meta-analyse Frode Svartdal UiTø Okt © Frode Svartdal.
Hypotesetesting, og kontinuerlige stokastiske variable
Siste forelesning er i morgen!
Randomiserte kontrollerte studier
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Trond Haukedal AS Hordaland Fylkeskommune - LO - NHO Læreplasskonferansen 2016 Bergen den 11.
Utvalg og datainnsamling For å gjennomføre en test av hypoteser i kvantitativ metode trenger vi et utvalg deltakere for å gjennomføre datainnsamling –
Veileder for gevinstrapportering
Oppgavestruktur <Fag> <Navn> Institutt for statsvitenskap
Kvantitativ metode med vekt på survey – del
Kognitiv psykologi Frode Svartdal UiT 2015.
Prosjekttittel Ditt navn | Lærerens navn | Skolen din
Er prosessen som fører til at individer eller grupper
Statistikk 2 Sentral- og spredningsmål
Forskningsprosjekt, tittel
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
Prosjektveileder Forklaringer og enkle hjelpemidler
Korrelasjonelle metoder
Frode Svartdal UiTø Okt. 09
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø H-2006
Hva er psykologi? Frode Svartdal
Fra idé til publikasjon
Gangen i en undersøkelse Prosjektplan og problemformulering
Fra idé til publikasjon
MET 2211 Statistikk og dataanalyse
Forskningsmetoder Validitet Frode Svartdal Universitetet i Tromsø
Psykologiske tester Frode Svartdal, UiTø 26/12/2018 FSv.
Repetisjon, del I Metode
1. Innledende påstander om organisasjoner
Forskningsmetoder Data: Måling og målefeil Frode Svartdal UiTø
Kapittel 7: Hypoteseprøving
Eksempler, sosialpsykologi
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø V-2010
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Håvard Hansen Doktorgradsstipendiat Institutt for markedsføring
Bikkjestykket barnehage Tidlig innsats og utfordrende atferd
Kapittel 6 Lønn og belønning
Oppsummering fra forrige gang
Utskrift av presentasjonen:

Hypotesetesting: Prinsipper Frode Svartdal UiTø Januar 2013 © Frode Svartdal 18.09.2018

Utgangspunkt En antakelse begrunnet i teori En vanlig oppfatning Alt dette er mat for hypotesetesting! Utgangspunkt En antakelse begrunnet i teori Dissonansteori: ”Hvis …, så ….” En vanlig oppfatning ”Belønning øker prestasjon” Noe vi tror er feil ”Læring kan bare skje hvis vi forstår læringsbetingelsene” Motstridende funn a) ”Forventning om belønning øker motivasjon” vs. b) ”Forventning om belønning reduserer motivasjon” 18.09.2018

Uinteressant! ”Alle” vet dette! Utgangspunkt II Uinteressant! ”Alle” vet dette! Hypotesen må ha interesse! ”Belønning øker motivasjon” ”Under visse betingelser vil belønning redusere motivasjon” Interessant! 18.09.2018

Hypotesetesting: Generelt Hvordan testes hypoteser? Formulere en testbar påstand (f.eks. en implikasjon fra en teori) Gjennomføre en relevant undersøkelse (eksperiment, observasjon, …) Avgjøre om resultatet støtter hypotesen Statistisk Innholdsmessig 18.09.2018

Eksempel: Dissonansteori (Festinger) Dissonans = ubehagelig aktivering som følge av konflikt Eksempel: Jeg røyker Dissonans Jeg vet at det er farlig å røyke 18.09.2018

Dissonansteori: Festinger A Lesson In Cognitive Dissonance 18.09.2018

Eksempel: Dissonansteori Festinger & Carlsmith, 1958 Dissonans-betingelse: (a) Du utfører kjedelig arbeid i en time (b) Du får lite betalt (c) Du sier at jobben var “ganske artig” (d) Din mening om jobben måles Ikke dissonans-betingelse: (b) Du får mye betalt Dissonans Hypotese? Ikke dissonans Hypotese? 18.09.2018

Hypotesetesting Design og prosedyre OK: Fp-er er tilfeldig fordelt i gruppene (dvs. variasjon mellom fp-er er ikke systematisk relatert til manipulasjonen) eksperimentsituasjonen er den samme for alle prosedyren er den samme for alle … 18.09.2018

Hypotesetesting: Statistisk Uavhengig variabel Avhengig variabel HØY-gruppe Høy betaling: FP mottar 100 kr Vurdering av oppgaven (-5 - +5): -0,1 LAV-gruppe Lav betaling: 10 kr 1,4 Randomisert 18.09.2018

Hypotesetesting: Statistisk Uavhengig variabel Avhengig variabel Eksperiment-gruppe Høy betaling Snittskåre: -0,1 Kontroll- gruppe Lav betaling Snittskåre: 1,4 R Tid  Ingen forskjell Ingen forskjell? 18.09.2018

Hypotesetesting: Statistisk Eksempel: Eksperiment med to grupper Nullhypotesen: ”Utvalgene kommer fra samme populasjon”. Vi sjekker: Hvor sannsynlig er det at den observerte forskjellen mellom utvalgene kan oppstå, gitt at utvalgene kommer fra samme populasjon? Forskningshypotesen: ”Utvalgene kommer ikke fra samme populasjon”. 18.09.2018

Hypotesetesting: Statistisk Hvis den observerte forskjellen er svært usannsynlig, forkaster vi 0-hypotesen Grense: 5 av 100 tilfeller (0,05) Avvisning av 0-hypotesen innebærer en indirekte aksept av forskningshypotesen Forskningshypotesen ”bevises” IKKE 18.09.2018

Hypotesetesting: Statistisk Statistisk konklusjons-validitet: Er konklusjonen vi trekker fra utvalget holdbar? Trusler: Lav power: Vi oppdager ikke en mulig effekt. Typisk årsak: for få deltakere Brudd på statistiske forutsetninger Fisking i data: Vi leter etter effekter Lite reliable mål Lite reliable prosedyrer 18.09.2018

Hypotesetesting: Statistisk Eksperimentgr. mean = -0,1 Kontrollgr. mean = 1,4 Hvordan kan man avgjøre om den observerte forskjellen, er så stor at vi må forkaste 0-hypotesen? Statistisk test som sammenligner to gruppegjennomsnitt – t-test: Hvor stor er variasjonen mellom gruppene (gruppeforskjell)? Hvor stor er variasjonen innen gruppene? Hvor mange deltakere har vi i hver gruppe? 18.09.2018

Hypotesetesting: Statistisk Populasjon Generali- sering Randomisert utvelgelse YTRE VALIDITET Eksp.gr. Utvalg Resultat Funn Kontr.gr. INDRE VALIDITET Randomisert fordeling 18.09.2018

Hypotesetesting: Innholdsmessig Er hypotesen rimelig? … Er operasjonaliseringene av variablene rimelige? ”Høy” = 100 kr ”Lav” = 10 kr Er oppgaven som blir utført faktisk kjedelig? Er undersøkelsen gjennomført på en betryggende måte (design)? Er det nok med bare 2 nivåer av UV (100 vs. 10)? Hva med en kontrollgruppe som ikke får betalt? Foreligger det trusler mot vår slutning om effekt (confounding variabler)? Viktig!! Har vi kontroll over relevante variabler? Er deltakere tilfeldig fordelt til grupper (randomisering)? Kritisk for eksperimenter!!! Finnes det alternative fortolkninger av funnet? ??? 18.09.2018

Hypotesetesting Mao: Selv om vi får støtte for vår hypotese statistisk, betyr ikke dette automatisk at hypotesen støttes teoretisk Statistisk hypotesetesting: Mekanisk prosess Teoretisk hypotesetesting: Kompleks slutning 18.09.2018

Dataanalyse Beskrive en variabel (et sett av skårer) Eksempel: Gjennomsnitt Beskrive relasjoner mellom to variabler Eksempel: Korrelasjon (r) Beskrive relasjoner mellom flere sett av skårer (konsistens) Cronbachs alfa Bestemme om to gruppegjennomsnitt er signifikant forskjellige Eksempel: T-test Bestemme om flere gruppegjennomsnitt er signifikant forskjellige Eksempel: Variansanalyse 18.09.2018

Hypotesetesting: p og effektstørrelse To viktige aspekter ved et funn: Signifikans: Hvor reliabelt er funnet? Hvis vi gjentar undersøkelsen, vil vi få samme utfall? Effektstørrelse: Hvor stor effekt snakker vi om? Er (et signifikant) utfall praktisk/teoretisk interessant? 18.09.2018

Hypotesetesting: p og effektstørrelse Signifikans Hvor reliabelt er funnet? Jo svakere et funn er, desto flere deltakere trengs for å påvise det som signifikant Ikke nødvendigvis noen styrke ved en undersøkelse at man har mange deltakere Aspirin  redusert risiko for hjerteinfarkt 10000 deltakere trengs for å påvise effekten Mørketid  vinterdepresjon 2-4000 deltakere 18.09.2018

Hypotesetesting: p og effektstørrelse Cohen: “The degree to which a phenomenon exists”. Hvor sterkt slår effekten ut? Hvor sterk er sammenhengen? Signifikans (p) sier ikke nødvendigvis så mye om styrke Samme effektstørrelse kan bety ulike ting i ulike kontekster: Redusert fart: Nesten null betydning for den enkelte; 15 menneskeliv spart i løpet av et år i Norge 18.09.2018

Hypotesetesting: Falsifikasjon To utfall mulig: Vi aksepterer 0-hypotesen (”gruppene kommer fra samme populasjon”)  forskningshypotesen forkastes Vi forkaster 0-hypotesen (”gruppene kommer ikke fra samme populasjon”)  forskningshypotesen støttes 18.09.2018

Hypotesetesting Wason (1977): Falsifiserende vs. bekreftende strategi i hypotesetesting Bekreftende evidens er forenlig med et stort antall hypoteser eller teorier Falsifiserende evidens vil utelukke i alle fall noen hypoteser Dvs.: Falsifiserende evidens er ofte mer informativ om verden enn bekreftende evidens 18.09.2018

Hypotesetesting Faktisk Vår beslutning Aktivering fører faktisk ikke til bedre læring Aktivering fører faktisk til bedre læring ”Aktivering fører til bedre læring” Type 1-feil Vi forkaster 0-hypotesen når vi egentlig skulle beholdt den OK ”Aktivering fører ikke til bedre læring” Type 2-feil Vi aksepterer 0-hypotesen når vi egentlig skulle forkastet den 18.09.2018

Hypotesetesting Type 1-feil Vi har vært for ”snille” – akseptert noe vi egentlig skulle forkastet Løsning: Skjerp kravet til hva som aksepteres (p = 0.05  0.01). Alfanivå Problem: Vi kan bli for ”strenge”, slik at vi øker sjansen for Type 2-feil 18.09.2018

Hypotesetesting Type 2-feil Vi har vært for ”strenge” – forkastet noe vi egentlig skulle akseptert Løsning: Øk ”power” i undersøkelsen – gjør det mer sannsynlig at vi vil oppdage en effekt hvis den er der (i praksis: øk antall deltakere) 18.09.2018

Hypotesetesting i praksis Faktisk Dommeren: Uskyldig Skyldig ”Tiltalte er skyldig” Type 1-feil Forkaster ”0-hypotesen” når hun egentlig skulle beholdt den JUSTISMORD OK ”Tiltalte er ikke skyldig” Type 2-feil Aksepterer 0-hypotesen når hun egentlig skulle forkastet den 18.09.2018

Hypotesetesting i praksis Faktisk Legen: Frisk Kreft ”Du har kreft” Type 1-feil Forkaster ”0-hypotesen” når hun egentlig skulle beholdt den IKKE SÅ FARLIG OK ”Du er frisk” Type 2-feil Aksepterer 0-hypotesen når hun egentlig skulle forkastet den KATASTROFE 18.09.2018