Hypotesetesting: Prinsipper

Slides:

Advertisements

Liknende presentasjoner

Eksperimentet Frode Svartdal UiTø © Frode Svartdal – H2005.

Advertisements

Forholdet mellom variabler: Kausalitet og korrelasjon

Statistikk på 50 5 minutter

Forskningsmetoder: Oppsummering og utdypning

Introduksjon Forskningsmetoder Frode Svartdal, UiTø H-2006

Enhalet og tohalet hypotesetest

ART: Dokumentasjon av behandlingseffekt

Grunnleggende spørsmål om naturfag

Forskningsmetoder: Oppsummering og utdypning

STATISTISK GENERALISERING

Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.

Kritisk gjennomgang av vitenskapelige studier.

Å overleve oppgaveskriving: Litteraturgjennomgang

Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.

Frode Svartdal UiTø April 2009

Utdypende om design & statistikk Frode Svartdal UiTø April 2012.

Utdypende info, design & statistikk

ANOVA: Litt om design & statistikk

Design, evalueringsstudie 06/07

Forskningsrapporten Frode Svartdal UiT.

Randomisering av deltakere i eksperiment

Statistikk på 20 2 timer PSY-1002

Aggression Replacement Training

Fire problemer Operasjonaliseringsproblemet (måling/begrepsvaliditet)

Eksperimentell metode - I

Eksperimentelle design Ikke-eksperimentelle design

La oss begynne med begynnelsen (igjen)

Studentprosjekt Videreutdanningen Frode Svartdal UiT/Diakonhjemmet Høgskole H-2014.

Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.

Meta-analyse Frode Svartdal UiTø Okt © Frode Svartdal.

Hypotesetesting, og kontinuerlige stokastiske variable

Siste forelesning er i morgen!

Randomiserte kontrollerte studier

Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral

Kræsjkurs Del Ii Hypotesetesting

Trond Haukedal AS Hordaland Fylkeskommune - LO - NHO Læreplasskonferansen 2016 Bergen den 11.

Utvalg og datainnsamling For å gjennomføre en test av hypoteser i kvantitativ metode trenger vi et utvalg deltakere for å gjennomføre datainnsamling –

Veileder for gevinstrapportering

Oppgavestruktur <Fag> <Navn> Institutt for statsvitenskap

Kvantitativ metode med vekt på survey – del

Kognitiv psykologi Frode Svartdal UiT 2015.

Prosjekttittel Ditt navn | Lærerens navn | Skolen din

Er prosessen som fører til at individer eller grupper

Statistikk 2 Sentral- og spredningsmål

Forskningsprosjekt, tittel

Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.

Prosjektveileder Forklaringer og enkle hjelpemidler

Korrelasjonelle metoder

Frode Svartdal UiTø Okt. 09

Måling, målefeil Forskningsmetoder Frode Svartdal UiTø H-2006

Hva er psykologi? Frode Svartdal

Fra idé til publikasjon

Gangen i en undersøkelse Prosjektplan og problemformulering

Fra idé til publikasjon

MET 2211 Statistikk og dataanalyse

Forskningsmetoder Validitet Frode Svartdal Universitetet i Tromsø

Psykologiske tester Frode Svartdal, UiTø 26/12/2018 FSv.

Repetisjon, del I Metode

1. Innledende påstander om organisasjoner

Forskningsmetoder Data: Måling og målefeil Frode Svartdal UiTø

Kapittel 7: Hypoteseprøving

Eksempler, sosialpsykologi

Måling, målefeil Forskningsmetoder Frode Svartdal UiTø V-2010

SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.

MET 2211 Statistikk og dataanalyse

MET 2211 Statistikk og dataanalyse

Håvard Hansen Doktorgradsstipendiat Institutt for markedsføring

Bikkjestykket barnehage Tidlig innsats og utfordrende atferd

Kapittel 6 Lønn og belønning

Oppsummering fra forrige gang

Utskrift av presentasjonen:

Hypotesetesting: Prinsipper Frode Svartdal UiTø Januar 2013 © Frode Svartdal 18.09.2018

Utgangspunkt En antakelse begrunnet i teori En vanlig oppfatning Alt dette er mat for hypotesetesting! Utgangspunkt En antakelse begrunnet i teori Dissonansteori: ”Hvis …, så ….” En vanlig oppfatning ”Belønning øker prestasjon” Noe vi tror er feil ”Læring kan bare skje hvis vi forstår læringsbetingelsene” Motstridende funn a) ”Forventning om belønning øker motivasjon” vs. b) ”Forventning om belønning reduserer motivasjon” 18.09.2018

Uinteressant! ”Alle” vet dette! Utgangspunkt II Uinteressant! ”Alle” vet dette! Hypotesen må ha interesse! ”Belønning øker motivasjon” ”Under visse betingelser vil belønning redusere motivasjon” Interessant! 18.09.2018

Hypotesetesting: Generelt Hvordan testes hypoteser? Formulere en testbar påstand (f.eks. en implikasjon fra en teori) Gjennomføre en relevant undersøkelse (eksperiment, observasjon, …) Avgjøre om resultatet støtter hypotesen Statistisk Innholdsmessig 18.09.2018

Eksempel: Dissonansteori (Festinger) Dissonans = ubehagelig aktivering som følge av konflikt Eksempel: Jeg røyker Dissonans Jeg vet at det er farlig å røyke 18.09.2018

Dissonansteori: Festinger A Lesson In Cognitive Dissonance 18.09.2018

Eksempel: Dissonansteori Festinger & Carlsmith, 1958 Dissonans-betingelse: (a) Du utfører kjedelig arbeid i en time (b) Du får lite betalt (c) Du sier at jobben var “ganske artig” (d) Din mening om jobben måles Ikke dissonans-betingelse: (b) Du får mye betalt Dissonans Hypotese? Ikke dissonans Hypotese? 18.09.2018

Hypotesetesting Design og prosedyre OK: Fp-er er tilfeldig fordelt i gruppene (dvs. variasjon mellom fp-er er ikke systematisk relatert til manipulasjonen) eksperimentsituasjonen er den samme for alle prosedyren er den samme for alle … 18.09.2018

Hypotesetesting: Statistisk Uavhengig variabel Avhengig variabel HØY-gruppe Høy betaling: FP mottar 100 kr Vurdering av oppgaven (-5 - +5): -0,1 LAV-gruppe Lav betaling: 10 kr 1,4 Randomisert 18.09.2018

Hypotesetesting: Statistisk Uavhengig variabel Avhengig variabel Eksperiment-gruppe Høy betaling Snittskåre: -0,1 Kontroll- gruppe Lav betaling Snittskåre: 1,4 R Tid  Ingen forskjell Ingen forskjell? 18.09.2018

Hypotesetesting: Statistisk Eksempel: Eksperiment med to grupper Nullhypotesen: ”Utvalgene kommer fra samme populasjon”. Vi sjekker: Hvor sannsynlig er det at den observerte forskjellen mellom utvalgene kan oppstå, gitt at utvalgene kommer fra samme populasjon? Forskningshypotesen: ”Utvalgene kommer ikke fra samme populasjon”. 18.09.2018

Hypotesetesting: Statistisk Hvis den observerte forskjellen er svært usannsynlig, forkaster vi 0-hypotesen Grense: 5 av 100 tilfeller (0,05) Avvisning av 0-hypotesen innebærer en indirekte aksept av forskningshypotesen Forskningshypotesen ”bevises” IKKE 18.09.2018

Hypotesetesting: Statistisk Statistisk konklusjons-validitet: Er konklusjonen vi trekker fra utvalget holdbar? Trusler: Lav power: Vi oppdager ikke en mulig effekt. Typisk årsak: for få deltakere Brudd på statistiske forutsetninger Fisking i data: Vi leter etter effekter Lite reliable mål Lite reliable prosedyrer 18.09.2018

Hypotesetesting: Statistisk Eksperimentgr. mean = -0,1 Kontrollgr. mean = 1,4 Hvordan kan man avgjøre om den observerte forskjellen, er så stor at vi må forkaste 0-hypotesen? Statistisk test som sammenligner to gruppegjennomsnitt – t-test: Hvor stor er variasjonen mellom gruppene (gruppeforskjell)? Hvor stor er variasjonen innen gruppene? Hvor mange deltakere har vi i hver gruppe? 18.09.2018

Hypotesetesting: Statistisk Populasjon Generali- sering Randomisert utvelgelse YTRE VALIDITET Eksp.gr. Utvalg Resultat Funn Kontr.gr. INDRE VALIDITET Randomisert fordeling 18.09.2018

Hypotesetesting: Innholdsmessig Er hypotesen rimelig? … Er operasjonaliseringene av variablene rimelige? ”Høy” = 100 kr ”Lav” = 10 kr Er oppgaven som blir utført faktisk kjedelig? Er undersøkelsen gjennomført på en betryggende måte (design)? Er det nok med bare 2 nivåer av UV (100 vs. 10)? Hva med en kontrollgruppe som ikke får betalt? Foreligger det trusler mot vår slutning om effekt (confounding variabler)? Viktig!! Har vi kontroll over relevante variabler? Er deltakere tilfeldig fordelt til grupper (randomisering)? Kritisk for eksperimenter!!! Finnes det alternative fortolkninger av funnet? ??? 18.09.2018

Hypotesetesting Mao: Selv om vi får støtte for vår hypotese statistisk, betyr ikke dette automatisk at hypotesen støttes teoretisk Statistisk hypotesetesting: Mekanisk prosess Teoretisk hypotesetesting: Kompleks slutning 18.09.2018

Dataanalyse Beskrive en variabel (et sett av skårer) Eksempel: Gjennomsnitt Beskrive relasjoner mellom to variabler Eksempel: Korrelasjon (r) Beskrive relasjoner mellom flere sett av skårer (konsistens) Cronbachs alfa Bestemme om to gruppegjennomsnitt er signifikant forskjellige Eksempel: T-test Bestemme om flere gruppegjennomsnitt er signifikant forskjellige Eksempel: Variansanalyse 18.09.2018

Hypotesetesting: p og effektstørrelse To viktige aspekter ved et funn: Signifikans: Hvor reliabelt er funnet? Hvis vi gjentar undersøkelsen, vil vi få samme utfall? Effektstørrelse: Hvor stor effekt snakker vi om? Er (et signifikant) utfall praktisk/teoretisk interessant? 18.09.2018

Hypotesetesting: p og effektstørrelse Signifikans Hvor reliabelt er funnet? Jo svakere et funn er, desto flere deltakere trengs for å påvise det som signifikant Ikke nødvendigvis noen styrke ved en undersøkelse at man har mange deltakere Aspirin  redusert risiko for hjerteinfarkt 10000 deltakere trengs for å påvise effekten Mørketid  vinterdepresjon 2-4000 deltakere 18.09.2018

Hypotesetesting: p og effektstørrelse Cohen: “The degree to which a phenomenon exists”. Hvor sterkt slår effekten ut? Hvor sterk er sammenhengen? Signifikans (p) sier ikke nødvendigvis så mye om styrke Samme effektstørrelse kan bety ulike ting i ulike kontekster: Redusert fart: Nesten null betydning for den enkelte; 15 menneskeliv spart i løpet av et år i Norge 18.09.2018

Hypotesetesting: Falsifikasjon To utfall mulig: Vi aksepterer 0-hypotesen (”gruppene kommer fra samme populasjon”)  forskningshypotesen forkastes Vi forkaster 0-hypotesen (”gruppene kommer ikke fra samme populasjon”)  forskningshypotesen støttes 18.09.2018

Hypotesetesting Wason (1977): Falsifiserende vs. bekreftende strategi i hypotesetesting Bekreftende evidens er forenlig med et stort antall hypoteser eller teorier Falsifiserende evidens vil utelukke i alle fall noen hypoteser Dvs.: Falsifiserende evidens er ofte mer informativ om verden enn bekreftende evidens 18.09.2018

Hypotesetesting Faktisk Vår beslutning Aktivering fører faktisk ikke til bedre læring Aktivering fører faktisk til bedre læring ”Aktivering fører til bedre læring” Type 1-feil Vi forkaster 0-hypotesen når vi egentlig skulle beholdt den OK ”Aktivering fører ikke til bedre læring” Type 2-feil Vi aksepterer 0-hypotesen når vi egentlig skulle forkastet den 18.09.2018

Hypotesetesting Type 1-feil Vi har vært for ”snille” – akseptert noe vi egentlig skulle forkastet Løsning: Skjerp kravet til hva som aksepteres (p = 0.05  0.01). Alfanivå Problem: Vi kan bli for ”strenge”, slik at vi øker sjansen for Type 2-feil 18.09.2018

Hypotesetesting Type 2-feil Vi har vært for ”strenge” – forkastet noe vi egentlig skulle akseptert Løsning: Øk ”power” i undersøkelsen – gjør det mer sannsynlig at vi vil oppdage en effekt hvis den er der (i praksis: øk antall deltakere) 18.09.2018

Hypotesetesting i praksis Faktisk Dommeren: Uskyldig Skyldig ”Tiltalte er skyldig” Type 1-feil Forkaster ”0-hypotesen” når hun egentlig skulle beholdt den JUSTISMORD OK ”Tiltalte er ikke skyldig” Type 2-feil Aksepterer 0-hypotesen når hun egentlig skulle forkastet den 18.09.2018

Hypotesetesting i praksis Faktisk Legen: Frisk Kreft ”Du har kreft” Type 1-feil Forkaster ”0-hypotesen” når hun egentlig skulle beholdt den IKKE SÅ FARLIG OK ”Du er frisk” Type 2-feil Aksepterer 0-hypotesen når hun egentlig skulle forkastet den KATASTROFE 18.09.2018