Kræsjkurs Del Ii Hypotesetesting

Slides:



Advertisements
Liknende presentasjoner
1 Sannsynlighetsregning Gjenfinningssystemer og verktøy II Jon Anjer.
Advertisements

Hva trenger jeg av data, og hvordan skal jeg innhente disse?
Enhalet og tohalet hypotesetest
Grunnleggende spørsmål om naturfag
STATISTISK GENERALISERING
Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.
Grunnleggende matematikk
Statistikk og hydrologi
Kritisk gjennomgang av vitenskapelige studier.
BI 3010H05 Populasjonsgenetikk Halliburton Kap 1-3
Kompleksitetsanalyse
Kvalitativ metode i markedsforskning
Lokale forhandlinger Beregninger - begreper
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
Harald Romstad Høgskolen i Hedmark
Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
ANOVA: Litt om design & statistikk
Forskningsrapporten Frode Svartdal UiT.
Statistikk på 20 2 timer PSY-1002
Hvor mange dager i løpet av de siste 7 dager, gikk du minst 10 minutter i strekk for å komme deg fra et sted til et annet? Dette inkluderer gange på jobb.
Bærekraftig utvikling - forskerspiren
NÅ SKAL VI LÆRE OM LIKNINGER.
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Diskrete stokastiske variable
Teoretiske og metodiske spørsmål innen trekk-psykologi
Resultater NNUQ IMDi, 6. september Innledning.
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral
Presentasjon av data: deskriptiv statistikk
Hypotesetesting, og kontinuerlige stokastiske variable
Standardisering Nico Keilman Demografi grunnemne ECON 1710 Høst 2009.
Siste forelesning er i morgen!
Randomiserte kontrollerte studier
Regresjon Petter Mostad
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
 Vi ønsker å tilpasse en rett linje gjennom dataskyen  Denne linjen skal ha den beste tilpasningen (minst feil) til data.
 Begreper  ANOVAAnalysis of Variance  Sum of Squares (Sammenlign med formelen for varians) Sir Ronald Aylmer Fisher
A2A / A2B M1 årskurs 4. november 2009
Operasjonsanalytiske emner Prognosemodeller basert på Tidsserieanalyse Rasmus RasmussenBØK710 OPERASJONSANALYTISKE EMNER1 Del 23Forecasting 1 - Mønster.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Menn og redningsvest Gjennomført juni 2010 InFact AS.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Barn og ungdomsundersøkelsen 2016 Norsk Friluft
MAT0100V Sannsynlighetsregning og kombinatorikk
Hvilken effekt på VO2 maks har treningen på Skipper-Worse?
LIKNINGER MED EN OG TO UKJENTE.
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
Kapittel 8: Ikke-parametriske tester
MET 2211 Statistikk og dataanalyse
Repetisjon, del I Metode
Kapittel 7: Hypoteseprøving
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
SIV : Kategoriske variabler og normaltilnærmelsen
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Kapittel 11 Kategoriske variabler og normaltilnærmelsen
To relaterte stikkprøver
Figur 17.1 Histogram for alle DNB-kundene i undersøkelsen.
MET 2211 Statistikk og dataanalyse
SIV : t-testen for to stikkprøver
SIV : Kapittel 7 Hypoteseprøving 22/02/2019 Fred Wenstøp.
Kapittel 10 Inferens om gjennomsnitt
Oppsummering fra forrige gang
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

Kræsjkurs Del Ii Hypotesetesting

Prosedyren for hypotesetesting Bestem null- og den alternative hypotesen Velg signifikansnivå Velg fordeling beregn testobservatoren Beregn frihetsgrader Finn kritisk verdi Formuler ”the decision rule” Avvis eller behold nullhypotesen

HYPOTESER KAN IKKE BEVISES ELLER BEKREFTES! KUN FORKASTES!

1. Hypotesene Nullhypotesen er hypotesen som testes. Refererer til null forskjell/null endring. Derfor skal likhetstegnet (eller ≤ / ≥) alltid stå i nullhypotesen. Eksempel: Den alternative hypotesen er den motsatte påstanden. Eksempel

2. Velg signifikansnivå Signifikansnivået er sannsynligheten for å avvise nullhypotesen når den skal beholdes. (type 1 feil) 5% brukes oftest. Bruk lavere sannsynlighet ved høy risiko Bruk høyere sannsynlighet ved lav risiko 1% eller lavere på medisinsk forskning og romfart 10 % på meningsmålinger Kan være støy i datasettet/målefeil Så litt om feiltyper

Feiltyper Brannalarmen går for 18.000. gang på prestvannet studentboliger denne uka

Behold Ho Avvis Ho Ho er sann Du fortsetter å se på netflix Du går ut og fryser for 18.000. gang denne uka og går inn igjen og ser på netflix (Type I) Ho er usann Du brenner inne (Type II) Du går ut og varmer deg på varmen fra brannen

3. Velg fordeling Fokuserer på z- og t-test for øyeblikket. Det finnes andre fordelinger. Bruk z-test kun hvis: n>30 OG populasjonens standardavvik er kjent! Bruk t-test ellers!

Er populasjonens standardavvik kjent? Ja Nei Bruk t-test Er utvalgsstørrelsen mer enn 30? Ja Nei Bruk z-test

4. Beregn testobservatoren x = verdien vi vil teste μ = utvalgets gjennomsnitt s = utvalgets standardavvik n = antall observasjoner Nevneren er det samme som standardfeilen

5. Hva i alle dager er frihetsgrader? I en utregning er dette antallet verdier som kan variere Når vi beregner t-observatoren er det n-1 verdier som kan variere, -1 er siden gjennomsnittet er bestemt Eks: Hvis vi har 10 ukjente verdier med gjennomsnitt 30 vet vi at summen av disse verdiene må bli 300. Hvis vi beregner 9 verdier ("frie"), vil den siste verdien være gitt Regn eksempel med gjennomsnitt på tavla

6. Finn kritisk verdi

7. Formuler ”the decision rule”

1-hale-test ved bruk av ≥ eller ≤ 2-hale-test ved bruk av = (Ikke glem å dele alfaverdien (signifikansnivået) på 2 når du bruker 2-hale- tester!!!!) Illustrer nullhypotese (krokodille) og pil

8. Avvis eller behold nullhypotesen Husk å tolke svaret ditt og skriv utfyllende på eksamensbesvarelsen

Vi prøver en t- test Musikere er kjent for sin ekstremt sunne livsstil, og vi mistenker at denne gruppen har et systolisk blodtrykk forskjellig fra 78.2. I løpet av "wacken open air" festivalen i Tyskland får vi målt blodtrykket til 15 musikere dagen før konsert. Nullhypotese: gjennomsnittlig blodtrykk = 78.2 Vi bruker 5% signifikansnivå Nullhypotesen inneholder alltid =-tegnet

t-test De 15 prøvene har et gjennomsnitt på 82 og s=7 Frihetsgrader = 15 -1 = 14 Finner den kritiske verdien 2,145 med df=14, 2- hale-test med 5% signifikansnivå i t-tabellen Testobservatoren vår t er mindre en forkastningsgrensen på 2.012. Den nøyaktige verdien er p=0.054 dvs det er 5.4% sansylighet for at våre eller mer ekstreme data har oppstått ved en tilfeldighet Hva gjør du med H0? X -> det tallet som skal testes (82) U -> gjennomsnittet i populasjonen (78,2) S -> populasjonens gjennomsnitt N -> sample size

to-utvalgs t-test Vi ønsker som regel å sammenligne to gjennomsnitt der den sanne variansen er ukjent. Vi må beregne testobservatoren ved hjelp av gjennomsnitt, standardavvik (S) og antall frihetsgrader Samme formel, men med modifikasjoner NB! t med n-2 frihetsgrader Forskjell i gjennomsnitt Denne er enkel Felles standardfeil Denne krever litt mer

to-utvalgs t-test Standardavviket til to utvalg ved en t-test er gitt ved Standardfeilen er gitt ved

Eksempel Vi ønsker å se på effekten av fysisk aktivitet hos menn i alderen 20-30 år. Vi antar at det maksimale oksygenopptaket er et godt mål for kondisjon og vil sammenligne dette mellom en gruppe innaktive og en gruppe aktive menn. Gruppe 0 bedriver ikke idrett og betegnes som innaktive Gruppe 1 trener minimum 3 ganger pr. uke og betegnes som aktive

Data Gruppe 0 42.6 44.8 48.0 47.5 47.1 50.1 45.8 45.1 44.4 43.7 snitt:45.91 standardavvik: 2.26 Gruppe 1 56.6 64.0 59.0 62.2 59.8 62.9 61.0 57.2 66.1 58.8 Snitt: 60.76 Standardavvik: 3.05

Hypotese Aktive menn i alderen 20-30 år har bedre kondisjon en inaktive menn i samme alder Nullhypotese: Det er ingen forskjell i maksimalt oksygenopptak mellom de to gruppene Ho : X1 - X0 = 0 Vi vil være helt sikre og forkaster ikke nullhypotesen før ved 1% signifikansnivå

testobservator Vi har valgt 1% forkastningsgrense og vi har totalt 10 +10 = 20 personer med i studien (18 frihetsgrader) Vi regner ut testobservatoren ved hjelp av Forskjell i gjennomsnitt Evt my0 = my1 Felles standardfeil

Vi regner forskjell i gjennomsnitt Felles standardavvik 60.76 – 45.91 = 14.79 Felles standardavvik S= sqrt( 9*2.252 +9*3.052) / 18 = 2.68 Felles standardfeil 2.68* sqrt(1/10 +1/10) = 1.20

testobservator Testobservatoren var: t= 14.79/1.20 = 12.33 med d.f 18, hva er grensen vår for forkastning på t-verdi (Husk vi bestemte oss for 1%) Forskjell i gjennomsnitt Felles standardfeil

En liten oppsummering Når skal vi bruke z test? Når skal vi bruke t-test? Hvor mange frihetsgrader er det i en to-hale- t-test?