Oppsummering fra forrige gang

Slides:



Advertisements
Liknende presentasjoner
Kap 10 Estimering.
Advertisements

Enhalet og tohalet hypotesetest
STATISTISK GENERALISERING
Kritisk gjennomgang av vitenskapelige studier.
Randomisering av deltakere i eksperiment
Statistikk på 20 2 timer PSY-1002
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Presentasjon av data: deskriptiv statistikk
Bayesiansk statistikk Petter Mostad Overblikk Tilbakeblikk på sannsynlighetsbegrepet Hvordan gjøre Bayesianske analyser Analyser ved hjelp.
Forklaringsprinsipper, positivisme og falsifisering
Hypotesetesting, og kontinuerlige stokastiske variable
TMA 4245 Statistikk Mandag Les dette Powerpointmalen inneholder 3 forskjellige tittel-ark som du kan velge mellom. I tillegg kan du velge lys.
Siste forelesning er i morgen!
Regresjon Petter Mostad
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Statistikk 2 M1 årskurs HVE 31. august 2009.
A2A / A2B M1 årskurs 4. november 2009
M1 årskurs HVE 7. september 2009
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
KOSTRA-skjema 13, Kommunale boliger Ny-utvikling av skjemaet – hvorfor og hvordan?
Innbyggerundersøkelse Kommunereformen Undersøkelse gjennomført i Våler kommune, Hedmark Opinion AS Juni 2016.
1. Problemstillinger  I hvilken grad påvirker kompetansesituasjonen kommunenes evne til å levere gode tjenester?  Hvilke utfordringer har kommunene.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Spredning av kommunale boliger En studie av politikk og resultater i Oslo kommune MASTEROPPGAVE I SAMFUNNSGEOGRAFI RAGNHILD ERTSHUS.
Slik ble Kommune-Norge bedre (og dårligere) i 2015 Ole Petter Pedersen | Kommunal Rapport | 22. juni 2016.
Utvalg og datainnsamling For å gjennomføre en test av hypoteser i kvantitativ metode trenger vi et utvalg deltakere for å gjennomføre datainnsamling –
En faktor i utvikling av teori om sinnet og sosial kompetanse
Hvorfor skal vi måle? Hvordan?
Kvantitativ metode med vekt på survey – del
INF 1500; introduksjon til design, bruk og interaksjon
Nord-Odal kommune - Kommunesammenslåing.
MAT0100V Sannsynlighetsregning og kombinatorikk
Plan for økten - Forklare hva det vil si at skolen er med i Dembra
Forskningsmetoder i psykologi
Beregningsmodell for hverdagsrehabilitering
Metodevurdering for registrering av rømt oppdrettslaks – tellinger, andeler og årsprosent Anders Løland Assisterende forskningssjef Miljøseminar 2017,
Forskningsdesign: eksperiment
Sak 7 - Workshop om Helhetlig behandling av post – hva ønsker Tjenesteeierne  Spørsmål fra Gruppe
Oppgaveskolen 2005 Introduksjon
Bedriftsundersøkelsen 2017
Sametingsvalget mellom Karasjok og Tønsberg
Statistikk 2 Sentral- og spredningsmål
Valgfag innsats for andre
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
Hypotesetesting: Prinsipper
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø H-2006
Medarbeiderundersøkelsen UiT 2011
Gangen i en undersøkelse Prosjektplan og problemformulering
Fra idé til publikasjon
Repetisjon, del I Metode
Forskningsmetoder Data: Måling og målefeil Frode Svartdal UiTø
Kapittel 7: Hypoteseprøving
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø V-2010
Håvard Hansen Doktorgradsstipendiat Institutt for markedsføring
Forelesning nr. 5 Kapittel 4: Statistisk metode
Figur 17.1 Histogram for alle DNB-kundene i undersøkelsen.
MET 2211 Statistikk og dataanalyse
SIV : Regresjon Kapittel 13 17/01/2019 Fred Wenstøp.
Vitenskapsfilosofi og utredningsmetodikk, tirsdag 15. februar 2000.
Bra for legen – bra for pasienten
Kapittel 10 Inferens om gjennomsnitt
Høstrapport – tall og statistikk
Hvordan lærer vi best? Kurs 4
Kapittel 3 Produsere data
Utvalgsfordelinger (Kapittel 5)
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

Oppsummering fra forrige gang Underliggende variable og kausalitet Innsamling av data Planlagte eksperimenter (randomisering) Utvalgsundersøkelser (SRS = Enkelt tilfeldig utvalg)

I dag Motivasjon statistisk inferens (Seksjon 5.1) Sannsynlighetsbegrepet (Seksjon 4.1 og 4.2)

Intro til statistisk inferens Hvordan overføre informasjon fra utvalg til informasjon om populasjon Eksempel: Intervju av utvalg på 937 personer jan/feb 2019* 44.2% vil ha Erna Solberg som statsminister 39.3% vil ha Jonas Gahr Støre som statsminister Hva er sannheten om hele populasjonen? (ca 4 millioner mennesker > 18 år)? Statistisk inferens: Trekke konklusjoner om en stor populasjon fra et mindre utvalg *Fakta om målingen Undersøkelsen er gjort i perioden 29. januar til 4. februar, og den er basert på 937 intervjuer.

Statistisk inferens Statistisk inferens: Trekke konklusjoner om en stor populasjon fra et mindre utvalg For å gjøre det, må vi skille mellom tall som beskriver et utvalg – observatorer («statistics») tall som beskriver populasjonen - parametre

Parametre og observatorer Parameter Et tall som beskriver populasjonen Fast tall, men ukjent Observator Tall som beskriver utvalg Kjent, men endres fra utvalg til utvalg Bruker observator for å estimere (anslå) parameter

Parametre og observatorer Eksempel: Intervju av et utvalg på 937 414 (44.2%) ønsker Solberg som statsminister Hva er sannheten om hele populasjonen (ca. 4 millioner stemmeberettigede)? p: parameter som beskriver andel av populasjon som er enige i at det var riktig = 414/937=0.442 er observatoren (som her er andelen) for utvalget, og kan brukes som et estimat av p

2 flervalgsspørsmål

Utvalgsvariabilitet Nytt utvalg med nye 937 personer vil gi nytt estimat, antageligvis forskjellig fra 0.442 Utvalgsvariabilitet: Verdien av en observator varierer når man repeterer tilfeldige utvalg Tilfeldig utvalg Fjerner skjevhet Vil alltid ha variabilitet Men: Variasjonen følger et forutsigbart mønster Statistisk inferens baserer seg på å spørre seg hva som skjer hvis en prosedyre blir repetert mange ganger. Det sier noe om hvor pålitelig den er

Hvordan studere utvalgsvariabilitet? Ta mange utvalg fra samme populasjon Beregn for hvert utvalg Lag et histogram av Undersøk histogrammets for form, senter og spredning til fordelingen I praksis For dyrt/tidkrevende å se på mange utvalg Alternativ: Simuler med datamaskin (imitererer mange utvalg)

Utvalgsvariabilitet: Simulering av utvalg Later som om vi vet at andelen i populasjonen som har en bestemt mening er f.eks. 90%, dvs p=0.9 Trekker 1000 utvalg av størrelse n=100 fra en slik populasjon (trekker 100 personer 1000 ganger fra en populasjon med p=0.9) For hvert av de 1000 utvalgene beregnes (dvs antall med den meningen for hvert utvalg delt på n=100), lager så histogram av disse 1000 verdiene av Gjentas for utvalg av størrelse n=1200

Utvalgsvariabilitet, Simulering av utvalg, n=100

Utvalgsvariabilitet, Simulering av utvalg, n=1200

Utvalgsvariabilitet: Simulering av utvalg Histogrammene gir oss en ide om hvordan utvalgsvariabiliteteten avhenger av n Gir et bilde av utvalgsfordelingen til observatoren for to forskjellige verdier av utvalgsstørrelsen n

Utvalgsfordeling Utvalgsfordelingen for en observator er fordelingen av verdier som observatoren kan ta for alle mulige utvalg av samme størrelse n fra populasjonen Simulering: Tilnærming av sann fordeling (eksempel: vi så kun på 1000 utvalg, ikke alle mulige) Sannsynlighetsteori: Kan noen ganger gi eksakt fordeling Beskriver fordeling ved form, senter og spredning

Form: Begge histogrammene ser ut til å stemme bra med normalfordelingen (kvantilplott bekrefter dette (for n=100)) Senter: Begge histogrammer er sentrert i 0.9, ingen tendens til at verdiene er høyere eller lavere enn 0.9, dvs har ingen forventningsskjevhet som estimator for p Spredning: Mye mindre spredning for n=1200 enn for n=100

Forventningsskjevhet og variabilitet Forventningsskjevet: Angår senter av utvalgsfordeling. Forventningsrett (unbiased) hvis forventning i fordeling er lik sann verdi av parameter Variabilitet: Spredning i fordeling. Avhenger av Utvalgsdesign Utvalgsstørrelse

Forventningsskjevhet og variabilitet Vi kan tenke på den sanne parameterverdien for populasjonen som blinken på en skyteskive Observatoren er pilkastet Forventningsskjevhet og variabilitet beskriver hva som skjer når man kaster mange ganger Forventningsskjevhet: Hvor langt fra blinken man systematisk kaster Variabilitet: Hvor spredt man treffer Et godt utvalgs-design og en god pilkaster har begge lav forventningsskjevhet og lav variabilitet

Godt design Redusere skjevhet: Tilfeldig utvalg Redusere variabilitet: Bruk stort utvalg Usikkerhetsmarginer: Setter grenser for størrelse på feil i estimatet Reflekterer utvalgsvariabiliteten Avhenger av utvalgsstørrelsen (mindre for større utvalg) Populasjonsstørrelse betyr ingenting (så lenge populasjonen er minst 20 ganger større enn utvalgsstørrelsen n) Utvalg på 2500 like bra for populasjon med 900.000 individer som for 9.000.000 NB!!

Hvorfor randomisere Fjerne skjevheter, senter i utvalgsfordeling lik sann parameterverdi Kan bruke sannsynlighetsteori for å analysere data Form på utvalgsfordeling kjent, ofte (nesten) normalfordelt Spredning kan minskes ved å øke utvalgsstørrelse Senere vil vi komme tilbake til mer tekniske detaljer for utvalgsfordelinger og hvordan vi kan trekke statistiske konklusjoner basert på dem Statistisk teori baserer seg på: Hva skjer hvis eksperimentet repeteres mange ganger

2 flervalgsspørsmål