Ronny Klæboe Transportøkonomisk institutt Utvalgsteori og modellbasert statistisk teori.

Slides:



Advertisements
Liknende presentasjoner
Fagoppgave Justert formulering
Advertisements

Institutt for samfunnsforskning | Institute for social research | Hvordan lage gode surveyspørsmål? En kommentar Rune Karlsen.
Forskerspiren Åpne forsøk: nye læringsmål?
Gjenfinningssystemer og verktøy II
Tips og råd for praktisk kompetansearbeid
Hva trenger jeg av data, og hvordan skal jeg innhente disse?
Kap 10 Estimering.
Vurdering av statistiske analysemetoder brukt i Læringslabens undersøkelser i videregående skole i Rogaland.
Ronny Klæboe Transportøkonomisk institutt
Star Tour Ferievaner September 2009
Forskningsdesign Bjørnar Sæther SGO 4001.
Kommunal- og samfunnsøkonomiske effekter av boligsosial politikk Husbanken 22. Juni 2011 Rolf Barlindhaug Norsk institutt for by- og regionforskning.
Å overleve oppgaveskriving: Litteraturgjennomgang
Kvantitativ forskning
Forside Korteste sti BFS Modifikasjon Dijkstra Eksempel Korrekthet Analyse Øving Spørsmål Dijkstras algoritme Åsmund Eldhuset asmunde *at* stud.ntnu.no.
EVALUERING AV PRODUKTER, PROSESSER OG RESSURSER. Gruppe 4 Remi Karlsen Stian Rostad Ivar Bonsaksen Jonas Lepsøy Per Øyvind Solhaug Andreas Tønnesen.
Kvalitativ metode i markedsforskning
Kvalitetssikring av analyser til forskningsbruk
Prosjektoppgaven – krav og suksessfaktorer. Suksessfaktorer Bruk biblioteket Bruk veilederen Start skrivingen tidlig Jobb jevnt (lag gjerne tids- og handlingsplaner.
SAMFUNNSVITENSKAPELIGE PROBLEMSTILLINGER
Prognose av framtidig etterspørsel
I dag snakker vi om: Brukergrensesnitt med kvalitet Bruksegenskaper Normans 7 stadier Testing med papirprototyp.
Hva kan man forvente av ingeniørverktøy
Utdypende om design & statistikk Frode Svartdal UiTø April 2012.
ANOVA: Litt om design & statistikk
Om Luthersk dåpsteologi og dåpens betydning for trosopplæring
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Kvalitative og kvantitative metoder
Fire problemer Operasjonaliseringsproblemet (måling/begrepsvaliditet)
Forklaringstyper i historievitenskapen
Seminar Dagkirurgi i Norge 7 februar 2014: Finansieringsordninger som fremmer utvikling av dagkirurgi Tor Iversen.
3) Analyse (SoPK) for dypere kunnskap
Michael F. AtiyahIsadore M. Singer Om Atiyah-Singer Indeks-teoremet Professor John Rognes Universitetet i Oslo.
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
1 Måling: Metoder Nivåer Validering Churchill kap. 9 Troye & Grønhaug kap. 5 Reve: Validitet i økonomisk administrativ forskning Litteratur:
Hypotesetesting, og kontinuerlige stokastiske variable
Hovedoppgaveforberedende seminar
Masterskolen 2012 : Introduksjon Opplegget for Masterskolen –Opplegget, timeplan med mer Elementene i en masteroppgave –Teori, metode og empiri (data)
Siste forelesning er i morgen!
Forskningsopplegg og metoder
Regresjon Petter Mostad
Myter – organisasjon og ledelse i barnehagen
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Statistikk 2 M1 årskurs HVE 31. august 2009.
Sosiologiske metoder. Kvantitative metoder: ulike metoder for å måle mengder og er underlag for statistikk. Kvalitative metoder: et mangfold av teknikker.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Problemløsning.
3.14 X AXIS 6.65 BASE MARGIN 5.95 TOP MARGIN 4.52 CHART TOP LEFT MARGIN RIGHT MARGIN Tracking av digitalradio-andel i Norge © TNS Tracking.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Sosiologiske metoder. Kvantitative metoder: ulike metoder for å måle mengder og er underlag for statistikk. Kvalitative metoder: et mangfold av teknikker.
M&L2 Kap. 4 - ver.1 Markeds- undersøkelser Oslo, sept 2010.
MÅLINGER ER BRA - GOD STYRING VIKTIGST Jan Ubøe, professor i matematikk ved NHH.
Kjennskap til etablering av «Innbyggerservice» og inntrykk av informasjon fra kommunen generelt Bergen omnibus Januar 2017.
Holdninger til konkurranseutsetting av velferdstjenester Befolkningsundersøkelse gjennomført i juni 2017 på oppdrag for NHO.
Forskningsdesign En plan eller skisse til hvordan en undersøkelse skal gjennomføres - er det vi kaller et forskningsdesign. Problemstillingen bestemmer.
Undersøkelse gjennomført for Kommunenes Sentralforbund (KS)
Kvalitative og kvantitative metoder
MAT0100V Sannsynlighetsregning og kombinatorikk
Distance sampling.
INF5110 – 5. og 7. mai 2015 Stein Krogdahl, Ifi, UiO
Undersøkelse gjennomført for Kommunenes Sentralforbund (KS)
MAT0100V Sannsynlighetsregning og kombinatorikk
Undersøkelse blant synshemmede For Norges Blindeforbund
STUDENTDELTAKELSE i FOU-PROSJEKT Kari Spernes
Håvard Hansen Doktorgradsstipendiat Institutt for markedsføring
Undersøkelsesprosessen
Vitenskapsfilosofi og utredningsmetodikk, tirsdag 15. februar 2000.
Lean design spill Support Erasmus+ Project LEAN
Oppsummering fra forrige gang
Utskrift av presentasjonen:

Ronny Klæboe Transportøkonomisk institutt Utvalgsteori og modellbasert statistisk teori

Før vi starter på utvalgsmetodikk; Vi er ofte interessert i sammenhenger mellom variable for å forstå virkningsmekanismer og mulige utviklingsbaner. Populasjonen vi ser på kan da sees som en av mange mulige realisasjoner av de mekanismene som virker, men da er det ikke lenger utvalgsstatistikk vi bedriver, men modellbasert statistikk. Metodekurs utvalgsteori 13. mai 2011

Om statistiske teorier for tolking av data Det eksisterer to statistiske teoriar, statistisk utvalsteori og modellbasert statistisk teori ”I den samfunnsvitskaplege metodelitteraturen har utvalsteorien fått ein brei plass, medan modellbasert statistisk teori sjeldan eller i liten grad blir omtalt... Vanlegvis ønskjer samfunnsforskarane å studere strukturar i sosiale prosessar. Dataanalysen må da baserast på teorien for stokastiske modellar… Bruk av utvalsteorien i slike situasjonar er idemessig galt og kan dessutan gi opphav til feilaktige slutningar. Rolf Aaberge, Petter Laake Tidskrift for samfunnsforskning 1984 Metodekurs utvalgsteori 13. mai 2011

Hva er utvalgsteori, hva er egenskapene  Dette er teori for hvordan vi kan si noe om en endelig populasjon ved å trekke et utvalg av denne (Gallup, meningsmåling)  Bruk av utvalg erstatter ofte fullstendige tellinger/ manntall hvor en fastslår egenskapene til alle enhetene  Kostnadene ved registreringen kan være stor, og bruk av utvalgsstatistikk gir vesentlige innsparinger  Vi skal altså fastslå egenskaper ved populasjonen ved å undersøke noen få av medlemmene  Prosedyrene som følges når en trekker enheter, bestemmer de statistiske egenskapene til anslagene en kommer fram til Metodekurs utvalgsteori 13. mai 2011

Reelt eller tenkt eksperiment -- Design viktig  Modellbasert statistisk teori (stokastiske modellar) byggjer på ideen om at observasjonane i eit gitt materiale er resultata frå eit reelt eller tenkt eksperiment. Sosiale fenomen som livslengda til folk, giftemål og skilsmisse kan vi sjå på som resultat av tenkte ikkje- deterministiske eksperiment.  Modellbasert statistisk teori er ein matematisk disiplin som er blitt utvikla for å handtere reelle eller tenkte ikkje- deterministiske eksperiment Metodekurs utvalgsteori 13. mai 2011

Modellbasert stastistikk nødvendig for å studere sammenhenger  Samfunnsforskarane er ofte interessert i å studere samanhengar eller strukturar mellom variablar. For å kunne gjere dette på ein meiningsfull måte må vi formulere ein stokastisk modell. Dei aktuelle samanhengane eller strukturane blir da uttrykt ved parametrene i den stokastiske modellen.  Problemet med å studere dei aktuelle strukturane er da overført til parametrene i modellen. Vi treng da metodar for analyse av desse parametrene. Den modellbaserte statistiske teorien gir opphav til nødvendige analysemetodar Metodekurs utvalgsteori 13. mai 2011

Utvalgsmetodikk  Vi har imidlertid fortsatt behov for å planlegge undersøkelser og ta utvalgsstatistikken i bruk når vi skal gi en beskrivelse av egenskapene ved ulike befolkninger.  Det er vanligvis alt for dyrt å spørre eller undersøke hele befolkningen.  Det kan være lure måter å gå fram på og som gjør at vi får mer for pengene (mer presise anslag) Metodekurs utvalgsteori 13. mai 2011

Variasjon står i sentrum  Populasjonen er sammensatt av enheter (ofte personer) som er ulike.  For å beskrive en heterogene befolkning, er det nødvendig å skaffe til veie observasjoner/svar som gjør at vi kan trekke konklusjoner om ulike grupper i befolkningen.

Ofte kontekstuelle rammer som det må tas hensyn til  Æra  Kultur  Budsjett  Kunnskap  Ressurser  Logistikk/  Tid  Respondenter  Tillatelser

Design av utvalgsundersøkelser  Seleksjonsprosessen  Hvilke variable er vi interessert i, hvordan definerer vi dem?  Hvordan har vi tenkt å foreta utvalget:  Matcher utvalget -- problemstillingen (Selvseleksjon, konkurranseflater, scope)  Hvordan har vi tenkt å måle variablene vi er interessert i  Estimeringen  Hvordan har vi tenkt å gå fram for å slutte noe om populasjonen etter at vi har fått tak i utvalget  Ofte mange “kunder” til en og samme undersøkelse, ikke så lett å svare generelt om hva som er ønskelig presisjon på estimatene -- Ofte kompromisser. Metodekurs utvalgsteori 13. mai 2011

Utvalgsramme: Befolkning Utvalget Utvalgs- ramme Trekningsmåten Befolkningen du vil si noe om Hva utvalget forteller deg Slutninger om hele befolkningen og sub- grupper I befolkningen Selve utvalgsplanen Gjennomføringen Resultatet (frafall)

Utvalg ikke bare geografi og gruppe men også tid  Temporal spredning:  Sommerpopulasjon kontra vinterpopulasjon  Promilleprøver på natta eller på morgenen  Søvn kvelden/natten eller morgenen  Snø eller solskinn  Unge førere – utvalg kan bli skjevt hvis en ikke tar hensyn til at de bare har førerkort deler av første år Metodekurs utvalgsteori 13. mai 2011

Enkelt tilfeldig utvalg (Simple random sample) Uttrekkingsprosedyren bestemmer egenskapene: Sverdrup m. fl. Metodekurs utvalgsteori 13. mai 2011

Estimering av et prosenttall (proporsjon)  La p angi andelen i populasjonen som har en egenskap:  Vi estimerer denne andelen ved å bruke gjennomsnittet i utvalget: Metodekurs utvalgsteori 13. mai 2011

Animasjoner  Vi viser nå en animasjon over usikkerheten knyttet til prosenttall hvor andelen av de som er spurt går fra en forsvinnende liten del av populasjonen som skal undersøkes (vanlig når vi trekker fra et helt land eller en storby), til en stor andel av befolkningen som skal undersøkes. Metodekurs utvalgsteori 13. mai 2011

Animasjoner  Mens den forrige animasjonen viser usikkerheten i prosent, er det også mulig å se på den relative feilen. Dette får fram at en to prosent feilanslag kan være stort når det er en liten gruppe i populasjonen en ønsker anslag for. Metodekurs utvalgsteori 13. mai 2011

Den som sist har geburtsdag – flertrinnsutvalg Metodekurs utvalgsteori 13. mai 2011

Enperson og flerpersonhusholdninger har ulike sjanser for å bli valgt ut, men har det betydning? Metodekurs utvalgsteori 13. mai 2011

Bilen er tilgjengelig for hele husholdningen  Bilhold (sjansen for at det er en bil i husholdningen) større dessto større husholdningen er  Husholdningsinntekten er større med antall personer  Større mengde fritidsreiser, reiser der en er sjåfør  Færre handlereiser (siden flere kan dele oppgaven) Metodekurs utvalgsteori 13. mai 2011 Når en spør etter person som sist har bursdag må dataene vektes med valgbar husholdningsstørrelse.

Optimum cluster size  Two opposing factors in optimum cluster size  Smaller cluster size, lower design effect = more precision for given sample size.  Larger cluster size, easier & cheaper = larger sample size for given cost  You can estimate the optimal cluster size if you know:  transport costs to each cluster  cost for interviewing each respondent  Roh  Total field costs = C1m + C2mb C1 = cost of travel to each cluster C2 = cost for interviewing (and listing) each individual in chosen clusters m = number of clusters b = number in each cluster * Optimum cluster size (b) = Square root of (C 1/C2)[(1-roh) / roh]

Cluster sampling  Used when:  Researchers lack a good sampling frame for a dispersed population.  The cost to reach an element to sample is high.  Each cluster is as varied heterogeneous internally and homogeneous to all the other clusters.  Usually less expensive than Simple Random Sampling (SRS) but not as accurate  Each stage in cluster sampling introduces sampling error—the more stages there are, the more error there tends to be.  Can combine SRS, SS, stratification and cluster sampling!!

Stratumlotteriske utvalg – ”optimale” utvalg  Med en god inndeling i strata (strata som er homogene) kan vi tjene mye  Ofte velger en utvalgsstørrelsen er proporsjonal med antallet enheter i hvert av strataene (Proportional Probability sampling PPS)  Enda bedre (men mer komplisert) er det om man i tillegg velger proposjonalt med variasjonen i strataene  Har man ett stratum med kloner, og et med stort mangfold kan det være greit å bruke relativt lite ressurser på klonene og mer der forskjelligheten er større  Ytterligere forbedring kan en få gjennom å ta hensyn til kostnadene ved å hente inn informasjonen – Ulandsproblematikk, tilgang til måleutstyr, ekspertise mv. Metodekurs utvalgsteori 13. mai 2011

Bootstrapping kan brukes for å få numeriske anslag på usikkerhet – ikke alltid enkelt analytisk Metodekurs

Gode råd  Tenk først !  Tenk på mulige hovedfunn og alternative forklaringer  Innebærer at vi av og til ønsker å spørre for å utelukke heller enn å bekrefte  Forstå temaet for undersøkelsen – og bruksområdet  Ofte viktig å vite hva som ikke dekkes  Ofte vanskelig å legge til data i ettertid  Hva er viktig kontra hva er gjort tidligere Et element av innovasjon i alle undersøkelser Noe en gjør bedre enn tidligere – noe nytt, en “perle” Metodekurs utvalgsteori 13. mai 2011