Varianskomponentmodeller

Slides:

Advertisements

Liknende presentasjoner

12.Studienreise nach Finnland,

Advertisements

Kvinner og politikk Kvinnelig valgmobilisering i Nord-Norge: Glasstak eller etterslep? Marcus Buck.

Når matematikk blir magisk

Litt mer om PRIMTALL.

Nye internettsider for Høgskolen i Østfold Resultat fra brukerundersøkelse.

Ti måter å ødelegge en CT-undersøkelse av halsen på

Hjemmeoppgave 1: Å høre etter NAVN: ……………………………….. DATO: ……………………….

Grafisk design Visuell kommunikasjon

INTEGRERINGSBAROMETERET Holdninger til integrering og mangfold GRAFIKKRAPPORT.

Bygningsdelstabellen

Teknologi for et bedre samfunn 1 Asbjørn Følstad, SINTEF Det Digitale Trøndelag (DDT) Brukervennlig digitalisering av offentlig sektor.

Egenskaper til stoff og tidsbegrep: En modell for aspekt i russisk Laura A. Janda UNC-Chapel Hill/University of Tromsø

7. Fysisk arbeidsmiljø Jeg er fornøyd med den ergonomiske utformingen av arbeidsplassen min Jeg er fornøyd med inneklimaet på arbeidsplassen.

1 Arbeidssted, bruk av fasiliteter og - mengde 5.

Møre og Romsdal. 2 Ligger det et bedehus eller et kristelig forsamlingshus (ikke kirke) i nærheten av der du bor? (n=502) i prosent.

NRKs Profilundersøkelse NRK Analyse. Om undersøkelsen • NRK Analyse har siden 1995 gjennomført en undersøkelse av profilen eller omdømmet til NRK.

:50 Evaluering Lysvåken i Bergen domkirke menighet 1 Svarlogg.

2. Planter. Del 1 (1–4). Nivå 2. Side 19–24

Fôr til oppdrettstorsk – bruk av vegetabilsk feitt Odd Leknes Forskningsdagene 2007 Alta.

Kap 05 Betinget sannsynlighet

Fra forelesningene om involveringspedagogikk Et utviklingsarbeid Philip Dammen Manuset er under arbeid.

Kapittel 14 Simulering.

Øvingsforelesning 9 Flytnettverk, maksimum flyt og

Transformasjoner Men hva hvis relasjonen er kurvelinjær?

Foreløpige tall pr Randi Sæther

Seniorene – morgendagens arbeidskraft! 5. desember 2006 Senter for Seniorpolitikk NAV Arbeidslivssenter Akershus NAV Arbeidslivssenter Oslo.

Highlights fra markedsundersøkelse Utarbeidet av Inger Marie Brun,

R ESULTATER M UNKERUD SKOLE 2012 Nasjonale prøver 5.-8.trinn 2012 Brukerundersøkelsen 2012.

MET 2211 Statistikk og dataanalyse Forelesning Kapittel 14: Variansanalyse.

Kap 13 Sammenligning av to grupper

Kap 06 Diskrete stokastiske variable

Avdeling for mikrobiologi og smittevern

© Synovate Gjennomført av Synovate 21.august 2008 Catibus uke 33 Norsk Fysioterapeutforbund.

TANKESMIA AS Medieanalyse for Helse Midt-Norge Stjørdal

Norsk Finansbarometer 2012 Norsk Finansbarometer 2012 Norsk Finansbarometer 2012 TNS Gallup Oslo, 2012 Det norske skadeforsikrings- markedet og dets bevegelser.

Oppland Arbeiderblad Kjønn i kildebruk - Utviklingstrekk over en to års periode.

3.14 X AXIS 6.65 BASE MARGIN 5.95 TOP MARGIN 4.52 CHART TOP LEFT MARGIN RIGHT MARGIN Legevakt Legevakt Innbyggerundersøkelsen 2013 Brukerdel.

Klinisk skjema nyrebiopsiregisteret

Vokabular barneoppdragelse (m) bleie (f/m) blikk (n) bortskjemt (adj.)

Skriv om slik at setningene betyr omtrent det samme

Statistikk på 20 2 timer PSY-1002

SINTEF Teknologi og samfunn PUS-prosjektet Jan Alexander Langlo og Linda C. Hald 1 Foreløpig oppsummering – underlag for diskusjon på PUS-forum

Malverk intern produktopplæring

GRØNNALGER BRUNALGER RØDALGER

1 BM-dagen 29.okt BM1 Fysisk miljøplanlegging Studieprogram for Bygg- og miljøteknikk Meny Prosjektoppgaven Arealbruk og befolkning Transport og.

Anvendt statistisk dataanalyse i samfunnsvitenskap

Eiendomsmeglerbransjens boligprisstatistikk Oktober 2010

Eiendomsmeglerbransjens boligprisstatistikk Juni 2010 Norges Eiendomsmeglerforbund og Eiendomsmeglerforetakenes Forening ECON Poyry og FINN.

Eiendomsmeglerbransjens boligprisstatistikk Februar 2011 Norges Eiendomsmeglerforbund og Eiendomsmeglerforetakenes Forening ECON Poyry og FINN.

Velkommen! 4/4/2017.

En retrospektiv journalstudie

Fra forelesningene om involveringspedagogikk Et utviklingsarbeid Philip Dammen Manuset er under arbeid.

PRINTER NORGE AS -Tillegg pris per kopi driftsavtale color, mono og multifunksjonsskrivere.

NM i prototyping - Yggdrasil 2014

Bankenes sikringsfond Revisjonskontoret

Virksomhetsrapport Oktober Innhold 1. Oppsummering 2. Hovedmål 3. Pasient 5. Aktivitet 4. Bemanning 6. Økonomi 7. Klinikker 2.

En oversikt over personopplysningsloven Dag Wiese Schartum, AFIN.

To accompany Quantitative Analysis for Management, 8e by Render/Stair/Hanna 15-1 © 2003 by Prentice Hall, Inc. Upper Saddle River, NJ Kapittel 15.

Elevundersøkelsen ( ) UtvalgGjennomføringInviterteBesvarteSvarprosentPrikketData oppdatert 7. trinnVår , Symbolet (-) betyr.

Inflation og produktion 11. Makroøkonomi Teori og beskrivelse 4.udg. © Limedesign

Institutt for helhetsmedisin

Virksomhetsrapport August Innhold 1. Oppsummering 2. Hovedmål 3. Pasient 5. Aktivitet 4. Bemanning 6. Økonomi 7. Klinikker 2.

1 Trivsel Utvalg Trives svært godt Trives godt Trives litt Trives ikke noe særlig Trives ikke i det hele tatt Snitt Trivsel Brannfjell skole (Høst 2014)

Veivalgsanalyse etter Sørlandsmesterskapet i lang (klassisk) distanse 2004.

Dagligbankundersøkelsen Fakta Dagligbankundersøkelsen intervju Befolkning 15 år + TNS Gallup Forfatter Bente Pettersen Roar Thorvaldsen.

Befolkning og arbejdsmarked 7. Mikroøkonomi Teori og beskrivelse © Limedesign

Repeterte målinger - analyse av oppsummeringsmål

Siste forelesning er i morgen!

Regresjon Petter Mostad

Utskrift av presentasjonen:

Varianskomponentmodeller Thore Egeland Epidemiologisk senter, RH Seksjon for medisinsk statistikk

Innhold Innledning: Hensikt, eksempler, begreper Naiv, feilaktig analyse Eksempler SPSS General Linear Model Univariate Varcomp Noen beregningsdetaljer. Forutsetninger.

Hensikt Modellere avhengighet som skyldes at (noen) data er gjentatt i en eller annen forstand. Vi tenker ikke nødvendigvis på tid. Håndtere data som ikke er balanserte: missing, dyr dør, etc...

Eksempler: family: høyden til personer hvorav noen er fra samme familie. Hvor stor del av variasjonen i høyde skyldes familiekomponenten? rats: Rotter stimuleres ulikt i tre grupper. Vi måler respons mange steder i hjernen. Hvordan innvirker behandling på respons? anxiety: hver person plasseres i en gruppe avhengig av 'anxiety' og 4 tester utføres. Hvordan innvirker 'anxiety' på ferdigheter?

Begreper Tilfeldig versus fast effekt Balansert Nestet Eksempler: Family, Rats, Anxiety, Pigment Mål hele tiden: Estimering av variabilitet og p-verdier

'family' data id family gender height 1 1 female 67 2 1 female 66 . . . . . . . 18 4 male 69

Family-eksempel Naiv analyse: Toveis variansanalyse: height=mean+family+gender+family*gender Formelt. Familier k=1,2,3,4 j=1,...,nk ykj=

Hvorfor er analysen naiv, feilaktig? Avhengighet innen familier neglisjeres. Family (1,2,3,4) opptrer på samme måte i modellen som behandling (1,2,3,4) ville ha gjort. Urimelig? Samme analyse kan umulig passe i begge tilfeller.

Faste og tilfeldige effekter Familier er en tilfeldig (random) effekt. Behandling ville ha vært en fast (fixed) effekt. Familier er trukket fra en fordeling, derav tilfeldig. Behandling bestemmes, fastlegges. Repetert over familier; ikke tid.

Varianskomponentmodell height=konstant + gender + (fast effekt) family + (tilfeldig effekt) family*gender+ (interaksjon) feilledd (tilfeldig effekt) Det er vanlig å bruke norske bokstaver for tilfeldige effekter og ellers greske.

Oppsummering så langt Faste (fixed) effekter: behandling, gruppe,... Tilfeldige effekter: family, batch, rat,

Varianskomponentmodell Variansen består av flere komponenter: var(høyde)=var(family) +var(error) Medfører: korrelasjon=0 for data fra forskj. familier korrelasjon=var(family)/var(høyde), for data fra samme familie

Balansert Balansert forsøksplan: Hver kategori har like mange observasjoner Balansert: A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8 Ubalansert: A R1 2.5 A R2 2.2 B R1 2.9

Betydningen av balanserte planer Balanserte planer har best styrke, er lettere å analysere og fortolke. I våre dager kan imidlertid ubalanserte planer håndteres; imidlertid kan vi forskjellige metoder gi forskjellige svar for små ubalanserte planer.

Nesting Planen over er nestet Behandling Rotte Respons A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8 Behandling Rotte Respons A R1 2.5 A R2 2.2 B R3 2.9 B R4 2.8 Planen over er nestet A R1 B R2 A R1 B R2 R3 R4

Eksempel Mixed, unbalanced, nested... (Moser et al., 1997) trt. groups fixed enriched paired isolated ... ... ... rats random,nested R1 R2 ... R20 ... cells, random nested ... ... C1C2...C19 C20...

Eksempel: anxiety.sav Subject Anxiety Trial 1 Trial 2 Trial 3 Trial 4 1 1 18 14 12 6 2 1 19 12 8 4 11 2 16 14 10 9 12 2 16 12 8 8

1 2 Anxiety group 6 7 12 1 .... .... subject Trials 1 2 3 4

Modell 1 Anxiety. Fast effekt.Vi velger, bestemmer Subject. Tilfeldig effekt, fra en fordeling av individer. Nestet, fra figur. Trial. Fast effekt

Modell 2 score=konstant+ anxiety+ subject(anxiety)+ trial+ trial*anxiety+ feil

SPSS Analyze General Linear Model Univariate (general Factorial i SPSS 8) Dependent variable: score Fixed factor(s): trial anxiety Random factor(s): subject Model > Custom Model: anxiety trial trial anxiety Nesting må gjøres manuelt: Trykk paste og legg inn paranteser som på nederste linje neste side

SPSS UNIANOVA score BY anxiety trial subject /RANDOM = subject /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /PRINT = DESCRIPTIVE /PLOT = PROFILE( trial*anxiety ) /CRITERIA = ALPHA(.05) /DESIGN = anxiety subject(anxiety) trial anxiety*trial .

Kontroll av antagelser Noen antagelser tar vi stilling til før data: Modellen medfører at korrelasjoner (mellom målinger ftra samme individ) ikke er negative.

Residualene skal være normalfordelt

Hvor god er modellen?

Homogenitet? Variansen i residualene skal være uavhengig av nivået til de faste komponenter

Sjekk av antagelser i SPPS Vi lagrer residualer og predikerte verdier i save og plotter etterpå.

Eksempel: pigment

Problemstilling Variabiliteten i produksjonen av et legemiddel er for stor:gj.snitt=26.8, sd =6 Hva bidrar mest til variasjonen: batch (produksjonen): sample (stikkprøven): laboratoriet (test,residual):

Figur s 571,572 Batch og Sample er tilfeldige effekter, Hierarkisk (nestet) modell)

Modell Moisture= konstant+ batch+ (random) sample(batch)+ (random) test (random)

Beregninger Manuelt. Denne balanserte planen kan håndregnes. SPPS

Table 17.3 , s574-575

Detaljer I Utregninger

Detaljer II Det kan vises:

Konklusjon Mesteparten av variasjonen kommer fra 'sample' (stikkprøven): 28.5/(0.92+28.5+6.9)=78.5% 'Man hadde glemt å røre i bøtta før man tok stikkprøven'.

Beregninger i SPSS Man kan kjøre GLM univariate som før. Da må man imidlertid bearbeide tallene litt før man får varianskompontene. Vi kan bruke glm varcomp:

7.128+28.533+0.917=36.6 Innledende figur viste varians 36.8

SPSS syntaks Syntaksen er muligens kryptisk, imidlertid er alt unntatt parantesen sample(batch) fremkommet ved pek og klikk: VARCOMP moisture BY batch sample /RANDOM = batch sample /METHOD = REML /CRITERIA = ITERATE(50) /CRITERIA = CONVERGE(1.0E-8) /DESIGN = batch sample(batch) /INTERCEPT = INCLUDE .

Hypoteseprøving Uinteressant her, allikevel ... H0: "ingen batch effekt"

Hvorfor baseres testen på F=86.495/57.983=1.492 og ikke F=86.495/0.917?

Forklaring av testen Testobservator Denne størrelsen er omtrent 1 hvis nullhypotesen er riktig og større enn 1 ellers. En stor F verdi gir en liten p-verdi og tilsier forkastning.

Litteratur Box, Hunter og Hunter. "Statistics for experimenters", Wiley 1978. God&gammel! SPSS Base 9.0. Applications Guide. Ch 10.