Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

1 Varianskomponentmodeller Thore Egeland Epidemiologisk senter, RH Seksjon for medisinsk statistikk.

Liknende presentasjoner


Presentasjon om: "1 Varianskomponentmodeller Thore Egeland Epidemiologisk senter, RH Seksjon for medisinsk statistikk."— Utskrift av presentasjonen:

1 1 Varianskomponentmodeller Thore Egeland Epidemiologisk senter, RH Seksjon for medisinsk statistikk

2 2 Innhold Innledning: Hensikt, eksempler, begreper Naiv, feilaktig analyse Eksempler SPSS General Linear Model Univariate Varcomp Noen beregningsdetaljer. Forutsetninger.

3 3 Hensikt Modellere avhengighet som skyldes at (noen) data er gjentatt i en eller annen forstand. Vi tenker ikke nødvendigvis på tid. Håndtere data som ikke er balanserte: missing, dyr dør, etc...

4 4 Eksempler: family: høyden til personer hvorav noen er fra samme familie. Hvor stor del av variasjonen i høyde skyldes familiekomponenten? rats: Rotter stimuleres ulikt i tre grupper. Vi måler respons mange steder i hjernen. Hvordan innvirker behandling på respons? anxiety: hver person plasseres i en gruppe avhengig av 'anxiety' og 4 tester utføres. Hvordan innvirker 'anxiety' på ferdigheter?

5 5

6 6

7 7 Begreper Tilfeldig versus fast effekt Balansert Nestet Eksempler: Family, Rats, Anxiety, Pigment Mål hele tiden: Estimering av variabilitet og p-verdier

8 8 'family' data id family gender height 1 1 female female male 69

9 9

10 10 Family-eksempel Naiv analyse: Toveis variansanalyse: height=mean+family+gender+family*gender Formelt. Familier k=1,2,3,4 j=1,...,n k y kj =

11 11

12 12

13 13

14 14 Hvorfor er analysen naiv, feilaktig? Avhengighet innen familier neglisjeres. Family (1,2,3,4) opptrer på samme måte i modellen som behandling (1,2,3,4) ville ha gjort. Urimelig? Samme analyse kan umulig passe i begge tilfeller.

15 15 Faste og tilfeldige effekter Familier er en tilfeldig (random) effekt. Behandling ville ha vært en fast (fixed) effekt. Familier er trukket fra en fordeling, derav tilfeldig. Behandling bestemmes, fastlegges. Repetert over familier; ikke tid.

16 16 Varianskomponentmodell height=konstant + gender + (fast effekt) family + (tilfeldig effekt) family*gender+ (interaksjon) feilledd (tilfeldig effekt) Det er vanlig å bruke norske bokstaver for tilfeldige effekter og ellers greske.

17 17

18 18 Oppsummering så langt Faste (fixed) effekter: behandling, gruppe,... Tilfeldige effekter: family, batch, rat,

19 19 Varianskomponentmodell Variansen består av flere komponenter: var(høyde)=var(family) +var(error) Medfører: korrelasjon=0 for data fra forskj. familier korrelasjon=var(family)/var(høyde), for data fra samme familie

20 20 Balansert Balansert forsøksplan: Hver kategori har like mange observasjoner Balansert: A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8 Ubalansert: A R1 2.5 A R2 2.2 B R1 2.9

21 21 Betydningen av balanserte planer Balanserte planer har best styrke, er lettere å analysere og fortolke. I våre dager kan imidlertid ubalanserte planer håndteres; imidlertid kan vi forskjellige metoder gi forskjellige svar for små ubalanserte planer.

22 22 Behandling Rotte Respons A R1 2.5 A R2 2.2 B R1 2.9 B R2 2.8 Behandling Rotte Respons A R1 2.5 A R2 2.2 B R3 2.9 B R4 2.8 Planen over er nestet Nesting A R1 B R2R3R4 A R1 B R2R1R2

23 23 enrichedpairedisolated trt. groups fixed R1 R2... R20 rats random,nested... cells, random nested... C1C2...C19 C20... Mixed, unbalanced, nested... (Moser et al., 1997) Eksempel

24 24 Eksempel: anxiety.sav Subject Anxiety Trial 1 Trial 2 Trial 3 Trial

25 Anxiety group subject Trials

26 26 Modell 1 Anxiety. Fast effekt.Vi velger, bestemmer Subject. Tilfeldig effekt, fra en fordeling av individer. Nestet, fra figur. Trial. Fast effekt

27 27 Modell 2 score=konstant+ anxiety+ subject(anxiety)+ trial+ trial*anxiety+ feil

28 28

29 29 SPSS Analyze General Linear Model Univariate (general Factorial i SPSS 8) Dependent variable: score Fixed factor(s): trial anxiety Random factor(s): subject Model > Custom Model: anxiety trial trial anxiety Nesting må gjøres manuelt: Trykk paste og legg inn paranteser som på nederste linje neste side

30 30 SPSS UNIANOVA score BY anxiety trial subject /RANDOM = subject /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /PRINT = DESCRIPTIVE /PLOT = PROFILE( trial*anxiety ) /CRITERIA = ALPHA(.05) /DESIGN = anxiety subject(anxiety) trial anxiety*trial.

31 31

32 32

33 33 Kontroll av antagelser Noen antagelser tar vi stilling til før data: Modellen medfører at korrelasjoner (mellom målinger ftra samme individ) ikke er negative.

34 34 Residualene skal være normalfordelt

35 35 Hvor god er modellen?

36 36 Homogenitet? Variansen i residualene skal være uavhengig av nivået til de faste komponenter

37 37 Sjekk av antagelser i SPPS Vi lagrer residualer og predikerte verdier i save og plotter etterpå.

38 38

39 39 Eksempel: pigment

40 40 Problemstilling Variabiliteten i produksjonen av et legemiddel er for stor:gj.snitt=26.8, sd =6 Hva bidrar mest til variasjonen: batch (produksjonen): sample (stikkprøven): laboratoriet (test,residual):

41 41 Figur s 571,572 Batch og Sample er tilfeldige effekter, Hierarkisk (nestet) modell)

42 42 Modell Moisture= konstant+ batch+ (random) sample(batch)+ (random) test (random)

43 43 Beregninger Manuelt. Denne balanserte planen kan håndregnes. SPPS

44 44 Table 17.3, s

45 45 Detaljer I Utregninger

46 46 Detaljer II Det kan vises:

47 47 Konklusjon Mesteparten av variasjonen kommer fra 'sample' (stikkprøven): 28.5/( )=78.5% 'Man hadde glemt å røre i bøtta før man tok stikkprøven'.

48 48 Beregninger i SPSS Man kan kjøre GLM univariate som før. Da må man imidlertid bearbeide tallene litt før man får varianskompontene. Vi kan bruke glm varcomp:

49 =36.6 Innledende figur viste varians 36.8

50 50 SPSS syntaks Syntaksen er muligens kryptisk, imidlertid er alt unntatt parantesen sample(batch) fremkommet ved pek og klikk: VARCOMP moisture BY batch sample /RANDOM = batch sample /METHOD = REML /CRITERIA = ITERATE(50) /CRITERIA = CONVERGE(1.0E-8) /DESIGN = batch sample(batch) /INTERCEPT = INCLUDE.

51 51 Hypoteseprøving Uinteressant her, allikevel... H0: "ingen batch effekt"

52 52 Hvorfor baseres testen på F=86.495/57.983=1.492 og ikke F=86.495/0.917?

53 53 Forklaring av testen Testobservator Denne størrelsen er omtrent 1 hvis nullhypotesen er riktig og større enn 1 ellers. En stor F verdi gir en liten p-verdi og tilsier forkastning.

54 54

55 55 Litteratur Box, Hunter og Hunter. "Statistics for experimenters", Wiley God&gammel! SPSS Base 9.0. Applications Guide. Ch 10.


Laste ned ppt "1 Varianskomponentmodeller Thore Egeland Epidemiologisk senter, RH Seksjon for medisinsk statistikk."

Liknende presentasjoner


Annonser fra Google