Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

1 Regresjonsanalyse Del 2 HSTAT1101: 20. oktober 2004 Odd Aalen.

Liknende presentasjoner


Presentasjon om: "1 Regresjonsanalyse Del 2 HSTAT1101: 20. oktober 2004 Odd Aalen."— Utskrift av presentasjonen:

1 1 Regresjonsanalyse Del 2 HSTAT1101: 20. oktober 2004 Odd Aalen

2 2 Data Målinger av PEF (Peak Expiratory Flow Rate) for 95 studenter. Tre målinger sittende og tre målinger stående. I eksemplene brukes gjennomsnittlig PEF (PEFMEAN) Registrering av kjønn,høyde og vekt

3 3 Spredningsdiagram (“scatter plot”) for PEF mot høyde Korrelasjon: 0.67

4 4 Spredningsdiagram for PEF mot høyde. Regresjonslinje

5 5 SPSS-programmet Vi analyserer nå dataene i SPSS. PEF er avhengig (“dependent”) variabel Høyde er uavhengig (“independent”) variabel

6 6 Regresjon av PEF mot høyde. SPSS utskrift oaalen: SPSS-tabellene ble overført via WORD oaalen: SPSS-tabellene ble overført via WORD

7 7 Hvordan forstå en SPSS-utskrift De viktigste resultatene på foregående slide er merket med ring:  Korrelasjon (R)  Forklart variasjon (R Square)  Regresjonskoeffisienter (B) Skjæringspunkt med y-aksen (Constant) Helningskoeffisienten (her HOEYDE)  P-verdier (Sig.) Korrelasjon og regresjonskoeffisienter er omtalt tidligere. Vi vil nå si litt mer om de to andre størrelsene.

8 8 Forklart variasjon (R Square) “R Square” er kvadratet av korrelasjons- koeffisienten. Dette er den andelen av variasjonen som forklares ved å legge inn en rett linje.  I eksemplet er det 0.447, altså 44.7%.

9 9 P-verdier (Sig.) P-verdiene er beregnet ved tester som minner om Student-testene (t-testene). Det viktige her er å forstå hva p-verdiene sier.  I eksemplet står det begge steder. Dette betyr P< Det er altså en sjanse på under 1/1000 for at vi ved rene tilfeldigheter skulle få såpass sterk sammenheng som vi har observert.

10 10 Residualer Residualer er avvik mellom enkeltpunkter og regresjons-linjen. Disse skal  være uavhengige  være normalfordelte  ikke ha avvik som er systematisk knyttet til noen uavhengige variable Plotter gjerne standardiserte residualer. Disse skal  i hovedsak ligge mellom -2 og +2

11 11 Histogram over standardiserte residualer

12 12 Normalfordelingsplott

13 13 Plott av standardiserte residualer mot høyde

14 14 Konfidenskurver Konfidenskurver rundt regresjonslinjen viser usikkerheten i linjen Linjen kan bevege seg innenfor grensene angitt ved kurvene.

15 15 Konfidenskurver for regresjonslinje

16 16 Multippel regresjon Regresjonsformelen kan utvides til å inkludere flere variable: y = a + b x 1 + b x 2 + b x Dette er ikke lenger en linje, men et plan, eller hyperplan. Den geometriske intuisjonen svikter når det er flere enn to uavhengige variable.

17 17 Spredningsdiagram for PEF mot høyde. Regresjonslinjer etter kjønn

18 18 Regresjon av PEF mot høyde og kjønn SPSS utskrift

19 19 Regresjon av PEF mot høyde, kjønn og vekt

20 20 Sårbarhet for ekstremverdier Ekstremverdi er avmerket med pil. Regresjons- linjer er inntegnet med og uten ekstremverdi. oaalen: data i extrem.sav oaalen: data i extrem.sav

21 21 Sårbarhets-eksempel fortsettes Med ekstremverdi:  korrelasjon 0.37, p = 0.16 Uten ekstremverdi:  korrelasjon 0.73, p = 0.001

22 22 Interaksjon i regresjonsanalyse Interaksjon avsløres ikke ved residualanalyse. Må studeres for seg selv. To strategier: Kan ta inn en egen interaksjonsvariabel Kan alternativt kjøre separate analyser etter oppdeling av materialet. Se på spredningsdiagrammer!

23 23 Datamateriale 1 Vil illustrere et poeng i regresjon med et materiale fra Røssberg og Friis 207 pasienter Avhengig variabel som brukes:  confused Uavhengige variable:  kjønn (mann=0, kvinne=1)  alder  psykose  ddd  extern  intern

24 24 Interaksjon mellom “alder” og “kjønn”, med “confused” som avhengig variabel

25 25 Datamateriale 2 Data fra E. Kjelsberg. Oppfølging av pasienter innlagt ved Statens senter for barne- og ungdoms-psykiatri. Domfelte pasienter. Avhengig variabel: antall mdr i fengsel Uavhengige variable:  kjønn  GAF (Global Assessment of Functioning)  fire dagnostiske kategorier Transformert variabel: LMOFE = log(1+ant mdr i fengsel)

26 26 Histogrammer Antall mdr i fengsel: Log skala:

27 27 Spredningsdiagram, oppdelt etter kjønn, av GAF mot variablene: 1. antall mdr i fengsel 2. LMOFE = log(1+ant mdr i fengsel)

28 28 Plott over standardiserte residualer for de avhengige variablene: 1. antall mdr i fengsel 2. LMOFE = log(1+ant mdr i fengsel)

29 29 Regresjonsanalyse i SPSS Gå inn i “Analyze” - “Regression” - “Linear” Velg “Dependent” (avhengig) variabel  f.eks. PEF Velg “Independent” (uavhengige) variable  f.eks. høyde, kjønn Klikk på “Statistics” og kryss av på “Confidence intervals”

30 30 Hvordan få “residual plots” i SPSS? Under “Linear regression” kan en gå inn i “Plots” og krysse av på “Standardized Residual Plots” i rubrikkene for “Histogram” og “Normal probability plot” Du kan under “Linear regression” gå inn på “Save” og krysse av på “Unstandardized” og “Standardized” residuals. Disse går inn i dataarket og kan så plottes på vanlig vis mot forskjellige uavhengige variable

31 31 Redigering av spredningsdiagram (“scatter plot”) i SPSS I SPSS kan et “scatter plot” redigeres ved å dobbeltklikke på det. Ved å dobbeltklikke nok en gang i redigerings-modus fremkommer “Scatterplot options”.  Rett linje fås ved å krysse av på “Total”, eller på “Subgroups” hvis det er flere grupper  Ved å krysse av på “Fit options” kan man velge “Regression Prediction Lines” for “Mean” eller “Individual”, dvs. konfidens og prediksjonskurver  Ved å klikke av på “Lowess” kan man få mer fleksible kurver


Laste ned ppt "1 Regresjonsanalyse Del 2 HSTAT1101: 20. oktober 2004 Odd Aalen."

Liknende presentasjoner


Annonser fra Google