Regresjonsanalyse Del 2

Slides:



Advertisements
Liknende presentasjoner
Å forklare sosiale fenomener
Advertisements

Programmet er laget for å ivareta alle rutiner
Kapittel 4 - Regresjonsanslyse
Statistikk på 50 5 minutter
De regionale helseforetakenes samarbeid om kvalitetsregistre Olav Røise Leder av Styringsgruppen for nasjonale kvalitetsregistre.
Kap 12 Korrelasjon / Regresjon
Kapittel 10 Inferens om gjennomsnitt AAKRE-V SPSS v 10.0 MET 8006 STATISTIKK OG DATAANLYSE Kapittel 10 Inferens om gjennomsnitt Pål Aakre, BI Oslo.
SPSS v Kapittel 8 AAKRE/MET Parvise sammenligninger Cornflakes-eksempelet fra læreboken tab Vi legger inn dataene i Dataeditoren, som.
Kap 5 - Prediksjonsmodeller
Tolkning av resultatene fra logistisk regresjon
René Descartes (1596–1650) Innførte koordinatsystemet
Eksempel AOA (Activity On Arc)
Regresjonskritikk I Den beste modellen – men hvor god er denne modellen? God nok? Regresjonsanalysens forutsetninger – oversikt over mulige problemer 1:
Anvendt statistisk dataanalyse i samfunnsvitenskap
Mer grunnleggende matte: Forberedelse til logistisk regresjon
Om semesteroppgaven Krav til den avhengige variabelen
HVA ER REGRESJONSANALYSE?
Anvendt statistisk dataanalyse i samfunnsvitenskap
Anvendt statistisk dataanalyse i samfunnsvitenskap
Uni-, bi- og multivariate analyser
Om øvelse 9 Vedlikehold av data Databaser. Øvelse 9 I øvelse 8 så vi på: –Registrering av informasjon om hjelpere To små utvidelser av øvelse 8: –Endring.
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
Simpel regresjon Plott av variablene Y mot X
Innskriving av data (1) 1. Slik ser dataeditoren ut fra start.Vi
SAMMENHENGER MELLOM VARIABLER
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Utdypende om design & statistikk Frode Svartdal UiTø April 2012.
ANOVA: Litt om design & statistikk
Statistikk på 20 2 timer PSY-1002
Leieprisstatistikk for Oslo Markedsleie og Gjengsleie for hybler og leiligheter i Oslo 1. kvartal 2009 Leieprisstatistikk for Oslo Utarbeidet av.
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Diskrete stokastiske variable
Regresjonsanalyse Korrelasjon
Presentasjon av data: deskriptiv statistikk
Regresjon Gjennom punktsvermer (scatter plots) kan en ofte (men ikke alltid) med rimelighet trekke en rett linje. En slik linje heter en regresjonslinje.
Eksperter i Team 2004 Landsby 16 Undersøkelse av brukbarhet av datasystemer.
Hypotesetesting, og kontinuerlige stokastiske variable
Repeterte målinger - analyse av oppsummeringsmål
Regresjon Petter Mostad
 Vi ønsker å tilpasse en rett linje gjennom dataskyen  Denne linjen skal ha den beste tilpasningen (minst feil) til data.
SPSS-kurs. Program Dagen vil bli delt inn i fire bolker: Bolk 1 - 9:30-10:30 – Åpne/lagre datasett, datatyper, definere variable. Bolk 2 – 10:45-11:30.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Bolk 3 – Sammenligne gjennomsnitt i ulike grupper
Bolk 3 – Sammenligne gjennomsnitt i ulike grupper
SPSS-kurs.
Bolk 2 – Deskriptiv statistikk
Operasjonsanalytiske emner
Samfunnsvitenskapelig metode – innføring Forelesning 4/
3.14 X AXIS 6.65 BASE MARGIN 5.95 TOP MARGIN 4.52 CHART TOP LEFT MARGIN RIGHT MARGIN Tracking av digitalradio-andel i Norge © TNS Tracking.
SPSS-kurs Bolk 2 – Deskriptiv statistikk. Bolk 2: Deskriptiv statistikk I denne bolken skal vi bruke SPSS til å utforske og beskrive data gjennom ulike.
Skriv inn prosjekttittelen her Navn Lærerens navn Skole
Prosjekttittel Ditt navn | Lærerens navn | Skolen din
Samfunnsvitenskapelig metode – innføring
Digital kompetanse ved eksamen i matematikk
Regresjonsforutsetninger i STATA
MET 2211 Statistikk og dataanalyse
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø H-2006
Kapittel 14: Multippel regresjon
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø V-2010
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
Tester med SPSS prosedyrer og utskrifter
MET 8006 Statistikk Kapittel 13: Regresjon.
MET 8006 Statistikk Kapittel 13: Regresjon.
SIV : Metodevalg Stokastiske variabler
SIV : Regresjon Kapittel 13 17/01/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
SIV : t-testen for to stikkprøver
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Utskrift av presentasjonen:

Regresjonsanalyse Del 2 HSTAT1101: 20. oktober 2004 Odd Aalen

Data Målinger av PEF (Peak Expiratory Flow Rate) for 95 studenter. Tre målinger sittende og tre målinger stående. I eksemplene brukes gjennomsnittlig PEF (PEFMEAN) Registrering av kjønn,høyde og vekt

Spredningsdiagram (“scatter plot”) for PEF mot høyde Korrelasjon: 0.67

Spredningsdiagram for PEF mot høyde. Regresjonslinje

SPSS-programmet Vi analyserer nå dataene i SPSS. PEF er avhengig (“dependent”) variabel Høyde er uavhengig (“independent”) variabel

Regresjon av PEF mot høyde. SPSS utskrift oaalen: SPSS-tabellene ble overført via WORD Regresjon av PEF mot høyde. SPSS utskrift

Hvordan forstå en SPSS-utskrift De viktigste resultatene på foregående slide er merket med ring: Korrelasjon (R) Forklart variasjon (R Square) Regresjonskoeffisienter (B) Skjæringspunkt med y-aksen (Constant) Helningskoeffisienten (her HOEYDE) P-verdier (Sig.) Korrelasjon og regresjonskoeffisienter er omtalt tidligere. Vi vil nå si litt mer om de to andre størrelsene.

Forklart variasjon (R Square) “R Square” er kvadratet av korrelasjons-koeffisienten. Dette er den andelen av variasjonen som forklares ved å legge inn en rett linje. I eksemplet er det 0.447, altså 44.7%.

P-verdier (Sig.) P-verdiene er beregnet ved tester som minner om Student-testene (t-testene). Det viktige her er å forstå hva p-verdiene sier. I eksemplet står det 0.000 begge steder. Dette betyr P<0.001. Det er altså en sjanse på under 1/1000 for at vi ved rene tilfeldigheter skulle få såpass sterk sammenheng som vi har observert.

Residualer Residualer er avvik mellom enkeltpunkter og regresjons-linjen. Disse skal være uavhengige være normalfordelte ikke ha avvik som er systematisk knyttet til noen uavhengige variable Plotter gjerne standardiserte residualer. Disse skal i hovedsak ligge mellom -2 og +2

Histogram over standardiserte residualer

Normalfordelingsplott

Plott av standardiserte residualer mot høyde

Konfidenskurver Konfidenskurver rundt regresjonslinjen viser usikkerheten i linjen Linjen kan bevege seg innenfor grensene angitt ved kurvene.

Konfidenskurver for regresjonslinje

Multippel regresjon Regresjonsformelen kan utvides til å inkludere flere variable: y = a + b x1+ b x2+ b x3 .... Dette er ikke lenger en linje, men et plan, eller hyperplan. Den geometriske intuisjonen svikter når det er flere enn to uavhengige variable.

Spredningsdiagram for PEF mot høyde. Regresjonslinjer etter kjønn

Regresjon av PEF mot høyde og kjønn SPSS utskrift

Regresjon av PEF mot høyde, kjønn og vekt

Sårbarhet for ekstremverdier oaalen: data i extrem.sav Sårbarhet for ekstremverdier Ekstremverdi er avmerket med pil. Regresjons- linjer er inntegnet med og uten ekstremverdi.

Sårbarhets-eksempel fortsettes Med ekstremverdi: korrelasjon 0.37, p = 0.16 Uten ekstremverdi: korrelasjon 0.73, p = 0.001

Interaksjon i regresjonsanalyse Interaksjon avsløres ikke ved residualanalyse. Må studeres for seg selv. To strategier: Kan ta inn en egen interaksjonsvariabel Kan alternativt kjøre separate analyser etter oppdeling av materialet. Se på spredningsdiagrammer!

Datamateriale 1 Vil illustrere et poeng i regresjon med et materiale fra Røssberg og Friis 207 pasienter Avhengig variabel som brukes: confused Uavhengige variable: kjønn (mann=0, kvinne=1) alder psykose ddd extern intern

Interaksjon mellom “alder” og “kjønn”, med “confused” som avhengig variabel

Datamateriale 2 Data fra E. Kjelsberg. Oppfølging av pasienter innlagt ved Statens senter for barne- og ungdoms-psykiatri. Domfelte pasienter. Avhengig variabel: antall mdr i fengsel Uavhengige variable: kjønn GAF (Global Assessment of Functioning) fire dagnostiske kategorier Transformert variabel: LMOFE = log(1+ant mdr i fengsel)

Histogrammer Antall mdr i fengsel: Log skala:

Spredningsdiagram, oppdelt etter kjønn, av GAF mot variablene: 1 Spredningsdiagram, oppdelt etter kjønn, av GAF mot variablene: 1. antall mdr i fengsel 2. LMOFE = log(1+ant mdr i fengsel)

Plott over standardiserte residualer for de avhengige variablene: 1 Plott over standardiserte residualer for de avhengige variablene: 1. antall mdr i fengsel 2. LMOFE = log(1+ant mdr i fengsel)

Regresjonsanalyse i SPSS Gå inn i “Analyze” - “Regression” - “Linear” Velg “Dependent” (avhengig) variabel f.eks. PEF Velg “Independent” (uavhengige) variable f.eks. høyde, kjønn Klikk på “Statistics” og kryss av på “Confidence intervals”

Hvordan få “residual plots” i SPSS? Under “Linear regression” kan en gå inn i “Plots” og krysse av på “Standardized Residual Plots” i rubrikkene for “Histogram” og “Normal probability plot” Du kan under “Linear regression” gå inn på “Save” og krysse av på “Unstandardized” og “Standardized” residuals. Disse går inn i dataarket og kan så plottes på vanlig vis mot forskjellige uavhengige variable

Redigering av spredningsdiagram (“scatter plot”) i SPSS I SPSS kan et “scatter plot” redigeres ved å dobbeltklikke på det. Ved å dobbeltklikke nok en gang i redigerings-modus fremkommer “Scatterplot options”. Rett linje fås ved å krysse av på “Total”, eller på “Subgroups” hvis det er flere grupper Ved å krysse av på “Fit options” kan man velge “Regression Prediction Lines” for “Mean” eller “Individual”, dvs. konfidens og prediksjonskurver Ved å klikke av på “Lowess” kan man få mer fleksible kurver