Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Tolkning av resultatene fra logistisk regresjon

Liknende presentasjoner


Presentasjon om: "Tolkning av resultatene fra logistisk regresjon"— Utskrift av presentasjonen:

1 Tolkning av resultatene fra logistisk regresjon
JFRYE2005

2 Aller først (med relevans for både OLS og logistisk regr.):
Husk skillet mellom fortolkninger som fokuserer på b-verdiene (variablenes effekt på y) predikerte verdier til enheter (’resultatene’ av disse effektene) 1: Det første viser til den generelle effekten som en variabel (x) har på en annen variabel (y) OLS: Et års ekstra utdanning fører til at inntekten stiger med kroner 2A: Det andre viser hvilken konkret predikert verdi (y-hat) en gruppe enheter har, forutsatt en bestemt kombinasjon x-verdier… OLS: Menn på 30 år med 7 års utdanning og så videre… har kroner i inntekt 2B …eller også relative forskjeller mellom forskjellige grupper (men fortsatt mellom konkrete grupper) OLS: Folk med 7 års utdanning har dermed kroner høyere inntekt enn folk med 4 års utdanning JFRYE2005

3 y = b0 + b1x1 + b2x2 + b3x3 + e JFRYE2005

4 Først et OLS-eksempel…
JFRYE2005

5 b Konstant 10 Alder 0,1 Kvinne -3 Utdanning 1 Avhengig variabel:
Inntekt i NOK Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: For hvert år eldre man blir, øker inntekten med 1000 kroner b Konstant 10 Alder 0,1 Kvinne -3 Utdanning 1 2A Kvinner på 40 år som har 3 års utdanning, har NOK i inntekt 2B Kvinner har NOK lavere lønn enn menn JFRYE2005

6 Det første har med variabler å gjøre,
HUSKEREGEL: Det første har med variabler å gjøre, Det andre har med enheter å gjøre JFRYE2005

7 FORTOLKNING AV LOGISTISK REGRESJON
Utgangspunktet: 1: Logit’en 2: Odds / oddsratioer 3: Sannsynligheter (Husk relasjonen mellom disse tre begrepene!) JFRYE2005

8 1: LOGIT’EN (L) Husk at det er logit’en som estimeres i den logistiske regresjonsmodellen Variablens b-verdier viser hvordan L endres ved en enhets endring i x. JFRYE2005

9 Vanskelig å tolke direkte.
1: Fortegnene på den enkelte x (b-verdiene) + = positiv relasjon 0 = ingen relasjon - = negative relasjon 2A: Predikert L for en gruppe L > 0: p > 0,50 L = 0: p = 0,50 L < 0: p < 0,50 Ikke særlig informativt 2B: Forskjeller i predikert L mellom to grupper (relativ forskjell) Heller ikke særlig informativt JFRYE2005

10 Konst. -2 Alder 0,1 Kvinne -1 Utd. 0,5 Avhengig variabel:
Inneha sjefsstilling Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Sannsynligheten for å være sjef øker med alderen 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 b Exp (b) P Konst. -2 Alder 0,1 Kvinne -1 Utd. 0,5 2B Kvinner har -1 lavere L enn menn (sier heller ikke så mye…) JFRYE2005

11 2: ODDS / ODDSRATIO Oddsratio (OR) [eb / exp(b)] viser hvordan oddsen (O) [eL] endres ved en enhets endring i x. NB: Fortolkninger av odds/oddsratio er multiplikativ – det betyr at man må skille mellom absolutt og relativ endring i oddsen JFRYE2005

12 Per har 2 i odds for bli rik. Lisa har 4 i odds for å bli rik
Et eks.: Per har 2 i odds for bli rik. Lisa har 4 i odds for å bli rik Så skaffer de seg utdanning, og begge øker dermed oddsene sine for å bli rike med 2 (ORutd = 2). Da har Per 4 i odds for å bli rik Da har Lisa 8 i odds for å bli rik Merk følgende: Per og Lisas odds steg med det samme relativt sett (2) Lisa har fortsatt dobbel så stor sjanse for å bli rik som Per Men Lisas odds steg dobbelt så mye i absolutte verdier Pers odds steg fra 2 til 4, en økning på 2 Lisas odds steg fra 4 til 8, en økning på 4 JFRYE2005

13 Matematisk sett… Utgangspunktet er logit-formelen:
L = b0 + b1X1 + b2X2 (NB Husk at L = ln(P/1-P)) Man kan ta antilogaritmen (dvs. ’finne eksponenten’) til uttrykkene på begge sidene av denne ligningen, og uttrykket vil fortsatt være gyldig Antilogarimen til L = O Antilogarimen til b0 + b1X1 + b2X2 = eb0 + b1X1 + b2X2 = e L JFRYE2005

14 TOLKNINGER AV ODDS OG ODDSRATIO
1: Som endring i oddsene ved en enhets endring i x (= verdien for oddsratioen) Oddratioen er oppgitt i den siste kolonnen av SPSS-utskriften (Exp)B (også skrevet som eb) (Exp)B > 1  øker oddsen (Exp)B = 1  ingen endring (samme funksjon som 0 i additive modeller) (Exp)B < 1  minsker oddsene JFRYE2005

15 TOLKNINGER AV ODDS OG ODDSRATIO 2A: Predikerte odds: e L
Hvilken odds har en bestemt gruppe for at y = 1? JFRYE2005

16 TOLKNINGER AV ODDS OG ODDSRATIO
2B: Som prosentvis endring i odds ved en enhets endring i X Tolkning som prosent: (((Exp)B) - 1) * 100) = prosentvis økning/reduksjon i odds ved en enhets økning i X JFRYE2005

17 TOLKNINGER AV ODDS OG ODDSRATIO 2B: Som oddsratio
Direkte sammenligninger mellom to oddsene for to forskjellige grupper, f.eks. for kvinner og menn, eller for folk med høyere utdanning enn andre: JFRYE2005

18 Konst. Alder Kvinne Utd. Avhengig variabel: Inneha sjefsstilling
Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Oddsene for å være sjef multipliseres med 1,11 for hvert år man blir eldre 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 og dermed en odds på 12,18 for å være sjef (her oppdager man at eksemplet er dårlig…) b Exp (b) P Konst. -2 0,13 Alder 0,1 1,11 Kvinne -1 0,37 Utd. 0,5 1,65 2B Kvinner har 63 prosent lavere odds enn menn for å være sjef, eller: oddsratioen mellom kvinner og menn er 0,37 JFRYE2005

19 3: SANNSYNLIGHETER NB: Ikke-linjær og ikke-additiv tolkning
– effekten i form av sannsynligheter må identifiseres for et gitt sett av verdier på de andre variablene Dvs.: Kan ikke si noe generelt om effekten av variablene på sannsynligheter JFRYE2005

20 TOLKNINGER AV SANNSYNLIGHETER Baseres på estimert L-verdi
P = 1 / (1+ e-L) Sett inn verdier for alle andre X Maksimumsverdier Gjennomsnittsverdier Minimumsverdier Teoretisk interessante verdier Lag så en graf for hvordan Y endres for ulike X JFRYE2005

21 Konst. Alder Kvinne Utd. Avhengig variabel: Inneha sjefsstilling
Alder: År Kjønn: Mann = 0, kvinne = 1 Utdanning: Antall år etter vgs. 1 Effekten av alder: Umulig å si noe generelt 2A Kvinner på 40 år som har 3 års utdanning, har en L på 2,5 og en odds på 12,18 for å være sjef – dvs. en sannsynlighet på 0,92 b Exp (b) P Konst. -2 0,13 ----- Alder 0,1 1,11 Kvinne -1 0,37 Utd. 0,5 1,65 2B Umulig å si noe generelt om forhold mellom to grupper ift. sannsynlighet JFRYE2005

22 1: Variablenes effekt på Y Enkelt & greit: b (b* gir den st. verdien)
OLS Logit Odds Oddsratio Sannsynligheter 1: Variablenes effekt på Y Enkelt & greit: b (b* gir den st. verdien) Greit nok, men vanskelig å tolke ut over fortegnene Greit Endring i odds Umulig å si noe utover det som fortegnene til L forteller 2A: Predikerte verdier for grupper Enkelt & greit: Predikert y Greit nok, men vanskelig å tolke utover fortegnene og ikke særlig informativt Hver enhet har sine odds for Y=1 2B: Relative forskjeller i predikerte verdier for grupper Forskjellene i predikert y Greit nok, men vanskelig å tolke utover fortegnene og heller ikke særlig informativt Prosentvis endring i odds ved en enhets endring i X, Oddsratio, forholdet mellom oddsen til to grupper der forskjellen er en enhet på x-skalaen JFRYE2005

23 Et forslag til tolknings- og formidlingsstrategi:
Bruk først og fremst odds / oddsratio til å si noe om effekten av x på y Eks.: ’Modellen viser at utdanning øker oddsen [og dermed sannsynligheten] for å inneha en sjefsstilling. For hvert år ekstra utdanning man har, øker oddsen [og dermed sannsynligheten] med 1,65.’ Bruk predikerte sannsynlighetsverdier til å anskueliggjøre hva resultatene innebærer for konkrete grupper Eks.: Kvinner på 40 år som har 3 års utdanning, har en sannsynlighet på 0,92 for å inneha en sjefsstilling [L = 2,5 og odds = 12,18] Bruk prosentvis endring i oddsratio til å si noe om forskjeller mellom konkrete grupper. Eks.: ’Resultatene viser at kvinner har 63 prosent lavere odds enn menn til å inneha en sjefsstilling.’ Eller: ’Oddsratioen mellom kvinner og menn er 0,37.’ JFRYE2005

24 1: Variablenes effekt på Y Enkelt & greit: b (b* gir den st. verdien)
OLS Logit Odds Oddsratio Sannsynligheter 1: Variablenes effekt på Y Enkelt & greit: b (b* gir den st. verdien) Greit nok, men vanskelig å tolke ut over fortegnene Greit Endring i odds Umulig å si noe utover det som fortegnene til L forteller 2A: Predikerte verdier for grupper Enkelt & greit: Predikert y Greit nok, men vanskelig å tolke utover for-tegnene og ikke særlig informativt Hver enhet har sine odds for Y=1 2B: Relative forskjeller i predikerte verdier for grupper Forskjellene i predikert y Greit nok, men vanskelig å tolke utover fortegnene og heller ikke særlig informativt > Prosentvis endring i odds ved en enhets endring i X > Oddsratio, forholdet mellom oddsen til to grupper der forskjellen er en enhet på x-skalaen JFRYE2005

25 Men aller viktigst – for fortolkning og spesielt kommunikasjon av logistiske regresjonsresultater:
BRUK GRAFER! (Men husk: grafer sier ikke noe annet enn matematikken – det er bare et triks for å anskueliggjøre matematiske relasjoner) JFRYE2005

26 ’Grafisk grunnlogikk’ Vise hvordan Y endrer seg når X endrer seg.
Velg ut X’en som du ønsker å belyse, regn ut de ulike Y-verdiene du får for forskjellige X-verdier Lag eventuelt særskilte grafer for spesielle grupper (for eksempel kvinner og menn, eller grupper med forskjellig utdanning) JFRYE2005

27 ’Grafisk grunnlogikk’
4: Husk at en graf i utgangspunktet er to-dimensjonal – med med pkt 3 så ’lurer’ vi inn enn tredje dimensjon (dimensjon = variabel i denne sammenhengen) 5: Kontinuerlige variabler på X-aksen gjør seg best! 6: Logistisk: Variablene som ikke belyses i den aktuelle grafen, må settes til en bestemt verdi og inkluderes i konstant-leddet (minimum, maksimum, gjennomsnitt, teoretisk definert) JFRYE2005

28 Hva kan man tolke ut av konstantleddet?
Og helt til slutt… Hva kan man tolke ut av konstantleddet? Ingenting – er bare med som et utgangspunkt for utregninger JFRYE2005

29 1: Fra p til O: O = p / q q = (1 - p) O = p / (1 - p) Hvis p = 0,4
SOS3003/JFRYE

30 L = ln(O) = ln(p / q) = ln(p / (1 – p))
2: Fra p til L: L = ln(O) = ln(p / q) = ln(p / (1 – p)) Hvis p = 0,4 L = ln (0,4 / (1 - 0,4)) L = ln (0,4 / 0,6) L = ln (0,6667) L = - 0,405 SOS3003/JFRYE

31 3: Fra O til p: p / (1 – p) = O p = O / (1 + O) Hvis O = 5
SOS3003/JFRYE

32 4: Fra O til L: L = ln (O) Hvis O = 5 L = ln(5) L = 1,609
SOS3003/JFRYE

33 5: Fra L til O: O = e L Hvis L = 1,2 O = e 1,2 O = 3,320 SOS3003/JFRYE

34 6: Fra L til p: p = 1 / (1 + e -L) Hvis L = 0,4 Hvis L = - 0,4
p = 1 / (1+ e -0,4) p = 1 / (1+ e –(-0,4)) p = 1 / (1 + (1 / e0,4)) p = 1 / (1 + e 0,4) p = 1 / (1 + (1 / 1,492)) p = 1 / (2,492) p = 1 / (1 + (0,670) p = 0,401 p = 1 / (1,670) p = 0,599 SOS3003/JFRYE


Laste ned ppt "Tolkning av resultatene fra logistisk regresjon"

Liknende presentasjoner


Annonser fra Google