Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Mer grunnleggende matte: Forberedelse til logistisk regresjon

Liknende presentasjoner


Presentasjon om: "Mer grunnleggende matte: Forberedelse til logistisk regresjon"— Utskrift av presentasjonen:

1 Mer grunnleggende matte: Forberedelse til logistisk regresjon
Sannsynlighet Odds Logaritmer SOS3003/JFRYE

2 Sannsynligheter Logistisk regresjon:
avhengig variabel har bare to verdier: 0 og 1 Enten/eller-tankegang - enten så er man gift (y=1), eller så er man ikke gift (y=0) enten så stemmer man Ap (y=1), eller så stemmer man ikke Ap (y=0) enten så er man jente (y=1), eller så er man gutt (y=0) - enten har man melkekvote (y=1), eller så har man ingen melkekvote (y=0) …og så videre… Logistisk regresjon er estimering av sannsynligheten (p) for at y = 1 SOS3003/JFRYE

3 Observert sannsynlighet
Styrkeforholdet mellom y = 1 og y = 0 Hvis det er 300 som har rød skjorte (y = 1) og 100 som ikke har rød skjorte (y = 0)? p(y=1) = 300 / 400 p(y=1) = 0,75 Eller rett og slett: p = 0,75 Prosent = p * 100 Det er 75 prosent sannsynlighet for at man har rød skjorte. SOS3003/JFRYE

4 Observert sannsynlighet
Hva er sannsynligheten for at man ikke har rød skjorte? q = 100 / 400 q = 0,25 Summen av p og q er – per definisjon – alltid 1,0 p + q = 1,0 q = 1,0 - p q = 1 – 0,75 = 0,25 Det er 25 prosent sjanse for at man ikke har rød skjorte SOS3003/JFRYE

5 Observert sannsynlighet
0,01 1 prosent 0,05 5 prosent 0, prosent 0, prosent …og så videre Hvorfor er p + q alltid 1,0? Hvorfor er alltid 0 < p < 1? Hvorfor er alltid 0 < q < 1? SOS3003/JFRYE

6 Odds Egentlig bare en annen måte å uttrykke sannsynlighet på
Oddsen er et uttrykk for forholdet mellom (y=1) og (y=0) - sannsynligheten for at man er gift mot at man ikke er gift - sannsynligheten for at man er sosiolog mot at man ikke er sosiolog - sannsynligheten for at man er H-velger mot at man ikke er H-velger - sannsynligheten for at man stryker mot at man ikke stryker …og så videre… Hvis oddsen for at man er gift er 5 mot 1, så betyr det at det er fem ganger mer sannsynlig at man er gift enn at man ikke er det. Det første tall som nevnes: At (y = 1) Det andre tallet som nevnes: At (y = 0) SOS3003/JFRYE

7 Odds Hvis det første tallet er større enn det andre… oddsen er 5 mot 1
…så er det større sjanse for at (y = 1) enn at (y = 0) SOS3003/JFRYE

8 Odds Hvis det andre tallet er større enn det første… oddsen er 1 mot 5
…så er det mindre sjanse for at (y = 1) enn at (y = 0) SOS3003/JFRYE

9 Odds Hvis tallene er like store oddsen er 1 mot 1
…så er det sjansen for at (y = 1) like stor som at (y = 0) SOS3003/JFRYE

10 Odds Hvordan beregner man oddsen? Deler sjansen for (y=1) på (y=0),
dvs. p / q Hvis p = 0,75 og q=0,25 O = 0,75 / 0,25 O = 3 (mot 1) Det er styrkeforholdet mellom de to tallene som er viktig: 3 mot 1 gir O = 3 300 mot 100 gir O = 3 0,75 mot 0,25 gir O = 3 SOS3003/JFRYE

11 Odds 300: Ap-velgere 700: ikke Ap-velgere (1000 totalt i utvalget)
Eks.: Sjansen for å være Ap-velger er 300/1000 p(Ap-velger) = 0,30 P(ikke Ap-velger) = 0,70 Oddsen for å være Ap-velger er 300 mot 700, 3 mot 7, eller 0,30 mot 0,70 O = 300 / 700 = 3 / 7 = 0,30 / 0,70 O = 0,43 Oddsen for å være Ap-velger er 0,43 SOS3003/JFRYE

12 Odds Oddsen går fra 0 til uendelig stort
Hvis O = 0, så betyr det at det er absolutt ingen sannsynlighet for (p=1) p(y=1) = 0, p(y=0) = 1 O = 0 / 1 O = 0 Hvis O = uendelig stort, så betyr det at det er absolutt sannsynlighet for (p=1) p(y=1) = 1, p(y=0) = 0 O = 1 / 0 O = uendelig stort SOS3003/JFRYE

13 Odds Eks.: y=1 betyr at man får A y=0 betyr at man ikke får A
Odds mindre enn 1: p(y=1) < p(y=0) Mindre sjanse for at man får A enn at man ikke får A Odds = 1: p(y=1) = p(y=0) Like stor sjanse for at man får A som at man ikke får A Odds større enn 1: p(y=1) > p(y=0) Større sjanse for at man får A enn at man ikke får A SOS3003/JFRYE

14 Odds p q O 0,10 0,90 0,11 0,20 0,80 0,25 0,30 0,70 0,43 0,40 0,60 0,67 0,50 1,00 1,50 2,33 4,00 9,00 0,00001 0,99999 0,00…….1 999999,00 SOS3003/JFRYE

15 Logaritmer Richter’s skala fungerer slik at et jordskjelv med
- styrke 2 er 10 ganger så kraftig som et jordskjelv med styrke 1 - styrke 3 er 10 ganger så kraftig som et jordskjelv med styrke 2 - osv… Et jordskjelv med styrke 8 er dermed 10 ganger så sterkt som et med styrke 7, 100 ganger så sterkt som et med styrke 6, etc... SOS3003/JFRYE

16 Logaritmer Regning som bruker potenser: I stedet for å si tallet, så sier man tallet som ’basen’ må opphøyes i for å få dette tallet. Hvis ’basen’ er 10 Logartimen til 100 er 2 fordi 100 = 102 Logartimen til 1000 er 3 fordi 1000 = 103 Logartimen til er 4 fordi = 104 Logartimen til 10 er 1 fordi 10 = 101 Logartimen til 1 er 0 fordi 1 = 100 Husk fra matte’n i 1. forelesning a0 = 1 per definisjon Logartimen til 0,1 er -1 fordi 0,1 = 10-1 Logartimen til 0,001 er -3 fordi 0,001 = 10-3 Logartimen til 0,00001 er -5 fordi 0,00001 = 10-5 SOS3003/JFRYE

17 Logaritmer Flere eksempler….
Logartimen til 4 er 0,602 fordi 4 = 100,602 Logartimen til 3 er 0,477 fordi 3 = 100,477 Logartimen til 317 er 2,501 fordi 317 = 102,501 Logartimen til er 6,653 fordi = 106,653 SOS3003/JFRYE

18 Logaritmer Man kan variere ’basen’ – men 10 er den vanligste basen.
Dog – i logistisk regresjon tar man utgangspunkt i en annen base… …nemlig tallet 2,718…, e Dette kalles den naturlige logaritmen Fungerer på samme måte som 10-logaritmen 2,718 = e1 2,7181 = 2,7 2,7182 = 7,389 2,71810 = ,466 SOS3003/JFRYE SOS3003/JFRYE

19 Logaritmer Språklig huskeregel log (10) = 1 ’Logaritmen til 10 er 1’
Hvilket tall må man opphøye 10 i for å få 10? Jo: 1 ln (2,718) = 1 ’Den naturlige logaritmen til 2,718 er 1’ Hvilket tall må man opphøye e i for å få 2,718? Jo: 1 (Hvilket tall må man opphøye e i for å få e?) Logaritmen … = ’potenstallet’ SOS3003/JFRYE SOS3003/JFYE

20 Logaritmer Hva skjer her: 10 log (10) = 10 10 1 = 10 eln (e) = e
2,7181 = 2,718 SOS3003/JFRYE

21 1: Hva er p og q i dette tilfellet 2: Hva er oddsen i dette tilfellet
Oppgave: Formuler ulike tester der utfallet kan ha to utfall; enten p=1 eller p=0. 1: Hva er p og q i dette tilfellet 2: Hva er oddsen i dette tilfellet 3: Hva er den naturlig logaritmen til oddsen i dette tilfellet? Eksempel: Vinner RBK fotballserien for menn? 1: p = 0,75, q = 0,25 2: O = 0,75 / 0,25 = 3 (’3 mot 1’) 3: ln (3) = 1,0986 (den naturlig logaritmen til oddsen for at RBK vinner fotballserien for menn er 1,0986) SOS3003/JFRYE

22 1: Fra p til O: O = p / q q = (1 - p) O = p / (p - 1) Hvis p = 0,4
SOS3003/JFRYE

23 L = ln(O) = ln(p / q) = ln(p / (1 – p))
2: Fra p til L: L = ln(O) = ln(p / q) = ln(p / (1 – p)) Hvis p = 0,4 L = ln (0,4 / (1 - 0,4)) L = ln (0,4 / 0,6) L = ln (0,6667) L = - 0,405 SOS3003/JFRYE

24 3: Fra O til p: p / (1 – p) = O p = O / (1 + O) Hvis O = 5
SOS3003/JFRYE

25 4: Fra O til L: L = ln (O) Hvis O = 5 L = ln(5) L = 1,609
SOS3003/JFRYE

26 5: Fra L til O: O = e L Hvis L = 1,2 O = e 1,2 O = 3,320 SOS3003/JFRYE

27 6: Fra L til p: p = 1 / (1 + e -L) Hvis L = 0,4 Hvis L = - 0,4
p = 1 / (1+ e -0,4) p = 1 / (1+ e –(-0,4)) p = 1 / (1 + (1 / e0,4)) p = 1 / (1 + e 0,4) p = 1 / (1 + (1 / 1,492)) p = 1 / (2,492) p = 1 / (1 + (0,670) p = 0,401 p = 1 / (1,670) p = 0,599 SOS3003/JFRYE


Laste ned ppt "Mer grunnleggende matte: Forberedelse til logistisk regresjon"

Liknende presentasjoner


Annonser fra Google