Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

1 SOS3003/JFRYE Mer grunnleggende matte: Forberedelse til logistisk regresjon 1.Sannsynlighet 2.Odds 3.Logaritmer.

Liknende presentasjoner


Presentasjon om: "1 SOS3003/JFRYE Mer grunnleggende matte: Forberedelse til logistisk regresjon 1.Sannsynlighet 2.Odds 3.Logaritmer."— Utskrift av presentasjonen:

1 1 SOS3003/JFRYE Mer grunnleggende matte: Forberedelse til logistisk regresjon 1.Sannsynlighet 2.Odds 3.Logaritmer

2 2 Logistisk regresjon: - avhengig variabel har bare to verdier: 0 og 1 Enten/eller-tankegang - enten så er man gift (y=1), eller så er man ikke gift (y=0) - enten så stemmer man Ap (y=1), eller så stemmer man ikke Ap (y=0) - enten så er man jente (y=1), eller så er man gutt (y=0) - enten har man melkekvote (y=1), eller så har man ingen melkekvote (y=0) …og så videre… Logistisk regresjon er estimering av sannsynligheten (p) for at y = 1 Sannsynligheter SOS3003/JFRYE

3 3 Styrkeforholdet mellom y = 1 og y = 0 Hvis det er 300 som har rød skjorte (y = 1) og 100 som ikke har rød skjorte (y = 0)? p(y=1) = 300 / 400 p(y=1) = 0,75 Eller rett og slett: p = 0,75 Prosent = p * 100 Det er 75 prosent sannsynlighet for at man har rød skjorte. Observert sannsynlighet SOS3003/JFRYE

4 4 Hva er sannsynligheten for at man ikke har rød skjorte? q = 100 / 400 q = 0,25 Summen av p og q er – per definisjon – alltid 1,0 p + q = 1,0 q = 1,0 - p q = 1 – 0,75 = 0,25 Det er 25 prosent sjanse for at man ikke har rød skjorte Observert sannsynlighet SOS3003/JFRYE

5 5 0,011 prosent 0,055 prosent 0,2525 prosent 0,7777 prosent …og så videre Hvorfor er p + q alltid 1,0? Hvorfor er alltid 0 < p < 1? Hvorfor er alltid 0 < q < 1? Observert sannsynlighet SOS3003/JFRYE

6 6 Egentlig bare en annen måte å uttrykke sannsynlighet på Oddsen er et uttrykk for forholdet mellom (y=1) og (y=0) - sannsynligheten for at man er gift mot at man ikke er gift - sannsynligheten for at man er sosiolog mot at man ikke er sosiolog - sannsynligheten for at man er H-velger mot at man ikke er H-velger - sannsynligheten for at man stryker mot at man ikke stryker …og så videre… Hvis oddsen for at man er gift er 5 mot 1, så betyr det at det er fem ganger mer sannsynlig at man er gift enn at man ikke er det. Det første tall som nevnes: At (y = 1) Det andre tallet som nevnes: At (y = 0) Odds SOS3003/JFRYE

7 7 Hvis det første tallet er større enn det andre… - oddsen er 5 mot 1 - oddsen er 10 mot 1 - oddsen er mot 1 - oddsen er 5 mot 2 - oddsen er 10 mot 2 …så er det større sjanse for at (y = 1) enn at (y = 0) Odds SOS3003/JFRYE

8 8 Hvis det andre tallet er større enn det første… - oddsen er 1 mot 5 - oddsen er 1 mot 10 - oddsen er 1 mot oddsen er 2 mot 5 - oddsen er 2 mot 10 …så er det mindre sjanse for at (y = 1) enn at (y = 0) Odds SOS3003/JFRYE

9 9 Hvis tallene er like store - oddsen er 1 mot 1 …så er det sjansen for at (y = 1) like stor som at (y = 0) Odds SOS3003/JFRYE

10 10 Hvordan beregner man oddsen? Deler sjansen for (y=1) på (y=0), dvs. p / q Hvis p = 0,75 og q=0,25 O = 0,75 / 0,25 O = 3 (mot 1) Det er styrkeforholdet mellom de to tallene som er viktig: 3 mot 1 gir O = mot 100 gir O = 3 0,75 mot 0,25gir O = 3 Odds SOS3003/JFRYE

11 11 300: Ap-velgere 700: ikke Ap-velgere (1000 totalt i utvalget) Eks.: Sjansen for å være Ap-velger er 300/1000 p(Ap-velger) = 0,30 P(ikke Ap-velger) = 0,70 Oddsen for å være Ap-velger er 300 mot 700, 3 mot 7, eller 0,30 mot 0,70 O = 300 / 700 = 3 / 7 = 0,30 / 0,70 O = 0,43 Oddsen for å være Ap-velger er 0,43 Odds SOS3003/JFRYE

12 12 Oddsen går fra 0 til uendelig stort Hvis O = 0, så betyr det at det er absolutt ingen sannsynlighet for (p=1) p(y=1) = 0, p(y=0) = 1 O = 0 / 1 O = 0 Hvis O = uendelig stort, så betyr det at det er absolutt sannsynlighet for (p=1) p(y=1) = 1, p(y=0) = 0 O = 1 / 0 O = uendelig stort Odds SOS3003/JFRYE

13 13 Eks.: y=1 betyr at man får A y=0 betyr at man ikke får A Odds mindre enn 1: p(y=1) < p(y=0) Mindre sjanse for at man får A enn at man ikke får A Odds = 1: p(y=1) = p(y=0) Like stor sjanse for at man får A som at man ikke får A Odds større enn 1: p(y=1) > p(y=0) Større sjanse for at man får A enn at man ikke får A Odds SOS3003/JFRYE

14 14 Odds pqO 0,100,900,11 0,200,800,25 0,300,700,43 0,400,600,67 0,50 1,00 0,600,401,50 0,700,302,33 0,800,204,00 0,900,109,00 0,000010,999990,00…….1 0,999990, ,00 SOS3003/JFRYE

15 15 Richter’s skala fungerer slik at et jordskjelv med - styrke 2 er 10 ganger så kraftig som et jordskjelv med styrke 1 - styrke 3 er 10 ganger så kraftig som et jordskjelv med styrke 2 - osv… Et jordskjelv med styrke 8 er dermed 10 ganger så sterkt som et med styrke 7, 100 ganger så sterkt som et med styrke 6, etc... Logaritmer SOS3003/JFRYE

16 16 Regning som bruker potenser: I stedet for å si tallet, så sier man tallet som ’basen’ må opphøyes i for å få dette tallet. Hvis ’basen’ er 10 Logartimen til 100 er 2 fordi 100 = 10 2 Logartimen til 1000 er 3fordi 1000 = 10 3 Logartimen til er 4 fordi = 10 4 Logartimen til 10 er 1fordi 10 = 10 1 Logartimen til 1 er 0fordi 1 = 10 0 Husk fra matte’n i 1. forelesninga 0 = 1 per definisjon Logartimen til 0,1 er -1fordi 0,1 = Logartimen til 0,001 er -3fordi 0,001 = Logartimen til 0,00001 er -5fordi 0,00001 = Logaritmer SOS3003/JFRYE

17 17 Flere eksempler…. Logartimen til 4 er 0,602fordi 4 = 10 0,602 Logartimen til 3 er 0,477fordi 3 = 10 0,477 Logartimen til 317 er 2,501fordi 317 = 10 2,501 Logartimen til er 6,653fordi = 10 6,653 Logaritmer SOS3003/JFRYE

18 18 Man kan variere ’basen’ – men 10 er den vanligste basen. Dog – i logistisk regresjon tar man utgangspunkt i en annen base… …nemlig tallet 2,718…, e Dette kalles den naturlige logaritmen Fungerer på samme måte som 10-logaritmen 2,718 = e 1 2,718 1 = 2,7 2,718 2 = 7,389 2, = ,466 SOS3003/JFRYE Logaritmer SOS3003/JFRYE

19 19 Språklig huskeregel log (10) = 1 ’Logaritmen til 10 er 1’ Hvilket tall må man opphøye 10 i for å få 10? Jo: 1 ln (2,718) = 1 ’Den naturlige logaritmen til 2,718 er 1’ Hvilket tall må man opphøye e i for å få 2,718? Jo: 1 (Hvilket tall må man opphøye e i for å få e?) Logaritmen … = ’potenstallet’ SOS3003/JFYE Logaritmer SOS3003/JFRYE

20 20 Hva skjer her: 10 log (10) = = 10 e ln (e) = e e 1 = e 2,718 1 = 2,718 Logaritmer SOS3003/JFRYE

21 21 Oppgave: Formuler ulike tester der utfallet kan ha to utfall; enten p=1 eller p=0. 1: Hva er p og q i dette tilfellet 2: Hva er oddsen i dette tilfellet 3: Hva er den naturlig logaritmen til oddsen i dette tilfellet? Eksempel: Vinner RBK fotballserien for menn? 1: p = 0,75, q = 0,25 2: O = 0,75 / 0,25 = 3 (’3 mot 1’) 3: ln (3) = 1,0986 (den naturlig logaritmen til oddsen for at RBKvinner fotballserien for menn er 1,0986) SOS3003/JFRYE

22 22 1: Fra p til O: O = p / q q = (1 - p) O = p / (p - 1) Hvis p = 0,4 O = 0,4 / (1 - 0,4) O = 0,4 / 0,6 O = 0,6667 SOS3003/JFRYE

23 23 2: Fra p til L: L = ln(O) = ln(p / q) = ln(p / (1 – p)) Hvis p = 0,4 L = ln (0,4 / (1 - 0,4)) L = ln (0,4 / 0,6) L = ln (0,6667) L = - 0,405 SOS3003/JFRYE

24 24 3: Fra O til p: p / (1 – p) = O p = O / (1 + O) Hvis O = 5 p = 5 / p = 5 / 6 p = 0,8333 SOS3003/JFRYE

25 25 4: Fra O til L: L = ln (O) Hvis O = 5 L = ln(5) L = 1,609 SOS3003/JFRYE

26 26 5: Fra L til O: O = e L Hvis L = 1,2 O = e 1,2 O = 3,320 SOS3003/JFRYE

27 27 6: Fra L til p: p = 1 / (1 + e -L ) Hvis L = 0,4Hvis L = - 0,4 p = 1 / (1+ e -0,4 ) p = 1 / (1+ e –(-0,4) ) p = 1 / (1 + (1 / e 0,4 ))p = 1 / (1 + e 0,4 ) p = 1 / (1 + (1 / 1,492))p = 1 / (2,492) p = 1 / (1 + (0,670)p = 0,401 p = 1 / (1,670) p = 0,599 SOS3003/JFRYE


Laste ned ppt "1 SOS3003/JFRYE Mer grunnleggende matte: Forberedelse til logistisk regresjon 1.Sannsynlighet 2.Odds 3.Logaritmer."

Liknende presentasjoner


Annonser fra Google