Mer grunnleggende matte: Forberedelse til logistisk regresjon

Slides:



Advertisements
Liknende presentasjoner
12.Studienreise nach Finnland,
Advertisements

Kvinner og politikk Kvinnelig valgmobilisering i Nord-Norge: Glasstak eller etterslep? Marcus Buck.
Kapittel 7 Vekst og modellfunksjoner Bård Knudsen.
”BRØK-, DESIMAL- OG PROSENTPLATER”
Litt mer om PRIMTALL.
1 Sannsynlighetsregning Gjenfinningssystemer og verktøy II Jon Anjer.
Grafisk design Visuell kommunikasjon
Produktkalkulasjon Læringsmål i kapitlet:
• Ungdom, arbeid, skatt • Svart økonomi
Gjenfinningssystemer og verktøy II
Tallord.
Prosent og forhold - repetisjon
Møre og Romsdal. 2 Ligger det et bedehus eller et kristelig forsamlingshus (ikke kirke) i nærheten av der du bor? (n=502) i prosent.
Grunnleggende spørsmål om naturfag
Enkel forklaring av hvordan bygge nettverk i euroSMART!
Kap 09 Kontinuerlige fordelingsfunksjoner
Grunnleggende matematikk
Tolkning av resultatene fra logistisk regresjon
Noen hoderegningstriks
Gjenfinningssystemer og verktøy II
Prosjektanalyser Anskaffelse av eiendeler til “varig eie” eller bruk av selskapet i en periode på min. 3 år, f.eks til erstatning av eksisterende utstyr.
Kapittel 14 Simulering.
Kompleksitetsanalyse
Transformasjoner Men hva hvis relasjonen er kurvelinjær?
Om semesteroppgaven Krav til den avhengige variabelen
Anvendt statistisk dataanalyse i samfunnsvitenskap
Forside Motivasjon Analyse Forside Motivasjon Analyse  -notasjon O og  Relasjoner Klasser Fallgruver Spørsmål Kompleksitetsanalyse Åsmund Eldhuset asmunde.
Tildeling av lasterom. LOG530 Distribusjonsplanlegging 2 2 Et bulkskip skal lastes med tørrlast til Ghana. En ønsker å frakte totalt 4 ulike varetyper.
P-MP modeller. LOG530 Distribusjonsplanlegging 2 2 Det skal opprettes p fasiliteter (lager) for å betjene en gitt mengde kunder. Kundenodene er også potensielle.
P-CP modeller. LOG530 Distribusjonsplanlegging 2 2 Det skal opprettes p fasiliteter for å betjene en gitt mengde kunder. Kundenodene er også potensielle.
Highlights fra markedsundersøkelse Utarbeidet av Inger Marie Brun,
Klargjøring fra forrige gang
MET 2211 Statistikk og dataanalyse
Kap 13 Sammenligning av to grupper
Kap 06 Diskrete stokastiske variable
Klepp Kvinner Elite m arkedsføringshuset 1 Rapport på merkevareundersøkelse for Klepp Kvinner Elite Januar 2008.
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
© Synovate Gjennomført av Synovate 21.august 2008 Catibus uke 33 Norsk Fysioterapeutforbund.
Norges Bank 1 Hovedstyremøte 20. april Norges Bank 2 Global og regional vekst – tall fra IMF Kilde: IMF.
Kapittel 1, oppgave b) å kaste loss å seile uvær (n) kuling (m)
Statistikk på 20 2 timer PSY-1002
GRØNNALGER BRUNALGER RØDALGER
1 BM-dagen 29.okt BM1 Fysisk miljøplanlegging Studieprogram for Bygg- og miljøteknikk Meny Prosjektoppgaven Arealbruk og befolkning Transport og.
Anvendt statistisk dataanalyse i samfunnsvitenskap
1: Fra p til O: O = p / q q = (1 - p) O = p / (p - 1) Hvis p = 0,4 O = 0,4 / (1 - 0,4) O = 0,4 / 0,6 O = 0,6667 SOS3003/JFRYE.
Sponsoravdelingen: Stig Larsen , Sponsorsjef tlf
Figur 1 Behov. Figur 2 Behov Figur 3 Prioritering/ressursinnsats.
Undersøkelse om undervisningsmateriell for psykisk helse
Åpne en luke hver dag og få en gave
LEDIGE LOKALER TIL LEIE PÅ VÆRSTE-OMRÅDET
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
LR-Akademi Grunnlag markedsføringsplan LR-Akademi LRs forretningsmodell.
LR-Akademi Lederbonus.
Diskrete stokastiske variable
SINTEF-undersøkelsen om salting og trafikksikkerhet
Kapittel 6 oppgave k Skriv om slik at setningene betyr omtrent det samme.
Inflation og produktion 11. Makroøkonomi Teori og beskrivelse 4.udg. © Limedesign
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Dagligbankundersøkelsen 2014
Innvandring og migrasjon - Nøkkeltall -
Presentasjon av data: deskriptiv statistikk
Kapittel 1, oppgave i) Sett inn preposisjoner eller adverb som passer.
Dagligbankundersøkelsen Fakta Dagligbankundersøkelsen intervju Befolkning 15 år + TNS Gallup Forfatter Bente Pettersen Roar Thorvaldsen.
Befolkning og arbejdsmarked 7. Mikroøkonomi Teori og beskrivelse © Limedesign
Sett inn preposisjoner eller adverb som passer.
Hypotesetesting, og kontinuerlige stokastiske variable
Mål for sentraltendens:
Siste forelesning er i morgen!
Basisgrupper en nær professoren-opplevelse Knut Kaasen Nordisk institutt for sjørett Det juridiske fakultet Knut Kaasen 1.
A2A / A2B M1 årskurs 4. november 2009
Utskrift av presentasjonen:

Mer grunnleggende matte: Forberedelse til logistisk regresjon Sannsynlighet Odds Logaritmer SOS3003/JFRYE

Sannsynligheter Logistisk regresjon: avhengig variabel har bare to verdier: 0 og 1 Enten/eller-tankegang - enten så er man gift (y=1), eller så er man ikke gift (y=0) enten så stemmer man Ap (y=1), eller så stemmer man ikke Ap (y=0) enten så er man jente (y=1), eller så er man gutt (y=0) - enten har man melkekvote (y=1), eller så har man ingen melkekvote (y=0) …og så videre… Logistisk regresjon er estimering av sannsynligheten (p) for at y = 1 SOS3003/JFRYE

Observert sannsynlighet Styrkeforholdet mellom y = 1 og y = 0 Hvis det er 300 som har rød skjorte (y = 1) og 100 som ikke har rød skjorte (y = 0)? p(y=1) = 300 / 400 p(y=1) = 0,75 Eller rett og slett: p = 0,75 Prosent = p * 100 Det er 75 prosent sannsynlighet for at man har rød skjorte. SOS3003/JFRYE

Observert sannsynlighet Hva er sannsynligheten for at man ikke har rød skjorte? q = 100 / 400 q = 0,25 Summen av p og q er – per definisjon – alltid 1,0 p + q = 1,0 q = 1,0 - p q = 1 – 0,75 = 0,25 Det er 25 prosent sjanse for at man ikke har rød skjorte SOS3003/JFRYE

Observert sannsynlighet 0,01 1 prosent 0,05 5 prosent 0,25 25 prosent 0,77 77 prosent …og så videre Hvorfor er p + q alltid 1,0? Hvorfor er alltid 0 < p < 1? Hvorfor er alltid 0 < q < 1? SOS3003/JFRYE

Odds Egentlig bare en annen måte å uttrykke sannsynlighet på Oddsen er et uttrykk for forholdet mellom (y=1) og (y=0) - sannsynligheten for at man er gift mot at man ikke er gift - sannsynligheten for at man er sosiolog mot at man ikke er sosiolog - sannsynligheten for at man er H-velger mot at man ikke er H-velger - sannsynligheten for at man stryker mot at man ikke stryker …og så videre… Hvis oddsen for at man er gift er 5 mot 1, så betyr det at det er fem ganger mer sannsynlig at man er gift enn at man ikke er det. Det første tall som nevnes: At (y = 1) Det andre tallet som nevnes: At (y = 0) SOS3003/JFRYE

Odds Hvis det første tallet er større enn det andre… oddsen er 5 mot 1 …så er det større sjanse for at (y = 1) enn at (y = 0) SOS3003/JFRYE

Odds Hvis det andre tallet er større enn det første… oddsen er 1 mot 5 …så er det mindre sjanse for at (y = 1) enn at (y = 0) SOS3003/JFRYE

Odds Hvis tallene er like store oddsen er 1 mot 1 …så er det sjansen for at (y = 1) like stor som at (y = 0) SOS3003/JFRYE

Odds Hvordan beregner man oddsen? Deler sjansen for (y=1) på (y=0), dvs. p / q Hvis p = 0,75 og q=0,25 O = 0,75 / 0,25 O = 3 (mot 1) Det er styrkeforholdet mellom de to tallene som er viktig: 3 mot 1 gir O = 3 300 mot 100 gir O = 3 0,75 mot 0,25 gir O = 3 SOS3003/JFRYE

Odds 300: Ap-velgere 700: ikke Ap-velgere (1000 totalt i utvalget) Eks.: Sjansen for å være Ap-velger er 300/1000 p(Ap-velger) = 0,30 P(ikke Ap-velger) = 0,70 Oddsen for å være Ap-velger er 300 mot 700, 3 mot 7, eller 0,30 mot 0,70 O = 300 / 700 = 3 / 7 = 0,30 / 0,70 O = 0,43 Oddsen for å være Ap-velger er 0,43 SOS3003/JFRYE

Odds Oddsen går fra 0 til uendelig stort Hvis O = 0, så betyr det at det er absolutt ingen sannsynlighet for (p=1) p(y=1) = 0, p(y=0) = 1 O = 0 / 1 O = 0 Hvis O = uendelig stort, så betyr det at det er absolutt sannsynlighet for (p=1) p(y=1) = 1, p(y=0) = 0 O = 1 / 0 O = uendelig stort SOS3003/JFRYE

Odds Eks.: y=1 betyr at man får A y=0 betyr at man ikke får A Odds mindre enn 1: p(y=1) < p(y=0) Mindre sjanse for at man får A enn at man ikke får A Odds = 1: p(y=1) = p(y=0) Like stor sjanse for at man får A som at man ikke får A Odds større enn 1: p(y=1) > p(y=0) Større sjanse for at man får A enn at man ikke får A SOS3003/JFRYE

Odds p q O 0,10 0,90 0,11 0,20 0,80 0,25 0,30 0,70 0,43 0,40 0,60 0,67 0,50 1,00 1,50 2,33 4,00 9,00 0,00001 0,99999 0,00…….1 999999,00 SOS3003/JFRYE

Logaritmer Richter’s skala fungerer slik at et jordskjelv med - styrke 2 er 10 ganger så kraftig som et jordskjelv med styrke 1 - styrke 3 er 10 ganger så kraftig som et jordskjelv med styrke 2 - osv… Et jordskjelv med styrke 8 er dermed 10 ganger så sterkt som et med styrke 7, 100 ganger så sterkt som et med styrke 6, etc... SOS3003/JFRYE

Logaritmer Regning som bruker potenser: I stedet for å si tallet, så sier man tallet som ’basen’ må opphøyes i for å få dette tallet. Hvis ’basen’ er 10 Logartimen til 100 er 2 fordi 100 = 102 Logartimen til 1000 er 3 fordi 1000 = 103 Logartimen til 10000 er 4 fordi 10000 = 104 Logartimen til 10 er 1 fordi 10 = 101 Logartimen til 1 er 0 fordi 1 = 100 Husk fra matte’n i 1. forelesning a0 = 1 per definisjon Logartimen til 0,1 er -1 fordi 0,1 = 10-1 Logartimen til 0,001 er -3 fordi 0,001 = 10-3 Logartimen til 0,00001 er -5 fordi 0,00001 = 10-5 SOS3003/JFRYE

Logaritmer Flere eksempler…. Logartimen til 4 er 0,602 fordi 4 = 100,602 Logartimen til 3 er 0,477 fordi 3 = 100,477 Logartimen til 317 er 2,501 fordi 317 = 102,501 Logartimen til 4.500.000 er 6,653 fordi 4.500.000= 106,653 SOS3003/JFRYE

Logaritmer Man kan variere ’basen’ – men 10 er den vanligste basen. Dog – i logistisk regresjon tar man utgangspunkt i en annen base… …nemlig tallet 2,718…, e Dette kalles den naturlige logaritmen Fungerer på samme måte som 10-logaritmen 2,718 = e1 2,7181 = 2,7 2,7182 = 7,389 2,71810 = 22.026,466 SOS3003/JFRYE SOS3003/JFRYE

Logaritmer Språklig huskeregel log (10) = 1 ’Logaritmen til 10 er 1’ Hvilket tall må man opphøye 10 i for å få 10? Jo: 1 ln (2,718) = 1 ’Den naturlige logaritmen til 2,718 er 1’ Hvilket tall må man opphøye e i for å få 2,718? Jo: 1 (Hvilket tall må man opphøye e i for å få e?) Logaritmen … = ’potenstallet’ SOS3003/JFRYE SOS3003/JFYE

Logaritmer Hva skjer her: 10 log (10) = 10 10 1 = 10 eln (e) = e 2,7181 = 2,718 SOS3003/JFRYE

1: Hva er p og q i dette tilfellet 2: Hva er oddsen i dette tilfellet Oppgave: Formuler ulike tester der utfallet kan ha to utfall; enten p=1 eller p=0. 1: Hva er p og q i dette tilfellet 2: Hva er oddsen i dette tilfellet 3: Hva er den naturlig logaritmen til oddsen i dette tilfellet? Eksempel: Vinner RBK fotballserien for menn? 1: p = 0,75, q = 0,25 2: O = 0,75 / 0,25 = 3 (’3 mot 1’) 3: ln (3) = 1,0986 (den naturlig logaritmen til oddsen for at RBK vinner fotballserien for menn er 1,0986) SOS3003/JFRYE

1: Fra p til O: O = p / q q = (1 - p) O = p / (p - 1) Hvis p = 0,4 SOS3003/JFRYE

L = ln(O) = ln(p / q) = ln(p / (1 – p)) 2: Fra p til L: L = ln(O) = ln(p / q) = ln(p / (1 – p)) Hvis p = 0,4 L = ln (0,4 / (1 - 0,4)) L = ln (0,4 / 0,6) L = ln (0,6667) L = - 0,405 SOS3003/JFRYE

3: Fra O til p: p / (1 – p) = O p = O / (1 + O) Hvis O = 5 SOS3003/JFRYE

4: Fra O til L: L = ln (O) Hvis O = 5 L = ln(5) L = 1,609 SOS3003/JFRYE

5: Fra L til O: O = e L Hvis L = 1,2 O = e 1,2 O = 3,320 SOS3003/JFRYE

6: Fra L til p: p = 1 / (1 + e -L) Hvis L = 0,4 Hvis L = - 0,4 p = 1 / (1+ e -0,4) p = 1 / (1+ e –(-0,4)) p = 1 / (1 + (1 / e0,4)) p = 1 / (1 + e 0,4) p = 1 / (1 + (1 / 1,492)) p = 1 / (2,492) p = 1 / (1 + (0,670) p = 0,401 p = 1 / (1,670) p = 0,599 SOS3003/JFRYE