Kap 09 Kontinuerlige fordelingsfunksjoner

Slides:

Advertisements

Liknende presentasjoner

12.Studienreise nach Finnland,

Advertisements

Prissetting i norske bedrifter. Resultater fra en spørreundersøkelse

Kvinner og politikk Kvinnelig valgmobilisering i Nord-Norge: Glasstak eller etterslep? Marcus Buck.

Litt mer om PRIMTALL.

Kap 07 Diskrete sannsynlighetsfordelinger

Kap 12 Korrelasjon / Regresjon

Møre og Romsdal. 2 Ligger det et bedehus eller et kristelig forsamlingshus (ikke kirke) i nærheten av der du bor? (n=502) i prosent.

Kap 10 Estimering.

STATISTISK GENERALISERING

Monopolistisk konkurranse og oligopol

Kap 05 Betinget sannsynlighet

Fra forelesningene om involveringspedagogikk Et utviklingsarbeid Philip Dammen Manuset er under arbeid.

Statistikk og hydrologi

Kurs i praktisk bruk av Bayesianske metoder.

Hvordan får man data og modell til å passe sammen?

Hvordan får man data og modell til å passe sammen?

Oslo kommune Utdanningsetaten Hva er en god elev og en god lærer? Presentasjon av miniundersøkelsen på ungdomsskoler og videregående skoler Høsten 2009.

Figur 3.2 Faste kostnader pr. Enhet ved ulike aktivitetsnivåer

Binomiske trær Chapter 12.

Valuing Stock Options:The Black-Scholes-Merton Model

Kapittel 14 Simulering.

Transformasjoner Men hva hvis relasjonen er kurvelinjær?

Mer grunnleggende matte: Forberedelse til logistisk regresjon

Uni-, bi- og multivariate analyser

Foreløpige tall pr Randi Sæther

P-MP modeller. LOG530 Distribusjonsplanlegging 2 2 Det skal opprettes p fasiliteter (lager) for å betjene en gitt mengde kunder. Kundenodene er også potensielle.

P-CP modeller. LOG530 Distribusjonsplanlegging 2 2 Det skal opprettes p fasiliteter for å betjene en gitt mengde kunder. Kundenodene er også potensielle.

Highlights fra markedsundersøkelse Utarbeidet av Inger Marie Brun,

Kap 13 Sammenligning av to grupper

Kap 06 Diskrete stokastiske variable

Kap 08 Kontinuerlige stokastiske variable

Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.

SINTEF Teknologi og samfunn PUS-prosjektet Jan Alexander Langlo og Linda C. Hald 1 Foreløpig oppsummering – underlag for diskusjon på PUS-forum

GRØNNALGER BRUNALGER RØDALGER

1 BM-dagen 29.okt BM1 Fysisk miljøplanlegging Studieprogram for Bygg- og miljøteknikk Meny Prosjektoppgaven Arealbruk og befolkning Transport og.

Anvendt statistisk dataanalyse i samfunnsvitenskap

Figur 1 Behov. Figur 2 Behov Figur 3 Prioritering/ressursinnsats.

Eiendomsmeglerbransjens boligprisstatistikk Februar 2011 Norges Eiendomsmeglerforbund og Eiendomsmeglerforetakenes Forening ECON Poyry og FINN.

LEDIGE LOKALER TIL LEIE PÅ VÆRSTE-OMRÅDET

Bankenes sikringsfond Revisjonskontoret

Samdata 2012 Somatikk.

Virksomhetsrapport Oktober Innhold 1. Oppsummering 2. Hovedmål 3. Pasient 5. Aktivitet 4. Bemanning 6. Økonomi 7. Klinikker 2.

Diskrete stokastiske variable

To accompany Quantitative Analysis for Management, 8e by Render/Stair/Hanna 15-1 © 2003 by Prentice Hall, Inc. Upper Saddle River, NJ Kapittel 15.

Inflation og produktion 11. Makroøkonomi Teori og beskrivelse 4.udg. © Limedesign

Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.

Virksomhetsrapport August Innhold 1. Oppsummering 2. Hovedmål 3. Pasient 5. Aktivitet 4. Bemanning 6. Økonomi 7. Klinikker 2.

Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral

Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral

Presentasjon av data: deskriptiv statistikk

Dagligbankundersøkelsen Fakta Dagligbankundersøkelsen intervju Befolkning 15 år + TNS Gallup Forfatter Bente Pettersen Roar Thorvaldsen.

Befolkning og arbejdsmarked 7. Mikroøkonomi Teori og beskrivelse © Limedesign

Bayesiansk statistikk Petter Mostad Overblikk Tilbakeblikk på sannsynlighetsbegrepet Hvordan gjøre Bayesianske analyser Analyser ved hjelp.

Hypotesetesting, og kontinuerlige stokastiske variable

TMA 4245 Statistikk Mandag Les dette Powerpointmalen inneholder 3 forskjellige tittel-ark som du kan velge mellom. I tillegg kan du velge lys.

Forelesning 4 HSTAT1101 Ola Haug Norsk Regnesentral

Siste forelesning er i morgen!

Regresjon Petter Mostad

Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral

Mål for timene Forstå hvordan vi ved hjelp av et variogram kan uttrykke den romlige variasjonen til en tilfeldig variabel.

Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.

MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Forventning, varians og standardavvik Tilnærming.

MAT0100V Sannsynlighetsregning og kombinatorikk

Repetisjon av sannsynlighetsregning

MAT0100V Sannsynlighetsregning og kombinatorikk

Irregulær sjø & havmiljøstatistikk Pensum litteratur

MET 2211 Statistikk og dataanalyse

forventning og varians

Utvalgsfordelinger (Kapittel 5)

Utskrift av presentasjonen:

Kap 09 Kontinuerlige fordelingsfunksjoner I dette kapitlet skal vi se på ulike kontinuerlige fordelingsfunksjoner<br> spesielt eksponensialfordling og normalfordeling.

Eksponensialfordeling Ventetid 1 X = Antall forekomster av A i løpet av en tid [0,t]. X Poisson-fordelt. T = Tidspunkt for første treff av A. La oss gå tilbake til Poissonfordelingen (fra kap 07) som kan benyttes til blant annet å registrere antall forekomster X av en bestemt hendelse A i løpet av en tid t (f.eks. antall kunder som ankommer en butikk i løpet av tiden t).<br> Vi antar at forutsetningene for at X er Poissonfordelt er tilstede. Sannsynlighetsfordelingen til X er gitt ved P(X=x).<br><br> Vi lar T være tiden fra t=0 til første forekomst av A (tiden fra butikken åpner til første kunde ankommer).<br> Vi ønker å finne fordelingsfunksjonen og sannsynlighetstettheten til T. T t Skal finne fordelingsfunksjonen og sannsynlighetstettheten til T.

Eksponensialfordeling Ventetid 2 Kumulativ fordelingsfunksjon til T: 1.0 F(t)  Sannsynlighetstettheten til T: f(t) T er tiden fra t=0 til første forekomst av A.<br> Vi skal finne:<br> - F(t) kumulativ fordelingsfunksjon til T<br> - f(t) sannsynlighetstettheten til T<br><br> Hendelsen {T>t} betyr ingen ankomst i løpet av tiden t (siden T betyr tid for første ankomst). {T>t} er altså det samme som X=0, ingen ankomst i tidsintervallet [0,t].<br> Herav: P(T>t) = P(X=0) = e^(-lambda x t).<br> Videre: F(t) = P(T<=t) = 1-P(T>t) = 1-e^(-lambda x t).<br> Sannsynlighetstettheten finner vi ved å derivere:<br> f(t) = F'(t) = lambda x e^(-lambda x t).<br><br> Fordelingen kalles <b>eksponensialfordelingen med parameter lambda</b>.<br> <b>T ~ eksp(lambda)</b><br><br> Fra definisjonen av forventning og varians kan det enkelt vises at (se neste side):<br> <b>E(T) = 1/lambda</b><br> <b>Var(T) = 1/(lambda)^2</b> Forventning: Varians:

Eksponensialfordeling Forventning Varians Sannsynlighetstettheten til T: Kumulativ fordelingsfunksjon til T: Forventning: Beregning av forventning E(T) og varians Var(T) for eksponensialfordelingen.<br> Beregningen er rett frem fra definisjonen av forventning og varians. Varians:

Gammafordeling Ventetid 3 Ventetid inntil forekomst nr r: Forventning: Beregningen av ventetid inntil første forekomst av en hendelse A slik som beskrevet på de foregående sidene kan generaliseres til å svare på følgende spørsmål:<br> Hva er <b>ventetiden T inntil forekomst nr r av hendelsen A</b>?<br<br> Det kan vises at sannsynlighetstettheten, forventningen og variansen til T er gitt som vist til venstre.<br><br> Fordelingen kalles <b>Gammafordelingen</b>. Forventning: Varians:

Gammafordeling Utledning av sannsynlighetstetthet T = Ventetid inntil forekomst nr r: Utledningen av sannsynlighetstettheten hvor vi studerer ventetid inntil forekomst nr r av A er analog med utledningen hvor ventetiden gjelder første forekomst av A, bortsett fra at vi nå må summere sannsynligheter for de r-1 første treff.

Gammafunksjon Def / Egenskaper For ethvert reelt tall r > 0, er gammafunksjonen av r definert ved: Gammafunksjonen har følgende egenskaper: Ikke overraskende benyttes ordet gammafordeling på de foregående sidene fordi fordelingen er nær knyttet til den såkalte gammafunksjonen.<br> Her vises definisjon av gammafunksjonen samt noen av gammafunksjonens egenskaper. Bl.a. legger vi merke til at vi kan definere fakultet vha gammafunksjonen.

Gammafordeling Def Med egenskapene til gammafunksjonen har vi nå fått en generalisering av r! : En stokastisk variabel X sies å ha en gammfordeling med parametre r og  når (både r og  må være positive): Med r! = gammafunksjonen av r+1 (se forrige side), samt definisjonen av gammafordelingen vist til venstre, kan vi nå forstå bruk av betegnelsen gammafordeling fra de foregående sidene.

Gammafordeling Forventning Varians Forventning: Varians: Beregning av forventning E(X) og varians Var(X) for gammafordelingen.<br> Noean av gammafunksjonens egenskaper er benyttet i utledningene.

Gammafordeling Eks: Nedbørberegninger. Daglig nedbør i Sydney, Australia i perioden 17.oktober - 7.november i årene 1859 - 1952 (2068 dager). Estimering av r og : r = 0.105  = 0.013 Nedbør (mm) Observert Beregnet frekvens frekvens 0-5 1631 1639 6-10 115 106 11-15 67 62 16-20 42 44 21-25 27 32 26-30 26 26 31-35 19 21 36-40 14 17 41-45 12 14 46-50 18 12 51-60 18 20 61-70 13 15 71-80 13 12 81-90 8 9 91-100 8 7 101-125 16 12 126-150 7 7 151-425 14 13 Eksemplet viser bruk av gammafordelingen til nedbørberegninger.<br> Legg merke til meget god overensstemmelse mellom observert og beregnet nedbør. Regn opptrer kun hvis vannpartikler kan dannes rundt støv av tilstrekkelig masse og akkumulering av slikt støv er analogt med ventetid slik den er innebygd i gamma-modellen.

Eksponensialfordeling Levetid 1 T = Levetiden for en komponent y0 = Antall komponenter ved t = 0 y = Antall komponenter ved t = t Antall komponenter som feiler i løpet av et gitt tidsintervall er proporsjonal med antall intakte og med tidsintervallet t Tid y0 y Antall komponenter En del komponenter (f.eks. noen bestemte typer elektriske komponenter) har en <b>levetid som er eksponensialfordelt</b> med parameter lambda.<br><br< La oss tenke oss at vi ved tiden t=0 har y0 antall av en type komponenter.<br> Etter som tiden går, vil noen av disse komponentene gå i stykker.<br> La y være antall gjenværende komponenter ved tiden t.<br> Anta nå at <b>antall komponenter som går i stykker fra tiden t til tiden t + (delta)t er proporsjonal med antall gjenværende komponenter ved tiden t og proporsjonal med tidsintervallet (delta)t</b>.<br> Som vist til venstre vil denne antakelsen medføre at levetiden T er eksponensialfordelt.

Eksponensialfordeling Levetid 2 Vi antar at levetiden T (timer) for en bestemt type elektriske komponenter er eksponensialfordelt med parameter  = 0.001. Sannsynlighetstettheten til T: Forventet levetid: Sannsynligheten for at en tilfeldig komponent varer i mer enn 2000 timer: Vi antar at levetiden T (timer) for en bestemt type elektriske komponenter er eksponensialfordelt med parameter lambda=0.001.<br> Som vist til venstre vil sannsynlighetstettheten være 0.001e^(-0.001t).<br> Forventningen til T blir 1000 timer.<br> Sannsynligheten for at en slik komponent varer i mer enn 2000 timer er 0.135.

Eksponensialfordeling ’Eksponensialfordelings glemsomhet’ Levetid 3 Vi antar at levetiden T (timer) for en bestemt type elektriske komponenter er eksponensialfordelt med parameter  . Sannsynlighetstettheten til T: Sannsynligheten for at T er større enn t: Anta nå at vi har observert at en komponent har fungert i u timer, dvs utfallet {T>u} er gitt. Hva er sannsynligheten for at komponenten vil fungere i t timer til? Anta at levetiden T (timer) for en bestemt type elektriske komponenter er <b>eksponsialfordelt</b> med parameter lambda.<br> Beregningene viser at <b>sannsynligheten for at en komponent skal vare i t timer til når vi vet at den har vart i u timer er den samme som sannsynligheten for at den skal vare i t timer fra den er ny</b>.<br> Dette kalles <b>eksponensialfordelingens glemsomhet</b>. Sannsynligheten for at komponenten skal vare i t timer til, er den samme som sannsynligheten for at komponenten skal vare i t timer fra den startet å fungere.

Normal fordeling Normalfordelingen (Gauss fordelingen) er den viktigste kontinuerlige sannsynlighetsfordelingen. Målevariabler gir i svært mange situasjoner en entoppet symmetrisk fordeling. f(x) Hvis vi måler høyden på mange studenter og tegner resultatet inn i et diagram, vil vi som oftest få en kurve som har en klokkefasong med en entoppet symmetrisk fordeling.<br> Mange av de målte høydene samler seg rundt en slags gjennomsnittshøyde mens vi måler relativt få svært lave og svært høye høyder.<br> Svært mange målevariabler gir en slik fordeling. Siden slike fordelinger ofte dukker opp i praksis, kan det være av interesse å studere slike fordelinger.<br> Vi samler disse under fellesbetegnelsen <b>Normalfordeling</b> (eller Gauss fordelingen).<br> Normalfordelingen er den viktigste kontinuerlige sannsynlighetsfordelingen. x

Normal fordeling Utgangspunkt: Resultat: Krav: For å studere normalfordelingen ønsker vi nå en enklest mulig klokkeformet funksjon som reproduserer målte resultater.<br> Den enkleste funksjonen som gir en klokkeform er:<br> <b>f(x) = e^(-x^2)</b><br> Denne funksjonen er entoppet med maksimumsverdi i x=0.<br> Vi ønsker å gjøre denne funksjonen mer generell slik at vi kan plassere toppunktet på ønsket sted og slik at utflatingen kan endres etter ønske.<br><br> En mer generell funksjon vil være:<br> <b>f(x) = ce^(-b/(x-a)^2)</b><br> Konstantene a, b og c kan bestemmes ut fra:<br> - Integralet av f(x) fra minus uendelig til pluss uendelig skal være 1<br> - Forventningen skal være lik my: E(X) = my<br> - Variansen skal være lik sigma^2: Var(X) = sigma^2<br><br> Med disse kravene vil f(x) være gitt som vist til venstre.<br> Funksjonen vil være en sannsynlighetstetthet med maksimum i x=my og standardavvik=sigma.<br><br> En kontinuerlig stokastisk variabel X som har denne sannsynlighetstettheten sies å være normalfordelt med parametre my og sigma^2: <b>X ~ N(my,sigma^2)</b>

Normal fordeling N(0,1)-fordelingen Sannsynlighetstetthet: x Fordelingsfunksjon: Fra foregående side ser vi at vi har mange ulike normalfordelinger.<br> Vi skal her studere den enkleste av dem, nemlig den som har maksimumspunkt for x=0 (dvs my=0) og standardavvik sigma=1.<br> Denne fordelingen kalles for N(0,1) fordelingen.<br> Hovedgrunnene til at vi skal studere denne spesielt er:<br> - N(0,1) er den enkleste av normalfordelingene<br> - Når vi først har funnet N(0,1) kan vi enkelt regne oss over til alle de andre N(my,sigma^2)<br><br> Sannsynlighetstettheten til N(0,1) fordelingen betegnes med <b>g(x)</b>.<br> Fordelingsfunksjonen til N(0,1) fordelingen betegnes med <b>G(x) = P(X<=x)</b><br><br> Figuren viser uttrykkene til g(x) og G(x).<br> Grafen viser kurven til g(x).<br> G(x) er i den samme figuren vist som det skraverte arealet.<br> Legg merke til at G (siden g er symmetrisk om andre-aksen) oppfyller følgende betingelse:<br> <b>G(-x) = 1-G(x)</b>

N(0,1)-fordeling Tabell X 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.5040 0.5080 0.5120 ….. 0.1 0.5398 0.5438 ….. 0.2 0.3 0.4 0.5 0.6915 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 0.9332 ….. 3.9 1.000 1.000 ….. 1.000 På forrige side fant vi et uttrykk for fordelingsfunksjonen G(x).<br> G(x) er uttrykt ved et integral som det viser seg ikke er mulig å løse analytisk vha standard integrasjonsmetoder. Derimot kan G(x) bestemmes numerisk og tabellen til venstre viser litt av innholdet i en såkalt N(0,1) tabell. På øverste linje og venstre kolonne vises x-verdier, mens tilhørende verdier til G(x) finnes inne i tabellen. F.eks. vil x=0.11 gi G(x)=P(X<=0.11)=0.5438.<br> Tabellen finnes i sin helhet flere steder, bl.a. bakerst i læreboken.<br>

N(0,1)-fordeling Eks Eksempler på sannsynlighetsberegninger i N(0,1) fordelingen.

Generell Normal fordeling Standardisering Vi nevnte tidligere at fra N(0,1) fordelingen kunne vi regne om til de øvrige N(my,sigma^2) fordelingene. Det betyr at når vi skal gjøre sannsynlighetsberegninger i N(my,sigma^2) fordelinger kan vi finne resultatene vha kun N(0,1) tabellen.<br><br> For enhver fordeling X har vi tidligere redegjort for standardfordelingen Z gitt ved:<br> Z = (X-my)/sigma.<br> Tidligere viste vi at E(Z)=0 og Var(Z)=1.<br> Spesielt betyr dette at for en gitt normalfordeling N(my,sigma^2) vil fordelingen til Z=(X-my)/sigma være en N(0,1) fordeling.<br> Beregningene til venstre viser at:<br> <b>F(x) = P(X<=x) = G((x-my)/sigma)</b><br><br> Konklusjon:<br> <b>Gitt en normalfordeling X ~ N(my,sigma^2)<br> Da har vi F(x) = P(X<=x) = G((x-my)/sigma)<br> dvs vi kan beregne F(x) = P(X<=x) ved å slå opp G((x-my)/sigma) i N(0,1) tabellen</b>.

N(5,22)-fordeling Eks Eksempel på sannsynlighetsberegninger i N(5,2^2) fordelingen ved oppslag i N(0,1) tabellen.

Normalfordeling Standardavvik Sannsynligheten for at en normalfordelt stokastisk variabel X ligger mindre enn ett, henholdsvis to, standardavvik  fra forventningen . Beregning av sannsynligheten for at en normalfordelt stokastisk variabel ligger mindre enn ett, henholdsvis to standardavvik sigma fra forventningen my.

Normalfordeling Lineærkombinasjoner Lineær-kombinasjoner av uavhengige, normalfordelte stokastiske variabler er normalfordelt. La oss tenke oss at vi har n stykker uavhengige normalfordelte stokastiske variable Xi i=1,...,n hvor E(Xi) = my_i og Var(Xi) = sigma_i Vi danner summen S som en lineærkombinasjon av disse Xi:<br> S = Sum (ai x Xi) i=1,...,n.<br> Det kan da vises at S selv er normalfordelt med forventning my = Sum (ai x my_i) og varians sigma^2 = Sum (ai^2 x sigma_i^2)<br><br> Spesielt merker vi oss følgende:<br> La Xi i=1,...,n være n uavhengige og normalfordelte stokastiske variable, alle med samme forventning my og samme standardavvik sigma.<br> La X være gjennomsnittet av X-ene gitt ved:<br> X = 1/n x [X1 + X2 + X3 + ... + Xn]<br> Da vil X være normalfordelt: <b>X ~ N(my,(sigma^2)/2)</b>

Normalfordeling Eks Lineærkombinasjoner Vi har to uavhengige normalfordelte stokastiske variable: <b>X1 ~ N(5,2^2)</b><br> <b>X2 ~ N(3,1^2)</b><br><br> Vi danner lineærkombinasjonen <b>Y = 3X1 - 2X2</b><br> Y vil da selv være normalfordelt:<br> <b>Y ~ N(9,6.3^2)</b>

Sentralgrensesetningen Den såkalte <b>sentralgrensesetningen</b> danner det grunnleggende resultatet for normaltilnærming.<br><br> La Xi i=1,...,n være n uavhengige og identiske fordelte stokastiske variable alle med forventning my og varians sigma^2.<br> Da har vi:<br> <b>S = X1 + X2 + ...+ Xn tilnærmet N(n x my, n x sigma^2)</b><br> <b>Xgj = 1/n x [X1 + X2 +...+ Xn] tilnærmet N(my, (sigma^2)/n)</b><br><br> Legg merke til at vi <i>ikke</i> har forutsatt at Xi i=1,...,n er normalfordelte.

Tilnærming til normalfordeling Binomisk fordeling Hypergeometrisk fordeling Som vist til venstre kan binomisk fordeling, hypergeometrisk fordeling og Poisson fordeling alle tilnærmes til normalfordelingen under gitte forutsetninger.<br> For binomisk fordeling kan X skrives som en sum av indikatorvariable. Vha sentralgrensesetningen forklarer dette normaltilnærmingen.<br> Tilsvarende for Poisson fordelingen hvor X kan skrives om en sum over antall forekomster i de enkelte områdene.<br> For hypergeometrisk fordeling kan Y skrives som en sum av indikatorvariable, men disse er ikke uavhengige. Likevel kan normaltilnærmingen vises. Poisson fordeling

Tilnærming  = M/N (N-n)/(N-1)·np(1-p) > 10 n/N < 0.1 Oppsummering av tilnærming mellom:<br> - Hypergeometrisk fordeling<br> - Binomisk fordeling<br> - Poisson fordeling<br> - Normalfordeling  Bin(n, ) np(1-p) > 10  > 15 n > 10 p <= 0.1  Po()  = np

END