Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Kap 09 Kontinuerlige fordelingsfunksjoner

Liknende presentasjoner


Presentasjon om: "Kap 09 Kontinuerlige fordelingsfunksjoner"— Utskrift av presentasjonen:

1 Kap 09 Kontinuerlige fordelingsfunksjoner
I dette kapitlet skal vi se på ulike kontinuerlige fordelingsfunksjoner<br> spesielt eksponensialfordling og normalfordeling.

2 Eksponensialfordeling
Ventetid 1 X = Antall forekomster av A i løpet av en tid [0,t]. X Poisson-fordelt. T = Tidspunkt for første treff av A. La oss gå tilbake til Poissonfordelingen (fra kap 07) som kan benyttes til blant annet å registrere antall forekomster X av en bestemt hendelse A i løpet av en tid t (f.eks. antall kunder som ankommer en butikk i løpet av tiden t).<br> Vi antar at forutsetningene for at X er Poissonfordelt er tilstede. Sannsynlighetsfordelingen til X er gitt ved P(X=x).<br><br> Vi lar T være tiden fra t=0 til første forekomst av A (tiden fra butikken åpner til første kunde ankommer).<br> Vi ønker å finne fordelingsfunksjonen og sannsynlighetstettheten til T. T t Skal finne fordelingsfunksjonen og sannsynlighetstettheten til T.

3 Eksponensialfordeling
Ventetid 2 Kumulativ fordelingsfunksjon til T: 1.0 F(t) Sannsynlighetstettheten til T: f(t) T er tiden fra t=0 til første forekomst av A.<br> Vi skal finne:<br> - F(t) kumulativ fordelingsfunksjon til T<br> - f(t) sannsynlighetstettheten til T<br><br> Hendelsen {T>t} betyr ingen ankomst i løpet av tiden t (siden T betyr tid for første ankomst). {T>t} er altså det samme som X=0, ingen ankomst i tidsintervallet [0,t].<br> Herav: P(T>t) = P(X=0) = e^(-lambda x t).<br> Videre: F(t) = P(T<=t) = 1-P(T>t) = 1-e^(-lambda x t).<br> Sannsynlighetstettheten finner vi ved å derivere:<br> f(t) = F'(t) = lambda x e^(-lambda x t).<br><br> Fordelingen kalles <b>eksponensialfordelingen med parameter lambda</b>.<br> <b>T ~ eksp(lambda)</b><br><br> Fra definisjonen av forventning og varians kan det enkelt vises at (se neste side):<br> <b>E(T) = 1/lambda</b><br> <b>Var(T) = 1/(lambda)^2</b> Forventning: Varians:

4 Eksponensialfordeling
Forventning Varians Sannsynlighetstettheten til T: Kumulativ fordelingsfunksjon til T: Forventning: Beregning av forventning E(T) og varians Var(T) for eksponensialfordelingen.<br> Beregningen er rett frem fra definisjonen av forventning og varians. Varians:

5 Gammafordeling Ventetid 3 Ventetid inntil forekomst nr r: Forventning:
Beregningen av ventetid inntil første forekomst av en hendelse A slik som beskrevet på de foregående sidene kan generaliseres til å svare på følgende spørsmål:<br> Hva er <b>ventetiden T inntil forekomst nr r av hendelsen A</b>?<br<br> Det kan vises at sannsynlighetstettheten, forventningen og variansen til T er gitt som vist til venstre.<br><br> Fordelingen kalles <b>Gammafordelingen</b>. Forventning: Varians:

6 Gammafordeling Utledning av sannsynlighetstetthet
T = Ventetid inntil forekomst nr r: Utledningen av sannsynlighetstettheten hvor vi studerer ventetid inntil forekomst nr r av A er analog med utledningen hvor ventetiden gjelder første forekomst av A, bortsett fra at vi nå må summere sannsynligheter for de r-1 første treff.

7 Gammafunksjon Def / Egenskaper For ethvert reelt tall r > 0,
er gammafunksjonen av r definert ved: Gammafunksjonen har følgende egenskaper: Ikke overraskende benyttes ordet gammafordeling på de foregående sidene fordi fordelingen er nær knyttet til den såkalte gammafunksjonen.<br> Her vises definisjon av gammafunksjonen samt noen av gammafunksjonens egenskaper. Bl.a. legger vi merke til at vi kan definere fakultet vha gammafunksjonen.

8 Gammafordeling Def Med egenskapene til gammafunksjonen
har vi nå fått en generalisering av r! : En stokastisk variabel X sies å ha en gammfordeling med parametre r og  når (både r og  må være positive): Med r! = gammafunksjonen av r+1 (se forrige side), samt definisjonen av gammafordelingen vist til venstre, kan vi nå forstå bruk av betegnelsen gammafordeling fra de foregående sidene.

9 Gammafordeling Forventning Varians Forventning: Varians:
Beregning av forventning E(X) og varians Var(X) for gammafordelingen.<br> Noean av gammafunksjonens egenskaper er benyttet i utledningene.

10 Gammafordeling Eks: Nedbørberegninger. Daglig nedbør i Sydney, Australia i perioden 17.oktober - 7.november i årene (2068 dager). Estimering av r og : r = 0.105  = 0.013 Nedbør (mm) Observert Beregnet frekvens frekvens Eksemplet viser bruk av gammafordelingen til nedbørberegninger.<br> Legg merke til meget god overensstemmelse mellom observert og beregnet nedbør. Regn opptrer kun hvis vannpartikler kan dannes rundt støv av tilstrekkelig masse og akkumulering av slikt støv er analogt med ventetid slik den er innebygd i gamma-modellen.

11 Eksponensialfordeling
Levetid 1 T = Levetiden for en komponent y0 = Antall komponenter ved t = 0 y = Antall komponenter ved t = t Antall komponenter som feiler i løpet av et gitt tidsintervall er proporsjonal med antall intakte og med tidsintervallet t Tid y0 y Antall komponenter En del komponenter (f.eks. noen bestemte typer elektriske komponenter) har en <b>levetid som er eksponensialfordelt</b> med parameter lambda.<br><br< La oss tenke oss at vi ved tiden t=0 har y0 antall av en type komponenter.<br> Etter som tiden går, vil noen av disse komponentene gå i stykker.<br> La y være antall gjenværende komponenter ved tiden t.<br> Anta nå at <b>antall komponenter som går i stykker fra tiden t til tiden t + (delta)t er proporsjonal med antall gjenværende komponenter ved tiden t og proporsjonal med tidsintervallet (delta)t</b>.<br> Som vist til venstre vil denne antakelsen medføre at levetiden T er eksponensialfordelt.

12 Eksponensialfordeling
Levetid 2 Vi antar at levetiden T (timer) for en bestemt type elektriske komponenter er eksponensialfordelt med parameter  = Sannsynlighetstettheten til T: Forventet levetid: Sannsynligheten for at en tilfeldig komponent varer i mer enn 2000 timer: Vi antar at levetiden T (timer) for en bestemt type elektriske komponenter er eksponensialfordelt med parameter lambda=0.001.<br> Som vist til venstre vil sannsynlighetstettheten være 0.001e^(-0.001t).<br> Forventningen til T blir 1000 timer.<br> Sannsynligheten for at en slik komponent varer i mer enn 2000 timer er

13 Eksponensialfordeling ’Eksponensialfordelings glemsomhet’
Levetid 3 Vi antar at levetiden T (timer) for en bestemt type elektriske komponenter er eksponensialfordelt med parameter  . Sannsynlighetstettheten til T: Sannsynligheten for at T er større enn t: Anta nå at vi har observert at en komponent har fungert i u timer, dvs utfallet {T>u} er gitt. Hva er sannsynligheten for at komponenten vil fungere i t timer til? Anta at levetiden T (timer) for en bestemt type elektriske komponenter er <b>eksponsialfordelt</b> med parameter lambda.<br> Beregningene viser at <b>sannsynligheten for at en komponent skal vare i t timer til når vi vet at den har vart i u timer er den samme som sannsynligheten for at den skal vare i t timer fra den er ny</b>.<br> Dette kalles <b>eksponensialfordelingens glemsomhet</b>. Sannsynligheten for at komponenten skal vare i t timer til, er den samme som sannsynligheten for at komponenten skal vare i t timer fra den startet å fungere.

14 Normal fordeling Normalfordelingen (Gauss fordelingen)
er den viktigste kontinuerlige sannsynlighetsfordelingen. Målevariabler gir i svært mange situasjoner en entoppet symmetrisk fordeling. f(x) Hvis vi måler høyden på mange studenter og tegner resultatet inn i et diagram, vil vi som oftest få en kurve som har en klokkefasong med en entoppet symmetrisk fordeling.<br> Mange av de målte høydene samler seg rundt en slags gjennomsnittshøyde mens vi måler relativt få svært lave og svært høye høyder.<br> Svært mange målevariabler gir en slik fordeling. Siden slike fordelinger ofte dukker opp i praksis, kan det være av interesse å studere slike fordelinger.<br> Vi samler disse under fellesbetegnelsen <b>Normalfordeling</b> (eller Gauss fordelingen).<br> Normalfordelingen er den viktigste kontinuerlige sannsynlighetsfordelingen. x

15 Normal fordeling Utgangspunkt: Resultat: Krav:
For å studere normalfordelingen ønsker vi nå en enklest mulig klokkeformet funksjon som reproduserer målte resultater.<br> Den enkleste funksjonen som gir en klokkeform er:<br> <b>f(x) = e^(-x^2)</b><br> Denne funksjonen er entoppet med maksimumsverdi i x=0.<br> Vi ønsker å gjøre denne funksjonen mer generell slik at vi kan plassere toppunktet på ønsket sted og slik at utflatingen kan endres etter ønske.<br><br> En mer generell funksjon vil være:<br> <b>f(x) = ce^(-b/(x-a)^2)</b><br> Konstantene a, b og c kan bestemmes ut fra:<br> - Integralet av f(x) fra minus uendelig til pluss uendelig skal være 1<br> - Forventningen skal være lik my: E(X) = my<br> - Variansen skal være lik sigma^2: Var(X) = sigma^2<br><br> Med disse kravene vil f(x) være gitt som vist til venstre.<br> Funksjonen vil være en sannsynlighetstetthet med maksimum i x=my og standardavvik=sigma.<br><br> En kontinuerlig stokastisk variabel X som har denne sannsynlighetstettheten sies å være normalfordelt med parametre my og sigma^2: <b>X ~ N(my,sigma^2)</b>

16 Normal fordeling N(0,1)-fordelingen Sannsynlighetstetthet:
x Fordelingsfunksjon: Fra foregående side ser vi at vi har mange ulike normalfordelinger.<br> Vi skal her studere den enkleste av dem, nemlig den som har maksimumspunkt for x=0 (dvs my=0) og standardavvik sigma=1.<br> Denne fordelingen kalles for N(0,1) fordelingen.<br> Hovedgrunnene til at vi skal studere denne spesielt er:<br> - N(0,1) er den enkleste av normalfordelingene<br> - Når vi først har funnet N(0,1) kan vi enkelt regne oss over til alle de andre N(my,sigma^2)<br><br> Sannsynlighetstettheten til N(0,1) fordelingen betegnes med <b>g(x)</b>.<br> Fordelingsfunksjonen til N(0,1) fordelingen betegnes med <b>G(x) = P(X<=x)</b><br><br> Figuren viser uttrykkene til g(x) og G(x).<br> Grafen viser kurven til g(x).<br> G(x) er i den samme figuren vist som det skraverte arealet.<br> Legg merke til at G (siden g er symmetrisk om andre-aksen) oppfyller følgende betingelse:<br> <b>G(-x) = 1-G(x)</b>

17 N(0,1)-fordeling Tabell X ….. ….. 0.2 0.3 0.4 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 ….. På forrige side fant vi et uttrykk for fordelingsfunksjonen G(x).<br> G(x) er uttrykt ved et integral som det viser seg ikke er mulig å løse analytisk vha standard integrasjonsmetoder. Derimot kan G(x) bestemmes numerisk og tabellen til venstre viser litt av innholdet i en såkalt N(0,1) tabell. På øverste linje og venstre kolonne vises x-verdier, mens tilhørende verdier til G(x) finnes inne i tabellen. F.eks. vil x=0.11 gi G(x)=P(X<=0.11)= <br> Tabellen finnes i sin helhet flere steder, bl.a. bakerst i læreboken.<br>

18 N(0,1)-fordeling Eks Eksempler på sannsynlighetsberegninger i N(0,1) fordelingen.

19 Generell Normal fordeling
Standardisering Vi nevnte tidligere at fra N(0,1) fordelingen kunne vi regne om til de øvrige N(my,sigma^2) fordelingene. Det betyr at når vi skal gjøre sannsynlighetsberegninger i N(my,sigma^2) fordelinger kan vi finne resultatene vha kun N(0,1) tabellen.<br><br> For enhver fordeling X har vi tidligere redegjort for standardfordelingen Z gitt ved:<br> Z = (X-my)/sigma.<br> Tidligere viste vi at E(Z)=0 og Var(Z)=1.<br> Spesielt betyr dette at for en gitt normalfordeling N(my,sigma^2) vil fordelingen til Z=(X-my)/sigma være en N(0,1) fordeling.<br> Beregningene til venstre viser at:<br> <b>F(x) = P(X<=x) = G((x-my)/sigma)</b><br><br> Konklusjon:<br> <b>Gitt en normalfordeling X ~ N(my,sigma^2)<br> Da har vi F(x) = P(X<=x) = G((x-my)/sigma)<br> dvs vi kan beregne F(x) = P(X<=x) ved å slå opp G((x-my)/sigma) i N(0,1) tabellen</b>.

20 N(5,22)-fordeling Eks Eksempel på sannsynlighetsberegninger i N(5,2^2) fordelingen ved oppslag i N(0,1) tabellen.

21 Normalfordeling Standardavvik
Sannsynligheten for at en normalfordelt stokastisk variabel X ligger mindre enn ett, henholdsvis to, standardavvik  fra forventningen . Beregning av sannsynligheten for at en normalfordelt stokastisk variabel ligger mindre enn ett, henholdsvis to standardavvik sigma fra forventningen my.

22 Normalfordeling Lineærkombinasjoner
Lineær-kombinasjoner av uavhengige, normalfordelte stokastiske variabler er normalfordelt. La oss tenke oss at vi har n stykker uavhengige normalfordelte stokastiske variable Xi i=1,...,n hvor E(Xi) = my_i og Var(Xi) = sigma_i Vi danner summen S som en lineærkombinasjon av disse Xi:<br> S = Sum (ai x Xi) i=1,...,n.<br> Det kan da vises at S selv er normalfordelt med forventning my = Sum (ai x my_i) og varians sigma^2 = Sum (ai^2 x sigma_i^2)<br><br> Spesielt merker vi oss følgende:<br> La Xi i=1,...,n være n uavhengige og normalfordelte stokastiske variable, alle med samme forventning my og samme standardavvik sigma.<br> La X være gjennomsnittet av X-ene gitt ved:<br> X = 1/n x [X1 + X2 + X Xn]<br> Da vil X være normalfordelt: <b>X ~ N(my,(sigma^2)/2)</b>

23 Normalfordeling Eks Lineærkombinasjoner
Vi har to uavhengige normalfordelte stokastiske variable: <b>X1 ~ N(5,2^2)</b><br> <b>X2 ~ N(3,1^2)</b><br><br> Vi danner lineærkombinasjonen <b>Y = 3X1 - 2X2</b><br> Y vil da selv være normalfordelt:<br> <b>Y ~ N(9,6.3^2)</b>

24 Sentralgrensesetningen
Den såkalte <b>sentralgrensesetningen</b> danner det grunnleggende resultatet for normaltilnærming.<br><br> La Xi i=1,...,n være n uavhengige og identiske fordelte stokastiske variable alle med forventning my og varians sigma^2.<br> Da har vi:<br> <b>S = X1 + X Xn tilnærmet N(n x my, n x sigma^2)</b><br> <b>Xgj = 1/n x [X1 + X Xn] tilnærmet N(my, (sigma^2)/n)</b><br><br> Legg merke til at vi <i>ikke</i> har forutsatt at Xi i=1,...,n er normalfordelte.

25 Tilnærming til normalfordeling
Binomisk fordeling Hypergeometrisk fordeling Som vist til venstre kan binomisk fordeling, hypergeometrisk fordeling og Poisson fordeling alle tilnærmes til normalfordelingen under gitte forutsetninger.<br> For binomisk fordeling kan X skrives som en sum av indikatorvariable. Vha sentralgrensesetningen forklarer dette normaltilnærmingen.<br> Tilsvarende for Poisson fordelingen hvor X kan skrives om en sum over antall forekomster i de enkelte områdene.<br> For hypergeometrisk fordeling kan Y skrives som en sum av indikatorvariable, men disse er ikke uavhengige. Likevel kan normaltilnærmingen vises. Poisson fordeling

26 Tilnærming  = M/N (N-n)/(N-1)·np(1-p) > 10 n/N < 0.1
Oppsummering av tilnærming mellom:<br> - Hypergeometrisk fordeling<br> - Binomisk fordeling<br> - Poisson fordeling<br> - Normalfordeling  Bin(n, ) np(1-p) > 10  > 15 n > 10 p <= 0.1  Po()  = np

27 END


Laste ned ppt "Kap 09 Kontinuerlige fordelingsfunksjoner"

Liknende presentasjoner


Annonser fra Google