Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Kap 07 Diskrete sannsynlighetsfordelinger

Liknende presentasjoner


Presentasjon om: "Kap 07 Diskrete sannsynlighetsfordelinger"— Utskrift av presentasjonen:

1 Kap 07 Diskrete sannsynlighetsfordelinger
I dette kapitlet skal vi benytte kunnskapene våre fra de foregående kapitlene til å utarbeide ulike diskrete sannsynlighetsmodeller. For en gitt oppgave vil det da kunne være hensiktsmessig å finne ut om betingelsene er oppfylt for å kunne benytte en eller flere av disse modellene med tilhørende ferdige utarbeidede metoder Simuleringer knyttet til dette kapitlet finner du her.

2 Sannsynlighetsfordelinger - Typer
Uniform fordeling Indikator fordeling Binomisk fordeling Multinomisk fordeling Geometrisk fordeling Hypergeometrisk fordeling Poisson fordeling Normalfordeling Log-normal fordeling Gamma fordeling Eksponential fordeling Beta fordeling Weibull fordeling Her vises en liste over noen av de mest kjente diskrete og kontinuerlige sannsynlighetsfordelingene. De 7 førstnevnte er diskrete sannsynlighetsmodeller. De resterende er kontinuerlige sannsynlighetsmodeller (behandles i seinere kapitler). Av alle disse modellene står normalfordelingen i en særstilling.

3 Sannsynlighetsfordelinger - Strategi
1. Grunnleggende forutsetninger for eksperimentet og den tilhørende sannsynlighetsmodell. 2. Definisjon av den aktuelle stokastiske variable og utledning av dennes sannsynlighetsfordeling. 3. Undersøkelse av egenskaper ved den utledede sannsynlighetsfordeling, bl.a. beregning av forventning og varians. Ved utarbeiding av ulike sannsynlighetsfordelinger benytter vi følgende strategi: - Klargjøring av eksperimentbetingelser og sannsynlighetsmodell. - Definisjon av aktuell stokastisk variabel og utledning av dennes sannsynlighetsfordeling. - Utarbeiding av egenskaper ved gitt utledet sannsynlighetsfordeling, bl.a. beregning av forventning og varians.

4 Uniform fordeling La X anta verdiene x1, x2, …, xn
alle med samme sannsynlighet p = 1/n x x1 x2 … xn P(X=x) p=1/n p=1/n … p=1/n Uniform fordeling Vi tenker oss at vi har en sannsynlighetsmodell. Videre tenker vi oss at vi til denne sannsynlighetsmodellen har en diskret stokastisk variabel X som kan anta verdiene x1, x2, ..., xn alle med samme sannsynlighet p = P(X=xi) = 1/n. Når P(X=xi) er like for alle i=1,2,...,n, sier vi at vi har en uniform fordeling Til venstre vises beregninger av henholdsvis forventingen til X og variansen til X. Vi legger merke til at forventningen er lik gjennomsnittsverdien av samtlige x-verdier.

5 Indikator fordeling La I være en indikatorvariabel, dvs I kan anta verdiene 0 eller 1. La p være sannsynligheten for at I antar verdien 1. x P(I=x) p p Ik=I Indikator fordeling Denne fordelingen er en svært spesiell sannsynlighetsfordeling, men har mange overraskende anvendelsesområder (også til bruk ved utledning av andre sannsynlighetsfordelinger) Vi sier at en stokastisk variabel I er en indikator variabel hvis I kun kan anta verdiene 0 eller 1. La p være sannsynligheten for at I antar verdien 1. Da er sannsynligheten for at I antar verdien 0 lik 1-p Beregningene til venstre viser at: E(I) = p Var(I) = p(1-p)

6 Indikator fordeling Eksempel
Vi kaster n terninger. Hva blir forventet antall forskjellige øyne som terningene viser? 1 hvis minst en terning viser j øyne La Ij = 0 hvis ingen terning viser j øyne Antall forskjellige øyne er da: X =  Ij j = 1,2,…6 Slik Ij er definert her vil den være en indikator variabel siden den kun kan anta verdiene 0 eller 1. Videre vil X som er lik summen av alle Ij j=1,2,...,6 være antall forskjellige øyne ved kast med n terninger. Oppgaven går derfor ut på å bestemme forventningen til X, dvs E(X). Siden X er en sum over Ij, vil oppgaven være løst hvis vi kan finne P(Ij=1) (se forrige side).

7 Binomisk fordeling Registrering av antall ganger et bestemt utfall A inntreffer. 1) Delforsøkene er uavhengige 2) I hvert delforsøk registreres hvorvidt et utfall A inntreffer. 3) Sannsynligheten p = P(A) er den samme i alle n delforsøk. Sannsynligheten for at vi i løpet av n forsøk får x treff er da: Binomisk fordeling Vi utfører et eksperiment n ganger. Vi ønsker å registrere i hvor mange av disse n eksperimentene et bestemt utfall A inntreffer Hvis eksperimentene (delforsøkene) oppfyller de 3 kravene vist til venstre, sier vi at vi har en binomisk fordeling Formlene til venstre viser: P(X=x) : Sannsynligheten for at A inntreffer x ganger. E(X) : Forventet antall ganger A inntreffer. Var(X) : Spredningen i antall ganger A inntreffer Utledning av formlene vises på de to neste sidene Simuleringer knyttet til binomisk fordeling finner du her.

8 Binomisk fordeling Bevis
Utledning av formelen for P(X=x) sannsynligheten for at utfallet A inntreffer x ganger.

9 Binomisk fordeling Bevis
Utledning av formlene for: E(X) : Forventet antall ganger utfallet A inntreffer. Var(X) : Spredningen i antall ganger utfallet A inntreffer Indikator fordelingen benyttes som hjelpemiddel for å utlede disse to formlene.

10 Eksempel: Tre myntkast
Binomisk fordeling Eksempel: Tre myntkast X er antall kron i forsøket med n = 3 myntkast. X er binomisk fordelt fordi: 1) Myntkastene er uavhengige 2) I hvert kast registreres hvorvidt et utfall K (kron) inntreffer. 3) Sannsynligheten p = P(K) = 1/2 er den samme i alle 3 delforsøk. Sannsynligheten for at vi i løpet av 3 forsøk får x treff er da: Vi kaster en mynt n=3 ganger og ønsker å beregne sannsynligheten P(X=x) for at antall kron er lik x. De tre kravene til binomisk fordeling er her oppfylt Simulering knyttet til binomisk fordeling (tre myntkast) finner du her.

11 Eksempel: Flervalgseksamen
Binomisk fordeling Eksempel: Flervalgseksamen Til en eksamen er det til hvert av 20 spørsmål 5 valgmuligheter. Beregn sannsynligheten for å stå til eksamen ved reint tipping når minst 10 av svarene må være rette. A = Utfallet at et svar er rett. X = Antall rette svar for en eksamenskandidat X er binomisk fordelt fordi: 1) Tipping for hvert av de n=20 spørsmålene er uavhengige. 2) I hvert spørsmål registreres hvorvidt utfall A (rett) inntreffer. 3) Sannsynligheten p = P(A) = 1/5 = er den samme i alle n=20 delforsøk. Sannsynligheten for at vi i løpet av n=20 forsøk får x rette er da: Vi har en eksamen med 20 spørsmål og 5 svaralternativer på hvert spørsmål. Minst 10 spørsmål må besvares korrekt for å bestå eksamen. Vi ønsker å forsikre oss om at en student som kun gjetter tilfeldig på hvert spørsmål skal ha liten sannsynlighet for å bestå eksamen Med A og X definert som vist til venstre, vil kravene til binomisk modell være oppfylt Av beregningene ser vi at sannsynligheten for å bestå eksamen ved rein tipping er lik 0.3%. Videre ser vi at forventet antall korrekte svar ved rein tipping er lik 4.0.

12 Binomisk fordeling Alternativ
Registrering av antall ganger et bestemt utfall A inntreffer. 1) Delforsøkene er uavhengige 2) I hvert delforsøk registreres hvorvidt et utfall A inntreffer. 3) Sannsynlighetene p1 = P(A) og p2 = P(Ac) = 1-p1 er den samme i alle n delforsøk. Sannsynligheten for at vi i løpet av n forsøk får x1 treff og x2 = n-x1 ikke-treff er da: Her vises en alternativ formel for P(X=x) sannsynligheten for at et utfall A inntreffer x ganger. Formelen for p(x1,x2) forteller om sannsynligheten for at utfallet A inntreffer x1 ganger og ikkeA inntreffer x2 = n-x1 ganger. Med denne formelen får vi symmetri i x1 og x2 og kan enkelt utvide formelen for binomisk fordeling til å gjelde den såkalte multinomiske fordeling (se neste side).

13 Multinomisk fordeling
Registrering av antall ganger bestemte utfall A1, A2, …, Am inntreffer. 1) Delforsøkene er uavhengige 2) Hvert delforsøk gir ett av m mulige utfall A1, A2, …, Am 3) Sannsynlighetene for hvert av de mulige utfallene er de samme i alle n delforsøk. Sannsynligheten for at vi i løpet av n forsøk får x1 treff av A1, x2 treff av A2, …, xm treff av Am: Multinomisk fordeling er en generalisering av binomisk fordeling. Fra multinomisk fordeling får vi binomisk fordeling som et spesialtilfelle ved å sette m=2, A1=A og A2=ikkeA.

14 Multinomisk fordeling
Eksempel: 12 terningkast Vi utfører n = 12 terningkast.. Hvert kast har 6 mulige utfall, 1 øye (A1), 2 øyne (A2),, …, 6 øyne (A6) med p1 = p2 = … = p6 = 1/6. Xi = Antall ganger i øyne observeres. Sannsynlighetsfordelingen til X1, X2 , …, X6 er gitt ved: Eksempel på multinomisk fordeling. Spesielt er sannsynligheten for at alle øyne forekommer 2 ganger lik:

15 Geometrisk fordeling Vi tenker oss et binomisk forsøk, en serie uavhengige enkeltforsøk, hvor vi holder på inntil første gang A inntreffer. X = Antall forsøk til første gang A inntreffer Sannsynligheten for at første treff kommer i x’te forsøk: Geometrisk fordeling Ved å gjennomføre en binomisk forsøksserie inntil første gang et utfall A inntreffer, får vi en såkalt geometrisk fordeling. Navnet geometrisk skyldes at punktsannsynligheten til X=Antall forsøk til første gang A inntreffer gir ledd i en geometrisk rekke P(X=x) gir oss sannsynligheten for at første treff kommer i x'te forsøk. Siden punktsannsynlighetene blir ledd i en geometrisk rekke, sier vi at X er geometrisk fordelt.

16 Geometrisk fordeling Eksempel: Måleinstrument
Sannsynligheten for at et gitt måleinstrument feiler ved en test setter vi til 0.05. Hva er sannsynligheten for at det sjette måleinstrumentet som blir kontrollert er det første som feiler og hva er forventet antall tester inntil første feilforekomst? Eksempel på anvendelse av geometrisk fordeling: Måleinstrument.

17 Hypergeometrisk fordeling
N = Totalt antall elementer i populasjonen. M = Antall spesielle objekter i populasjonen (defekte, rød , …) N-M = Antall vanlige objekter i populasjonen (intakte , hvite, …) Trekking av n elementer fra populasjonen (uten tilbakelegging). Antall spesielle elementer noteres. Hypergeometrisk fordeling Vi har en populasjon bestående av N antall elementer. M av disse betrakter vi på en eller annen måte som spesielle. De resterende N-M betraktes som vanlige elementer. Vi trekker tilfeldig n av disse tilsammen N elementene. Hvor stor er sannsynligheten P(Y=y) for at vi har trukket y antall spesielle elementer? Ved utledning av formelen for P(Y=y) benytter vi våre kunnskaper fra kombinatorikk, nemlig trekking uordnet uten tilbakelegging fra en populasjon P(Y=y) = gunstige/mulige. Totalt antall mulige uordnede utvalg uten tilbakelegging når vi trekker n elementer fra en populasjon på N elementer er n over s (som altså blir nevneren i uttrykket vårt). Fra M antall spesielle elementer skal vi trekke y spesielle elementer. Dette kan gjøre på M over y antall ulike måter. (uordnet uten tilbakelegging) av y slike spesielle elementer. De resterende n-y elementene må da trekkes fra de N-M normale elementene. I følge multiplikasjonsregelen vil antall måter vi kan trekke n elementer fra totalt N elementer når y av disse n elementene skal være blant de totalt M antall spesielle elementer være produktet av de to sistnevnte uttrykkene. Trekking med tilbakelegging gir binomisk situasjon. N>> n gir også binomisk situasjon med Y ~ bin(n,M/N)

18 Hypergeometrisk fordeling
Eksempel: Delegasjon 1 I en forening med 10 medlemmer er det 6 menn og 4 kvinner. En delegasjon på 4 medlemmer velges ut ved loddtrekning. Bestem sannsynligheten for at delegasjonen består av 3 kvinner. N= M = n = Y = Antall kvinner i delegasjonen y = 3 Eksempel på anvendelse av hypergeometrisk fordeling.

19 Hypergeometrisk fordeling
Eksempel: Delegasjon 2 I en forening med 100 medlemmer er det 60 menn og 40 kvinner. En delegasjon på 4 medlemmer velges ut ved loddtrekning. Y = Antall kvinner i delegasjonen. N= M = n = 4 Hypergeometrisk: Eksempel på anvendelse av hypergeometrisk fordeling. Binomisk:

20 Poisson fordeling Registrerer forekomster av en hendelse A i et bestemt område t. 1) Forekomster av A i ikke-overlappende områder er uavhengige. 2) Forventet antall forekomster  av A pr enhet er konstant over hele området. 3) To forekomster av A kan ikke være fullstendig sammenfallende. Poisson fordeling Poisson fordeling benyttes når vi skal registrere antall forekomster av en hendelse A i et gitt område t, forutsatt at de tre punktene vist til venstre er oppfylt. Området t kan være areal, volum eller tidsintervall Simulering knyttet til Poisson fordeling finner du her.

21 Poisson fordeling Eksempler på Anvendelses-områder - Sjeldne fenomener
- Tilnærming til binomisk fordeling ved stor n og liten p - Trær på et skogsareal av en bestemt størrelse - Bakterier i en bakteriekultur - Blodlegemer i en blodprøve - Forsikring - Kunder som ankommer en butikk i løpet av en viss tid - Telefonbruk - Arbeidsulykker i en bedrift i løpet av en viss tid - Reservedeler - Trafikk-ulykker - Radioaktivitet - Krigsutbrudd - Posisjoner av stjerner i universet - Feiltrykk i bøker - ….. Eksempler på anvendelsesområder av Poisson fordeling.

22 Poisson fordeling Utledning 1 n intervaller h=t/n t
h=t/n t Utledning av formler for Poisson fordeling.

23 Poisson fordeling Utledning 2 Tilnærming til Binomisk fordeling.
Utledning av formler for Poisson fordeling.

24 Poisson fordeling Utledning 3
Utledning av formler for Poisson fordeling.

25 Poisson fordeling Eksempel: Trær
Vi betrakter forekomster av trær i et skogareal. Forutsetninger: 1. Forekomster av trær i et område er uavhengig av forekomster i andre ikke-overlappende områder. 2. Forventet antall trær pr. arealenhet er konstant over hele området. 3. To trær kan ikke stå nøyaktig på samme sted. Gjennomsnittlig antall trær pr mål er t=12.0 /mål ·1 mål = 12. X = Antall trær på et mål. Eksempel på anvendelse av Poisson fordeling: Beregning av sannsynligheten av at vi finner x trær pr mål i et skogsområde når vi får oppgitt at gjennomsnittlig antall trær pr mål er Simulering knyttet til Poisson fordeling (trær) finner du her. Sannsynligheten for å finne 7, henholdsvis 20 trær pr mål.

26 Poisson fordeling Eksempel: Medfødte misdannelser i Bømlo kommune 1
I ble det i Bømlo kommune i Hordaland observert hele 3 tilfeller av alvorlige misdannelser i sentralnervesystemet hos nyfødte barn i løpet av et halvt års tid. Slike misdannelser forekommer vanligvis meget sjelden. I Bømlo ville en vente anslagsvis ett tilfelle hvert fjerde år. Den type misdannelser det dreier seg om, omfatter bl.a. ryggmarksbrokk, dvs at ryggraden er ufullstendig utvokst og barnet kan få meget alvorlige skader på nervene i ryggmargen. Under ledelse av Institutt for forebyggende medisin ved Universitetet i Oslo ble det satt i gang undersøkelse for å se om det kunne være spesielle årsaker til den overhyppighet en registrerte i Bømlo. En fant ikke noen slike årsaker, og konkluderte med at det hele var et resultat av tilfeldigheter. Vi skal se på hvordan sannsynlighetsberegning kan kaste lys over dette problemet. Eksempel på anvendelse av Poisson fordeling: Medfødte misdannelser.

27 Poisson fordeling Eksempel: Medfødte misdannelser i Bømlo kommune 2
Vi bestemmer først det forventede antall forekomster  pr halvår. Det blir født ca 80 barn i løpet av et halvt år i Bømlo, og risikoen for misdannelse (ut fra tall fra hele landet) er ca 1.6 pr 1000 fødsler, dvs et forventet antall på 0.13. Vi setter derfor  = 0.13. Vi beregner sannsynligheten for 3 eller flere forekomster: Siden dette tallet er så lite, kan det være fristende å tro at det hele ikke bare er tilfeldig, men at misdannelsene har en bestemt årsak (medikamenter, miljøgifter, …). Imidlertid kan vi kanskje spørre hva sannsynligheten er for en gang i løpet av 10 halvår å observere slike 3 eller flere slike misdannelser blant de øvrige 50 kommunene på samme størrelse som Bømlo. Eksempel på anvendelse av Poisson fordeling: Medfødte misdannelser. Siden dette tallet er såpass stort, er det ikke lengre så merkelig med slike observasjoner som i Bømlo.

28 Tilnærming  = M/N (N-n)/(N-1)·np(1-p) > 10 n/N < 0.1
Tilnærming mellom ulike fordelinger: - Hypergeometrisk fordeling - Binomisk fordeling - Poisson fordeling - Normal fordeling Simulering: Simulering av tilnærming mellom Hypergeometrisk og Binomisk fordeling Simulering av tilnærming mellom Binomisk og Poisson fordeling.  Bin(n, ) np(1-p) > 10  > 15 n > 10 p <= 0.1  Po()  = np

29 END


Laste ned ppt "Kap 07 Diskrete sannsynlighetsfordelinger"

Liknende presentasjoner


Annonser fra Google