Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Diskrete stokastiske variable

Liknende presentasjoner


Presentasjon om: "Diskrete stokastiske variable"— Utskrift av presentasjonen:

1 Diskrete stokastiske variable
Petter Mostad

2 Hva ble feil med oppgave A17?
Vi regnet ut sannsynligheten for at moren får minst en syk sønn av 3 sønner: Sannsynligheten for at moren får minst en syk sønn av 2 sønner blir på samme måte Dermed får vi:

3 Stokastiske variable En stokastisk variabel er en sannsynlighetsmodell der utfallene er tall. Sannsynlighetene for de ulike utfallene kaller vi sannsynlighetsfordelingen til variabelen For en tellevariabel er utfallene en del av tallene 0,1,2,3,… Eksempel: Å kaste en terning Eksempel

4 Eksempler Et kast med en terning
Anta erfaring har vist at av 3 barn i en familie, så møter 0 til middag 20% av gangene, 1 møter 20%, 2 møter 40%, og 3 møter 20%. Denne modellen er en stokastisk variabel. Anta et styre på 3 personer blir valgt tilfeldig blant en gruppe på 3 jenter og 6 gutter. Antallet jenter i styret er en stokastisk variabel. Tegn sannsynlighetshistogrammer, og forklar!

5 Forventningen til en tellevariabel
Hvis den stokastiske variabelen X har verdiene x1, x2, …, xn, med sannsynlighetene P(x1), P(x2), …, P(xn), så er forventningen E(X)=x1P(x1)+x2P(x2)+…+xnP(xn) Fra en stokastisk variabel X kan vi lage nye stokastiske variable, for eksempel X+3, eller X2: for eksempel X+3 har verdiene x1+3, x2+3,…,xn+3, med sannsynlighetene P(x1), P(x2), …, P(xn). Hva blir E(X+3)? Hva blir E(X2)?

6 Eksempler Hva er forventningen til et terningkast?
Hva er forventet antall barn som kommer til middag?

7 Varians til en stokastisk variabel
Variansen til X kan enklest defineres ved hjelp av forventningen: hvor er forventningen til X. Standardavviket er definert som kvadratroten til variansen

8 Eksempel Hva er variansen til et terningkast?
Hva er variansen av antall barn som kommer til middag? (Vi kommer tilbake til sammenhengen med empirisk standardavvik)

9 Regning med forventning
Det kan være tungt å beregne varians som over, så en del regneregler er utviklet: For konstanter a og b: Hvis X og Y er stokastiske variable med samme utfallsrom: En konsekvens er: Gå gjennom regningen!

10 Eksempel En annen konsekvens er at
Bruk dette til å beregne variansen av et terningkast

11 Bivariate fordelinger
To variable deler opp utfallsrommet på to måter Sannsynlighetene for A: Regn i morgen B: Vind i morgen er gitt i følgende tabell: Ingen vind Litt vind Sterk vind Storm Snakk om: Marginalfordelinger Betingede fordelinger Uavhengighet? Vi kan så selvfølgelig også snakke om samme fenomen når variablene er NUMERISKE Ikke regn 0.1 0.2 0.05 0.01 0.15 0.04 Litt regn Mye regn

12 Stokastisk uavhengighet
To variable er stokastisk uavhengige dersom Dersom X og Y er stokastisk uavhengige, har vi Vis regningen for varians??

13 Binomisk fordeling Anta man gjør n forsøk, som alle kan ha utfall ”suksess” eller ”ikke suksess”. Anta alle forsøkene er stokastisk uavhengige. Anta alle forsøkene har sannsynlighet p for suksess. Da kan vi beregne sannsynligheten for å få eksakt x suksesser: Dette definerer en stokastisk variabel med Binomisk fordeling Gå gjennom argumentasjonen for formelen for sannsynligheten! Binomialkoeffesienten! Eksempler på når Binomialfordelingen kan brukes…..hva med kravet om uavhengighet? Tegn noen diagrammer med sannsynlighetshistogrammer for hvordan fordelingen ser ut!

14 Forventning og varians av Binomisk fordeling
Om X har en Binomisk fordeling, med utvalgsstørrelse n og sannsynlighet p, så får vi Eksempel: Hva er forventning og varians for antall jenter av 7 barn? (P(jente)=0.48) Utled disse matematisk! (Vi har nå verktøyene) Forventning: 3.36 Varians 1.75

15 Den Hypergeometriske fordelingen
Anta gitt N objekter, og at s av disse er ”suksesser”. Anta n objekter velges tilfeldig. Fordelingen for antall suksesser i utvalget kalles den Hypergeometriske fordelingen: Explain how the formula is obtained!!!! Sums to 1, etc. Geometric distribution: Drawing until the first success, when the probability for success in each draw is p. Dette gikk vi gjennom tidligere!

16 Eksempel I en klasse er det 20 jenter og 10 gutter. Et utvalg på 5 studenter velges ut tilfeldig. Hva er sannsynligheten for at utvalget vil inneholde 0, 1, eller 2 jenter? Solution: P(0) = 1 * (10 5) / (30 5) = 10*9*8*7*6 / 30 * 29 * 28 * 27 * 26 = / = 0.18% P(1) = 20 * (10 4) / (30 5) = 20 * 10 * 9 * 8 * 7 * 5 / 30 * 29 * 28 * 27 * 26 = / = 2.9% P(2) = (20 2) (10 3) / (30 5) = 10 * 19 * 10 * 9 * 8 * 5 * 4 / 30 * 29 * 28 * 27 * 26 = 16.0%

17 Poissonfordelingen Anta ”suksesser” skjer uavhengig, med en rate på λ per tidsenhet. Sannsynligheten for x suksesser i løpet av en tidsenhet er da gitt ved Poissonfordelingen: Draw some graphs manually! Notice where I use uppercase and lowercase X!!

18 Eksempel Anta en Geigerteller, som teller radioaktive atomers splitting, teller 1 slik hendelse per sekund. Hva er sannsynligheten for å observere 3 eller flere hendelser i løpet av et sekund? Solution: We compute P(0), P(1) and P(2): e = 2.718 P(0) = e^-1 = 36.8% P(1) = e^-1 = 36.8% P(2) = e^-1 / 2 = 18.4% Svar = 8.0%

19 Poissonfordelingen og Binomialfordelingen
Gitt en Poissonfordeling med parameter λ, så er det er mulig å konstruere en Binominalfordeling som likner den: Del hver tidsenhet i n deler La sannsynligheten for ”suksess” i hvert delintervall være λ/n. La n gå mot uendelig: Da blir fordelingene identiske. Dette argumentet kan brukes for å utlede formelen for Poissonfordelingen Det betyr også at vi kan bruke Poissonfordelingen som en tilnærming til Binominalfordelingen når n er stor og p liten.

20 Poissonprosesser En prosess der kalles en Poissonprosess
objektene plasseres uavhengig langs en akse (eventuellt tid) eller i en flate eller et rom forventet antall objekter per enhet (lengde, tid flate, rom…) er konstant kalles en Poissonprosess Antall objekter per enhet får da en Poissonfordeling Tegn en Poissonprosess i planet!

21 Anvendelse av beregnede sannsynligheter
De kan brukes til å optimere beslutninger: 70% sjangse for regn i morgen: da tar jeg med paraply 10% sjangse for jordras i dette området i løpet av neste 10 år: området må evakueres Ofte benyttes imidlertid sannsynligheter slik: Under hypotesen om at tilfeldigheter genererte de observerte data, så er de altfor usannsynlige. Det må ligge noe annet enn tilfeldigheter bak Eksempel: 8 eller flere tilfeller av denne sykdommen på ett år i vår kommune har sannsynlighet 0.1%: Det må være en annen forklaring enn tilfeldigheter Det jeg bygger opp til er at det ikke er så altfor lett å benytte sannsynligheter korrekt på den andre måten: Man må passe seg.

22 Benytte sannsynligheter for valg av forklaringsmodell
Det vi egentlig gjør er å benytte data til å velge mellom ulike modeller som kan forklare dem. For å gjøre dette korrekt må vi også ta hensyn til hvor sannsynlige de ulike modellene er før vi ser på de gitte dataene! Eksempler: Hvis jeg skal finne ut hvem av tre personer som har gjort en forbrytelse, så behøver jeg ikke så mye informasjon for å velge å tro at det er en av dem…. 2. Hvis jeg gjør et forsøk for å påvise ESP, så trenger jeg svært sikre data for å bli overbevist!

23 Eksempel Anta at i kommune A er det så mange tilfeller av sykdom X et år at sannsynligheten for dette (når vi antar Poissonmodellen) er 0.1%. Kommunelegen vil kanskje da si: Det må være en spesiell sykdomsårsak i kommunen SSB kan si at sannsynligheten for å observere så mange tilfeller i minst en av landets kommuner er 10%: Det er ikke nødvendigvis noen spesiell sykdomsårsak Hvem har rett?

24 Løsning Problemet oppstår fordi man kun ser på sannsynligheten for å observere de gitte data (eller noe mer ekstremt). Man må også ta hensyn til sannsynligheten for en eller annen alternativ sykdomsårsak: For kommunelegen i kommune A er den ganske liten For SSB er sannsynligheten for at en alternativ sykdomsårsak oppstår i EN av landets kommuner en god del større


Laste ned ppt "Diskrete stokastiske variable"

Liknende presentasjoner


Annonser fra Google