Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Diskrete stokastiske variable Petter Mostad 2005.09.21.

Liknende presentasjoner


Presentasjon om: "Diskrete stokastiske variable Petter Mostad 2005.09.21."— Utskrift av presentasjonen:

1 Diskrete stokastiske variable Petter Mostad

2 Hva ble feil med oppgave A17? Vi regnet ut sannsynligheten for at moren får minst en syk sønn av 3 sønner: Sannsynligheten for at moren får minst en syk sønn av 2 sønner blir på samme måte Dermed får vi:

3 Stokastiske variable En stokastisk variabel er en sannsynlighetsmodell der utfallene er tall. Sannsynlighetene for de ulike utfallene kaller vi sannsynlighetsfordelingen til variabelen For en tellevariabel er utfallene en del av tallene 0,1,2,3,…

4 Eksempler Et kast med en terning Anta erfaring har vist at av 3 barn i en familie, så møter 0 til middag 20% av gangene, 1 møter 20%, 2 møter 40%, og 3 møter 20%. Denne modellen er en stokastisk variabel. Anta et styre på 3 personer blir valgt tilfeldig blant en gruppe på 3 jenter og 6 gutter. Antallet jenter i styret er en stokastisk variabel.

5 Forventningen til en tellevariabel Hvis den stokastiske variabelen X har verdiene x 1, x 2, …, x n, med sannsynlighetene P(x 1 ), P(x 2 ), …, P(x n ), så er forventningen E(X)=x 1 P(x 1 )+x 2 P(x 2 )+…+x n P(x n ) Fra en stokastisk variabel X kan vi lage nye stokastiske variable, for eksempel X+3, eller X 2 : for eksempel X+3 har verdiene x 1 +3, x 2 +3,…,x n +3, med sannsynlighetene P(x 1 ), P(x 2 ), …, P(x n ). Hva blir E(X+3)? Hva blir E(X 2 )?

6 Eksempler Hva er forventningen til et terningkast? Hva er forventet antall barn som kommer til middag?

7 Varians til en stokastisk variabel Variansen til X kan enklest defineres ved hjelp av forventningen: hvor er forventningen til X. Standardavviket er definert som kvadratroten til variansen

8 Eksempel Hva er variansen til et terningkast? Hva er variansen av antall barn som kommer til middag? (Vi kommer tilbake til sammenhengen med empirisk standardavvik)

9 Regning med forventning Det kan være tungt å beregne varians som over, så en del regneregler er utviklet: For konstanter a og b: Hvis X og Y er stokastiske variable med samme utfallsrom: En konsekvens er:

10 Eksempel En annen konsekvens er at Bruk dette til å beregne variansen av et terningkast

11 Bivariate fordelinger To variable deler opp utfallsrommet på to måter Sannsynlighetene for –A: Regn i morgen –B: Vind i morgen er gitt i følgende tabell: Ikke regn Litt regn Mye regn Ingen vind Litt vindSterk vindStorm

12 Stokastisk uavhengighet To variable er stokastisk uavhengige dersom Dersom X og Y er stokastisk uavhengige, har vi –

13 Binomisk fordeling Anta man gjør n forsøk, som alle kan ha utfall ”suksess” eller ”ikke suksess”. Anta alle forsøkene er stokastisk uavhengige. Anta alle forsøkene har sannsynlighet p for suksess. Da kan vi beregne sannsynligheten for å få eksakt x suksesser: Dette definerer en stokastisk variabel med Binomisk fordeling

14 Forventning og varians av Binomisk fordeling Om X har en Binomisk fordeling, med utvalgsstørrelse n og sannsynlighet p, så får vi Eksempel: Hva er forventning og varians for antall jenter av 7 barn? (P(jente)=0.48)

15 Den Hypergeometriske fordelingen Anta gitt N objekter, og at s av disse er ”suksesser”. Anta n objekter velges tilfeldig. Fordelingen for antall suksesser i utvalget kalles den Hypergeometriske fordelingen:

16 Eksempel I en klasse er det 20 jenter og 10 gutter. Et utvalg på 5 studenter velges ut tilfeldig. Hva er sannsynligheten for at utvalget vil inneholde 0, 1, eller 2 jenter?

17 Poissonfordelingen Anta ”suksesser” skjer uavhengig, med en rate på λ per tidsenhet. Sannsynligheten for x suksesser i løpet av en tidsenhet er da gitt ved Poissonfordelingen:

18 Eksempel Anta en Geigerteller, som teller radioaktive atomers splitting, teller 1 slik hendelse per sekund. Hva er sannsynligheten for å observere 3 eller flere hendelser i løpet av et sekund?

19 Poissonfordelingen og Binomialfordelingen Gitt en Poissonfordeling med parameter λ, så er det er mulig å konstruere en Binominalfordeling som likner den: –Del hver tidsenhet i n deler –La sannsynligheten for ”suksess” i hvert delintervall være λ/n. –La n gå mot uendelig: Da blir fordelingene identiske. Dette argumentet kan brukes for å utlede formelen for Poissonfordelingen Det betyr også at vi kan bruke Poissonfordelingen som en tilnærming til Binominalfordelingen når n er stor og p liten.

20 Poissonprosesser En prosess der –objektene plasseres uavhengig langs en akse (eventuellt tid) eller i en flate eller et rom –forventet antall objekter per enhet (lengde, tid flate, rom…) er konstant kalles en Poissonprosess Antall objekter per enhet får da en Poissonfordeling

21 Anvendelse av beregnede sannsynligheter De kan brukes til å optimere beslutninger: –70% sjangse for regn i morgen: da tar jeg med paraply –10% sjangse for jordras i dette området i løpet av neste 10 år: området må evakueres Ofte benyttes imidlertid sannsynligheter slik: –Under hypotesen om at tilfeldigheter genererte de observerte data, så er de altfor usannsynlige. Det må ligge noe annet enn tilfeldigheter bak –Eksempel: 8 eller flere tilfeller av denne sykdommen på ett år i vår kommune har sannsynlighet 0.1%: Det må være en annen forklaring enn tilfeldigheter

22 Benytte sannsynligheter for valg av forklaringsmodell Det vi egentlig gjør er å benytte data til å velge mellom ulike modeller som kan forklare dem. For å gjøre dette korrekt må vi også ta hensyn til hvor sannsynlige de ulike modellene er før vi ser på de gitte dataene!

23 Eksempel Anta at i kommune A er det så mange tilfeller av sykdom X et år at sannsynligheten for dette (når vi antar Poissonmodellen) er 0.1%. –Kommunelegen vil kanskje da si: Det må være en spesiell sykdomsårsak i kommunen –SSB kan si at sannsynligheten for å observere så mange tilfeller i minst en av landets kommuner er 10%: Det er ikke nødvendigvis noen spesiell sykdomsårsak Hvem har rett?

24 Løsning Problemet oppstår fordi man kun ser på sannsynligheten for å observere de gitte data (eller noe mer ekstremt). Man må også ta hensyn til sannsynligheten for en eller annen alternativ sykdomsårsak: –For kommunelegen i kommune A er den ganske liten –For SSB er sannsynligheten for at en alternativ sykdomsårsak oppstår i EN av landets kommuner en god del større


Laste ned ppt "Diskrete stokastiske variable Petter Mostad 2005.09.21."

Liknende presentasjoner


Annonser fra Google