Diskrete stokastiske variable

Slides:



Advertisements
Liknende presentasjoner
Repetisjon innkapsling static tabell av primitiv datatype LC191D Videregående programmering Høgskolen i Sør-Trøndelag, Avdeling for informatikk og e-læring.
Advertisements

1 Sannsynlighetsregning Gjenfinningssystemer og verktøy II Jon Anjer.
MET 2211 Statistikk og dataanalyse
Kap 07 Diskrete sannsynlighetsfordelinger
Kap 10 Estimering.
Grunnleggende spørsmål om naturfag
Kap 09 Kontinuerlige fordelingsfunksjoner
Statistikk og sannsynlighetsregning
Kap 05 Betinget sannsynlighet
Statistikk og hydrologi
Kurs i praktisk bruk av Bayesianske metoder.
Oppgave 1: Terningsutfall
Hvordan får man data og modell til å passe sammen?
Gjenfinningssystemer og verktøy II
Kapittel 14 Simulering.
Eksempel AOA (Activity On Arc)
Mer grunnleggende matte: Forberedelse til logistisk regresjon
Om semesteroppgaven Krav til den avhengige variabelen
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
Kap 06 Diskrete stokastiske variable
Komplekse tall Naturlige tall
Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Hendelser betegnes med A, B, C osv.
Statistikk på 20 2 timer PSY-1002
Formelmagi 31-1 Begrep/fysisk størrelse
Kap 04 Sannsynlighetsregning
Sannsynlighetsregning
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Forelesning 3 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral
Bayesiansk statistikk Petter Mostad Overblikk Tilbakeblikk på sannsynlighetsbegrepet Hvordan gjøre Bayesianske analyser Analyser ved hjelp.
Hypotesetesting, og kontinuerlige stokastiske variable
Usikkerheter og sannsynligheter Petter Mostad
Forelesning 4 HSTAT1101 Ola Haug Norsk Regnesentral
Siste forelesning er i morgen!
Regresjon Petter Mostad
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Mål for timene Forstå hvordan vi ved hjelp av et variogram kan uttrykke den romlige variasjonen til en tilfeldig variabel.
Sannsynlighet og kombinatorikk
Kombinatorikk og sannsynlighet
Kræsjkurs Del Ii Hypotesetesting
 Vi ønsker å tilpasse en rett linje gjennom dataskyen  Denne linjen skal ha den beste tilpasningen (minst feil) til data.
Statistikk 2 M1 årskurs HVE 31. august 2009.
Sannsynlighet og kombinatorikk
A2A / A2B M1 årskurs 4. november 2009
Operasjonsanalytiske emner Prognosemodeller basert på Tidsserieanalyse Rasmus RasmussenBØK710 OPERASJONSANALYTISKE EMNER1 Del 23Forecasting 1 - Mønster.
A 4 / 5 / 6 B 8 / 10 / 13 C 9 / 12 / 16 D 7 / 8 / 9 E 5 / 6 / 8 Når vi skal beregne et PERT-nettverk tar vi utgangspunkt i forventet varighet for alle.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Kombinatorikk Ordnede utvalg med og uten tilbakelegging.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Betinget sannsynlighet og uavhengige hendelser.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Forventning, varians og standardavvik Tilnærming.
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Repetisjon av sannsynlighetsregning
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Sannsynlighetsregning 4
Figur 9.1 Sannsynlighet beregnes på en skala fra 0 til 1.
MET 2211 Statistikk og dataanalyse
Repetisjon, del I Metode
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
forventning og varians
Utvalgsfordelinger (Kapittel 5)
Utskrift av presentasjonen:

Diskrete stokastiske variable Petter Mostad 2005.09.21

Hva ble feil med oppgave A17? Vi regnet ut sannsynligheten for at moren får minst en syk sønn av 3 sønner: Sannsynligheten for at moren får minst en syk sønn av 2 sønner blir på samme måte Dermed får vi:

Stokastiske variable En stokastisk variabel er en sannsynlighetsmodell der utfallene er tall. Sannsynlighetene for de ulike utfallene kaller vi sannsynlighetsfordelingen til variabelen For en tellevariabel er utfallene en del av tallene 0,1,2,3,… Eksempel: Å kaste en terning Eksempel

Eksempler Et kast med en terning Anta erfaring har vist at av 3 barn i en familie, så møter 0 til middag 20% av gangene, 1 møter 20%, 2 møter 40%, og 3 møter 20%. Denne modellen er en stokastisk variabel. Anta et styre på 3 personer blir valgt tilfeldig blant en gruppe på 3 jenter og 6 gutter. Antallet jenter i styret er en stokastisk variabel. Tegn sannsynlighetshistogrammer, og forklar!

Forventningen til en tellevariabel Hvis den stokastiske variabelen X har verdiene x1, x2, …, xn, med sannsynlighetene P(x1), P(x2), …, P(xn), så er forventningen E(X)=x1P(x1)+x2P(x2)+…+xnP(xn) Fra en stokastisk variabel X kan vi lage nye stokastiske variable, for eksempel X+3, eller X2: for eksempel X+3 har verdiene x1+3, x2+3,…,xn+3, med sannsynlighetene P(x1), P(x2), …, P(xn). Hva blir E(X+3)? Hva blir E(X2)?

Eksempler Hva er forventningen til et terningkast? Hva er forventet antall barn som kommer til middag?

Varians til en stokastisk variabel Variansen til X kan enklest defineres ved hjelp av forventningen: hvor er forventningen til X. Standardavviket er definert som kvadratroten til variansen

Eksempel Hva er variansen til et terningkast? Hva er variansen av antall barn som kommer til middag? (Vi kommer tilbake til sammenhengen med empirisk standardavvik)

Regning med forventning Det kan være tungt å beregne varians som over, så en del regneregler er utviklet: For konstanter a og b: Hvis X og Y er stokastiske variable med samme utfallsrom: En konsekvens er: Gå gjennom regningen!

Eksempel En annen konsekvens er at Bruk dette til å beregne variansen av et terningkast

Bivariate fordelinger To variable deler opp utfallsrommet på to måter Sannsynlighetene for A: Regn i morgen B: Vind i morgen er gitt i følgende tabell: Ingen vind Litt vind Sterk vind Storm Snakk om: Marginalfordelinger Betingede fordelinger Uavhengighet? Vi kan så selvfølgelig også snakke om samme fenomen når variablene er NUMERISKE Ikke regn 0.1 0.2 0.05 0.01 0.15 0.04 Litt regn Mye regn

Stokastisk uavhengighet To variable er stokastisk uavhengige dersom Dersom X og Y er stokastisk uavhengige, har vi Vis regningen for varians??

Binomisk fordeling Anta man gjør n forsøk, som alle kan ha utfall ”suksess” eller ”ikke suksess”. Anta alle forsøkene er stokastisk uavhengige. Anta alle forsøkene har sannsynlighet p for suksess. Da kan vi beregne sannsynligheten for å få eksakt x suksesser: Dette definerer en stokastisk variabel med Binomisk fordeling Gå gjennom argumentasjonen for formelen for sannsynligheten! Binomialkoeffesienten! Eksempler på når Binomialfordelingen kan brukes…..hva med kravet om uavhengighet? Tegn noen diagrammer med sannsynlighetshistogrammer for hvordan fordelingen ser ut!

Forventning og varians av Binomisk fordeling Om X har en Binomisk fordeling, med utvalgsstørrelse n og sannsynlighet p, så får vi Eksempel: Hva er forventning og varians for antall jenter av 7 barn? (P(jente)=0.48) Utled disse matematisk! (Vi har nå verktøyene) Forventning: 3.36 Varians 1.75

Den Hypergeometriske fordelingen Anta gitt N objekter, og at s av disse er ”suksesser”. Anta n objekter velges tilfeldig. Fordelingen for antall suksesser i utvalget kalles den Hypergeometriske fordelingen: Explain how the formula is obtained!!!! Sums to 1, etc. Geometric distribution: Drawing until the first success, when the probability for success in each draw is p. Dette gikk vi gjennom tidligere!

Eksempel I en klasse er det 20 jenter og 10 gutter. Et utvalg på 5 studenter velges ut tilfeldig. Hva er sannsynligheten for at utvalget vil inneholde 0, 1, eller 2 jenter? Solution: P(0) = 1 * (10 5) / (30 5) = 10*9*8*7*6 / 30 * 29 * 28 * 27 * 26 = 30240 / 17100720 = 0.18% P(1) = 20 * (10 4) / (30 5) = 20 * 10 * 9 * 8 * 7 * 5 / 30 * 29 * 28 * 27 * 26 = 504000 / 17100720 = 2.9% P(2) = (20 2) (10 3) / (30 5) = 10 * 19 * 10 * 9 * 8 * 5 * 4 / 30 * 29 * 28 * 27 * 26 = 16.0%

Poissonfordelingen Anta ”suksesser” skjer uavhengig, med en rate på λ per tidsenhet. Sannsynligheten for x suksesser i løpet av en tidsenhet er da gitt ved Poissonfordelingen: Draw some graphs manually! Notice where I use uppercase and lowercase X!!

Eksempel Anta en Geigerteller, som teller radioaktive atomers splitting, teller 1 slik hendelse per sekund. Hva er sannsynligheten for å observere 3 eller flere hendelser i løpet av et sekund? Solution: We compute P(0), P(1) and P(2): e = 2.718 P(0) = e^-1 = 36.8% P(1) = e^-1 = 36.8% P(2) = e^-1 / 2 = 18.4% Svar = 8.0%

Poissonfordelingen og Binomialfordelingen Gitt en Poissonfordeling med parameter λ, så er det er mulig å konstruere en Binominalfordeling som likner den: Del hver tidsenhet i n deler La sannsynligheten for ”suksess” i hvert delintervall være λ/n. La n gå mot uendelig: Da blir fordelingene identiske. Dette argumentet kan brukes for å utlede formelen for Poissonfordelingen Det betyr også at vi kan bruke Poissonfordelingen som en tilnærming til Binominalfordelingen når n er stor og p liten.

Poissonprosesser En prosess der kalles en Poissonprosess objektene plasseres uavhengig langs en akse (eventuellt tid) eller i en flate eller et rom forventet antall objekter per enhet (lengde, tid flate, rom…) er konstant kalles en Poissonprosess Antall objekter per enhet får da en Poissonfordeling Tegn en Poissonprosess i planet!

Anvendelse av beregnede sannsynligheter De kan brukes til å optimere beslutninger: 70% sjangse for regn i morgen: da tar jeg med paraply 10% sjangse for jordras i dette området i løpet av neste 10 år: området må evakueres Ofte benyttes imidlertid sannsynligheter slik: Under hypotesen om at tilfeldigheter genererte de observerte data, så er de altfor usannsynlige. Det må ligge noe annet enn tilfeldigheter bak Eksempel: 8 eller flere tilfeller av denne sykdommen på ett år i vår kommune har sannsynlighet 0.1%: Det må være en annen forklaring enn tilfeldigheter Det jeg bygger opp til er at det ikke er så altfor lett å benytte sannsynligheter korrekt på den andre måten: Man må passe seg.

Benytte sannsynligheter for valg av forklaringsmodell Det vi egentlig gjør er å benytte data til å velge mellom ulike modeller som kan forklare dem. For å gjøre dette korrekt må vi også ta hensyn til hvor sannsynlige de ulike modellene er før vi ser på de gitte dataene! Eksempler: Hvis jeg skal finne ut hvem av tre personer som har gjort en forbrytelse, så behøver jeg ikke så mye informasjon for å velge å tro at det er en av dem…. 2. Hvis jeg gjør et forsøk for å påvise ESP, så trenger jeg svært sikre data for å bli overbevist!

Eksempel Anta at i kommune A er det så mange tilfeller av sykdom X et år at sannsynligheten for dette (når vi antar Poissonmodellen) er 0.1%. Kommunelegen vil kanskje da si: Det må være en spesiell sykdomsårsak i kommunen SSB kan si at sannsynligheten for å observere så mange tilfeller i minst en av landets kommuner er 10%: Det er ikke nødvendigvis noen spesiell sykdomsårsak Hvem har rett?

Løsning Problemet oppstår fordi man kun ser på sannsynligheten for å observere de gitte data (eller noe mer ekstremt). Man må også ta hensyn til sannsynligheten for en eller annen alternativ sykdomsårsak: For kommunelegen i kommune A er den ganske liten For SSB er sannsynligheten for at en alternativ sykdomsårsak oppstår i EN av landets kommuner en god del større