MAT0100V Sannsynlighetsregning og kombinatorikk

Slides:



Advertisements
Liknende presentasjoner
1 Sannsynlighetsregning Gjenfinningssystemer og verktøy II Jon Anjer.
Advertisements

Kap 07 Diskrete sannsynlighetsfordelinger
Gjenfinningssystemer og verktøy II
Kap 10 Estimering.
STATISTISK GENERALISERING
Kap 09 Kontinuerlige fordelingsfunksjoner
Kurs i praktisk bruk av Bayesianske metoder.
Kap 13 Sammenligning av to grupper
Parameteriserte kurver
Harald Romstad Høgskolen i Hedmark
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Hendelser betegnes med A, B, C osv.
Diskrete stokastiske variable
INF 4130 Eksamen 2008 Gjennomgang.
Sannsynlighetsregning
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral
Hypotesetesting, og kontinuerlige stokastiske variable
Forelesning 4 HSTAT1101 Ola Haug Norsk Regnesentral
Regresjon Petter Mostad
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kombinatorikk og sannsynlighet
Kræsjkurs Del Ii Hypotesetesting
Sannsynlighet og kombinatorikk
A2A / A2B M1 årskurs 4. november 2009
A 4 / 5 / 6 B 8 / 10 / 13 C 9 / 12 / 16 D 7 / 8 / 9 E 5 / 6 / 8 Når vi skal beregne et PERT-nettverk tar vi utgangspunkt i forventet varighet for alle.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Kombinatorikk Ordnede utvalg med og uten tilbakelegging.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Betinget sannsynlighet og uavhengige hendelser.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Utvalg og datainnsamling For å gjennomføre en test av hypoteser i kvantitativ metode trenger vi et utvalg deltakere for å gjennomføre datainnsamling –
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Forventning, varians og standardavvik Tilnærming.
Kapittel 3 Etterspørsel etter konsumgoder
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Repetisjon av sannsynlighetsregning
Prosjekttittel Ditt navn | Lærerens navn | Skolen din
Bedriftsundersøkelsen 2017
Statistikk 2 Sentral- og spredningsmål
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur Standard normalfordeling z og tre t-fordelinger Figur 21.1 Standard normalfordeling z og tre t-fordelinger. Legg merke til at t-fordelingene.
MET 2211 Statistikk og dataanalyse
Kapittel 12: Finansiell risiko
Sannsynlighetsregning 4
Bokser Håkon Tolsby Håkon Tolsby.
Figur 9.1 Sannsynlighet beregnes på en skala fra 0 til 1.
Statistikk 1 Stolpe- og sektordiagrammer og misoppfatninger
Figur 5.1 Måling av tilfredshet på ordinalt målenivå.
Figur 25.1 Sammenheng mellom inntekt i millioner NOK (y) og antall års utdanning (x) utover grunnskolen. I denne populasjonen er ß0 = 0.4 og ß1 =
MET 2211 Statistikk og dataanalyse
Repetisjon, del I Metode
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
SIV : Kategoriske variabler og normaltilnærmelsen
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
MET 2211 Statistikk og dataanalyse
forventning og varians
SIV : Metodevalg Stokastiske variabler
Figur 17.1 Histogram for alle DNB-kundene i undersøkelsen.
MET 2211 Statistikk og dataanalyse
SIV : Kapittel 9 Normalfordelingen 17/01/2019 Fred Wenstøp.
Nominelle renter og realrenter
Kapittel 10 Inferens om gjennomsnitt
Eric Jul PSE, Inst. for informatikk
Oppsummering fra forrige gang
Utvalgsfordelinger (Kapittel 5)
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

MAT0100V Sannsynlighetsregning og kombinatorikk Oppgaver om Binomisk og hypergeometrisk fordeling Forventning, varians og standardavvik Tilnærming av binomiske sannsynligheter Konfidensintervall Ørnulf Borgan Matematisk institutt Universitetet i Oslo

Vi har følgende situasjon: Hypergeometrisk fordeling Vi har følgende situasjon: Vi har en mengde med N elementer Elementene i mengden kan deles inn i to delmengder D og Det er m elementer i D og N – m elementer i Vi trekker tilfeldig n elementer fra mengden uten tilbakelegging La X være antall elementer vi trekker fra D 𝑃 𝑋=𝑘 = 𝑚 𝑘 ∙ 𝑁−𝑚 𝑛−𝑘 𝑁 𝑛

Vi har følgende situasjon: Binomisk fordeling Vi har følgende situasjon: Vi gjør n forsøk I hvert forsøk er det to muligheter: Enten inntreffer en bestemt begivenhet S ellers så gjør den ikke det I hvert forsøk er sannsynligheten lik p for at S skal inntreffe Forsøkene er uavhengige X er antall ganger S inntreffer i de n forsøkene 𝑃 𝑋=𝑘 = 𝑛 𝑘 𝑝 𝑘 (1−𝑝) 𝑛−𝑘

Trekning uten tilbakelegging: hypergeometrisk Trekning med tilbakelegging: binomisk 𝑃 𝑋=𝑘 = 3 𝑘 ∙ 2 2−𝑘 5 2 b) Uten tilbakelegging: 𝑃 𝑋=𝑘 = 2 𝑘 3 5 𝑘 2 5 2−𝑘 Med tilbakelegging: k 1 2 Uten P(X = k ) 0.10 0.60 0.30 Med 0.16 0.48 0.36

𝑃 𝑋=𝑘 = 300 𝑘 ∙ 200 2−𝑘 500 2 c) Uten tilbakelegging: 𝑃 𝑋=𝑘 = 300 𝑘 ∙ 200 2−𝑘 500 2 c) Uten tilbakelegging: 𝑃 𝑋=𝑘 = 2 𝑘 300 500 𝑘 200 500 2−𝑘 Med tilbakelegging: Uten (b) P(X = k ) 0.10 0.60 0.30 Uten (c) 0.1595 0.4810 0.3595 Med 0.16 0.48 0.36

d) Utvalget vi trekker er lite i forhold til hele populasjonen. Derfor er det rimelig å anta at X er binomisk fordelt.

a) Jf. forrige oppgave. 𝑃 𝑋=𝑘 = 20 𝑘 ∙ 0.25 𝑘 ∙0.75 20−𝑘 b) = 20 3 ∙ 0.25 3 ∙0.75 20−3 c) 𝑃 𝑋=3 =1140∙ 0.25 3 ∙0.75 17 =0.134 𝑃 𝑋=4 =0.190 𝑃 𝑋=5 =0.202

En tilfeldig variabel X har mulige verdier x1 , x2 ,…, xm En tilfeldig variabel X har mulige verdier x1 , x2 ,…, xm . Da er forventningsverdien En tilfeldig variabel X har mulige verdier x1 , x2 , …, xm og forventningsverdi Da er variansen Standardavviket til en tilfeldig variabel X er gitt ved

X er erstatning for en tilfeldig valgt sykkeleier 𝐸 𝑋 =0∙0.93+ 1000∙0.05+ 3500∙0.02=120 kroner Var 𝑋 = (0−120) 2 ∙0.93+ 1000−120 2 ∙0.05+ 3500−120 2 ∙0.02 =280600 kroner 2 𝑆𝐷 𝑋 = 280600 =529.72 kroner

Tilnærming av binomiske sannsynligheter Tidligere var det vanskelig å bruke formelen for binomisk fordeling til å regne ut sannsynligheter når n er stor (www.york.ac.uk/depts/maths/histstat) Alt i 1733 viste Abraham de Moivre hvordan en kan finne tilnærmingsverdier for binomiske sannsynligheter Selv om det nå er enklere å bestemme binomiske sannsynligheter, er denne tilnærmelsen fortsatt viktig

Binomisk fordeling for p = 0.25 og n = 10, 25, 50, 100 Fordelingen forskyves mot høyre og blir mer «spredt ut» når n øker

For å finne en tilnærming «forskyver» vi fordelingene slik at de får « tyngdepunktet» i origo, og vi «skalerer» dem slik at de får samme spredning Vi ser derfor på den standardiserte variabelen Vi har at E(Z) = 0 og SD(Z) = 1 Vi merker oss at hvis X = k så er Vi får derfor fordelingen til Z av fordelingen til X

Stolpediagram for fordelingen til Z Arealet av en stolpe svarer til sannsynligheten for at Z får den aktuelle verdien Stolpediagrammene nærmer seg standard-normalfordelingsfunksjonen

Vil bruke de Moivres tilnærming til å finne når n = 100 og p = 0.25 Vi merker oss at Summen av arealene av søylene er omtrent like stor som arealet under f(x) til venstre for 1.85 Vi skal egentlig summere arealene av alle søylene til venstre for 1.85

Arealet under standardnormalfordelings-funksjonen til venstre for 1 Arealet under standardnormalfordelings-funksjonen til venstre for 1.85 finner vi av tabellen bak i kompendiet: De Moivres tilnærming gir at

La X være antall som ville ha stemt på Ap X er binomisk fordelt med n = 5000 og p = 0.308 a) Ved de Moivres tilnærming finner vi at b)

Estimering og konfidensintervall Vi er interessert i å anslå («estimere») verdien av p ut fra resultatet av et forsøk, og også å si noe om hvor presist anslaget er Vi ser på en stor populasjon der en ukjent andel p har et bestemt «kjennetegn» Vi trekker et tilfeldig utvalg på n individer fra populasjonen. Størrelsen av utvalget er liten i forhold til størrelsen av hele populasjonen La X være antall i utvalget som har kjennetegnet Vi kan regne som om X er binomisk fordelt med p lik den ukjente andelen i populasjonen som har kjennetegnet

Av de Moivres resultat finner vi at Til å anslå («estimere») p bruker vi andelen i utvalget som har kjennetegnet, dvs. Av de Moivres resultat finner vi at 2.5% 95% 2.5% Nå er Det følger at

Kan vise at vi kan erstatte p med i nevneren: Ulikhetene kan omformes slik at vi får p alene i midten: Det er altså tilnærmet 95% sannsynlig at undersøkelsen vil gi et resultat som er slik at p blir liggende i konfidensintervallet:

a) Hvis det produseres frø på flere jorder, bør produsenten velge frø fra tilfeldige steder på alle jordene og blande dem godt før de 500 frøene velges ut b) Vi har n = 500 og Et 95% konfidensintervall for spireevnen er dvs.

2010: Vi har n = 60608 og Et 95% konfidensintervall er dvs. 1987: Vi har n = 53500 og dvs.

Vi lager et 95% konfidensintervall for sannsynligheten for sekser Vi har n = 204 og Et 95% konfidensintervall er dvs.