Statistikk En innføring i statistikk for Vitenfabrikken ved Lars Sund og Johan Nygaard.

Slides:



Advertisements
Liknende presentasjoner
Kombinatorikk for lærerstudenter
Advertisements

Kommunalt omdømme – beslutningstaker Nordmøre (ORKíde) November 2010.
1 Sannsynlighetsregning Gjenfinningssystemer og verktøy II Jon Anjer.
3. januar 2007 VOLUMES AND GENEALOGY: Den neste generasjonen.
Skedsmo 12. november 2009 Tonje Hilde Giæver
Statistikk og sannsynlighetsregning
PowerPoint laget av Bendik S. Søvegjarto Konsept, tekst og regler av Skage Hansen.
Statistikk og sannsynlighetsregning
Gjenfinningssystemer og verktøy II
STATISTISK GENERALISERING
Statistikk og sannsynlighetsregning
Analyse og tolkning av datamaterialet
Komplekse tall Naturlige tall
Hendelser betegnes med A, B, C osv.
Statistikk på 20 2 timer PSY-1002
Bærekraftig utvikling - forskerspiren
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Diskrete stokastiske variable
INF 4130 Eksamen 2008 Gjennomgang.
Brukerundersøkelse gjennomført for Bergen kommune Foresattes tilfredshet med kommunens barnehager © TNS Gallup – Politikk & samfunn Avdelingsleder.
Sannsynlighetsregning
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Sentio Research Norge EØS Representativ undersøkelse 1000 respondenter Tatt opp oktober 2012 Oppdragsgivere:
Hypotesetesting, og kontinuerlige stokastiske variable
Usikkerheter og sannsynligheter Petter Mostad
Sannsynlighet og kombinatorikk
Kombinatorikk og sannsynlighet
Statistikk 2 M1 årskurs HVE 31. august 2009.
Matematikk 1 årskurs 26. oktober 2009
Sannsynlighet og kombinatorikk
A2A / A2B M1 årskurs 4. november 2009
M1 årskurs HVE 7. september 2009
Statistikk M4 Mandag 20. april 2009.
1 Bruk av mobilt medieinnhold 3Q 2006 Knut-Arne Futsæter og Katja Møglestue TNS Gallup
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Sommerkurs 17. juli Gruppe B. I dag Indirekte tale Avhengige interrogativer Ingen av delene Diskusjonsoppgaver om befolkning Rollespill med utgangspunkt.
Statistikk og sannsyn Analysere statistiske data og vise kjeldekritikk Drøfte ulike dataframstillingar og kva inntrykk dei kan gje Kjelde: Den norske foreininga.
Oppgave:  Regn ut = ? Gå i gruppe på 3. Forklar hva du har gjort, hvordan du har tenkt, hvorfor blir det riktig? Har dere ulike strategier?
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Kombinatorikk Ordnede utvalg med og uten tilbakelegging.
Sannsynlighet for alle. Signe Holm Knudtzon Høgskolen i Buskerud og Vestfold Novemberkonferansen 2015 Signe Holm Knudtzon. HBV. Sannsynlighet for alle1.
”Nye” kognitive tester Peter Wetterberg, overlege Hukommelsesklinikken Ullevål sykehus.
Oppstart oppstart. Hva er matematikk for små barn? Barn er opptatt av og nysgjerrige på det meste, også på matematikk. Størrelser, alder, former, tall.
3.14 X AXIS 6.65 BASE MARGIN 5.95 TOP MARGIN 4.52 CHART TOP LEFT MARGIN RIGHT MARGIN Tracking av digitalradio-andel i Norge © TNS Tracking.
Statistikk Dette er Norge Å kunne tolke statistiske data er en.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Rapportkurs Bevisst Superbrukere Repetisjon : Kubeverktøy -Filter: Mindre datasett å jobbe på, noe som kan bli mer oversiktlig. Nyttig når.
MÅLINGER ER BRA - GOD STYRING VIKTIGST Jan Ubøe, professor i matematikk ved NHH.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Forventning, varians og standardavvik Tilnærming.
Statistikk Dette er Norge
Kjennskap til etablering av «Innbyggerservice» og inntrykk av informasjon fra kommunen generelt Bergen omnibus Januar 2017.
Holdninger til konkurranseutsetting av velferdstjenester Befolkningsundersøkelse gjennomført i juni 2017 på oppdrag for NHO.
Tall og tallforståelse
Sinus 1P Sinus 2P Sinus 1P-Y Trondheim, 6. mai 2014.
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Gang.
Statistikk 2 Sentral- og spredningsmål
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Brukerveiledning til programmering av LEGO Mindstorm NXT-roboter
Sannsynlighetsregning 4
Skriv bedre tekster av Dagfinn Hauge- Media serv
Figur 9.1 Sannsynlighet beregnes på en skala fra 0 til 1.
Statistikk 1 Stolpe- og sektordiagrammer og misoppfatninger
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
Figur 17.1 Histogram for alle DNB-kundene i undersøkelsen.
Avislesing 2018: Tilbakegang for papiravisene fortsetter
Dybdelæring – regneark B – Samarbeid
Oppsummering fra forrige gang
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

Statistikk En innføring i statistikk for Vitenfabrikken ved Lars Sund og Johan Nygaard

Statistikk Vi har kastet mynt og krone og fått krone tre ganger på rad, så nå er det liten sjanse for å få krone en fjerde gang. Statistikk handler om behandling av store tallmengder og fremstilling av disse. Tallene kan være innsamlede eller sannsynlige mengder. Statistikken kan ikke overføres til enkelthendelser som f.eks.: Vi må ikke få mer enn to barn, for hvert tredje barn som fødes er en kineser.

Statistikk Dette sier ikke noe om hvem som stemmer hva. Den statistikken som presenteres oftest er meningsmålinger. Disse presenteres i prosenter, som f.eks. : AP har nå en oppslutning på 31,7 %, en øking på 3,7 prosentpoeng siden siste måling. Frp har en oppslutning på 16,4 %, en nedgang på 2,4 prosentpoeng siden siste måling.

Prosentpoeng er et nytt ord på norsk, men betyr forandring i prosent-tallet. Statistikk Dersom et parti øker oppslutningen fra 10% til 12 %, da er økingen 2 prosentpoeng, mens økingen i stemmer er 20 %.

Her er forskjellige måter å se på et lands totale utslipp av CO 2 målt i millioner tonn per år. Dataene er: ,010,911,612,212,6 Fremstillingen av statistiske data kan gjøres på forskjellige måter. Statistikk

Det er vanligst å fremstille forløpet i et diagram med kolonner som gir et greit inntrykk av helheten:

Statistikk Alle er ikke like glade for utslipp av CO2, så de vil heller poengtere økingen i utslippene og setter opp følgende graf. Her er år 2001 satt som startpunkt. Dette gir et annet bilde:

Statistikk Noen har arbeidet med å minske utslippene. De vil kanskje sette opp verdiene slik at de gir et gunstigere bilde. Det kan gjøres ved å sette opp økingen i utslipp fra ett år til neste:

Statistikk Husk alltid å lese på aksene hva som fremstilles. Disse diagrammene gir helt forskjellige inntrykk, noe som stadig brukes av mediene og politikere. Det gjelder å være oppmerksom på slik behandling. Det kan vel kalles manipulering, men det er ikke lureri. Datasettene er de samme.

Statistikk Resultatene kan fremstilles som en kake hvor størrelsen viser resultatet av målingene. Dette kalles sektordiagram. Leke med jo-jo Tid til å leke med jo-joen Tid til å vinde opp snoren

Statistikk I vårt eksempel vil det bli: Store datasett krever indikatorer som fort og greit forteller hva dataene står for. Tilfeldige data vil ofte fordele seg etter normalfordelingskurven om en middelverdi. Middelverdien µ, er summen av alle dataene delt på antall målinger. 10,0 + 10,9 + 11,6 + 12,2 + 12,6 5 Middelverdien blir her µ = 11,5.

En annen verdi er median. Medianen er det tallet som står i midten når tallene settes opp i stigende rekkefølge. Statistikk 10,0 10,9 11,6 12,2 12,6 I dette eksemplet blir medianen 11,6.

Statistikk Normalfordelingen ser ut slik figuren viser: Den vanligste fordelingen i statistikk er normalfordelingen. Her er det mange verdier, og verdiene har en viss spredning.

Statistikk Standardavviket, σ, angir bredden eller spredningen i dataene. Standardavviket er definert som kvadratroten av gjennomsnittet av kvadratene av avstanden fra middelverdien.. Matematisk ser det slik ut: (her er middelverdien)

Figuren viser at 68,2 % av resultatene ligger innenfor ett standardavvik på hver side av middelverdien og 95,4 % ligger innenfor to standardavvik.

Sannsynlighetsregning er en viktig del av statistikken. Statistikk Vi gjør et forsøk der en mynt kastes opp i luften et visst antall ganger, f.eks.100, og noterer antall ganger vi fikk krone. Dette forsøket gjentas mange ganger, og for hvert forsøk (100 kast) noteres antall krone som kommer opp av de 100. Antall krone avsettes langs x-aksen, og antall forsøk hvor dette krone-antallet kom opp avsettes langs y-aksen. Dette vil gi en normalfordeling. Hvert kast er uavhengig av det forrige (antall krone i 100 kast) Antall forsøk

Statistikk I 1889 laget Francis Galton en simulering av normalfordelingen:

Statistikk Resultatene av flere forsøk:

Statistikk Tilsvarende forsøk med et annet apparat:

Statistikk Totalt blir sannsynligheten for å få mynt 5 ganger på rad: 1/2 x 1/2 x 1/2 x 1/2 x 1/2 = 1/32. Tenk at vi har kastet krone/mynt og fått opp mynt fire ganger etter hverandre. Hva er da sjansen for å få mynt en femte gang? Den er som for hvert kast, nemlig 1/2. Mynten husker ikke hva den viste sist. Spør vi hva sjansen for å få mynt fem ganger på rad er, før vi begynner, så blir det noe helt annet. Da blir sannsynligheten 1/2 for hvert kast forutsatt at de forrige også var mynt.

Statistikk Utfall ved fem kast med mynt: Kast KMKM

Statistikk Utfall ved fem kast med mynt: Kast KMKM KMKMKMKM

Statistikk Utfall ved fem kast med mynt: Kast KMKM KMKMKMKM KMKMKMKMKMKMKMKM

Statistikk Utfall ved fem kast med mynt: Kast KMKM KMKMKMKM KMKMKMKMKMKMKMKM KMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKM

Statistikk Utfall ved fem kast med mynt: Kast KMKM KMKMKMKM KMKMKMKMKMKMKMKM KMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKM KMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKM

Statistikk Hvor mange utfall med 3K og 2M finner du? Kast KMKM KMKMKMKM KMKMKMKMKMKMKMKM KMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKM KMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKMKM

Statistikk Antall krone Gunstige utfall Dersom vi teller opp utfallene, så får vi følgende tabell:

Statistikk Antall krone Sannsynlighet1/325/3210/32 5/321/32 Da antall mulige utfall blir 32, får vi følgende tabell for sannsynlighetene:

Statistikk En vanlig terning kan vise 1, 2, 3, 4, 5 eller 6. Ved mange kast vil det bli omtrent like mange av hver. Hva blir da middelverdien? Middelverdien blir 3,5. Det er greit, men terningen kan aldri vise middelverdien. Noen statistikker er rene rariteter. F.eks. viser statistikken at svensker har i gjennomsnitt 1,999 ben, og at forretningsmenn reiser mer med fly enn hjemmeværende husmødre. Nokså opplagt? Dersom vi skal lage en fordelingskurve med svenskenes ben, så er utfallene 0, 1 eller 2. Vi vet de fleste har to, så dette kan ikke bli en normalfordeling.

Statistikk Det er også andre fordelinger oppkalt etter matematikere som Poisson, Cauchy, Bernoulli, Rademacher, Bolzman, Laplace og Weibull, samt logaritmisk, triangulær, eksponensial- og gammafordeling. Alle disse har forskjellige forutsetninger for sannsynlig utfall.

Statistikk

Statistikken viser at 6 av 7 dverger ikke er Happy. Happy

Statistikk Ofte søkes korrelasjoner, sammenhenger mellom størrelser. Det regnes ut en korrelasjonsfaktor for å angi i hvor sterk grad størrelsene henger sammen. Denne faktoren varierer fra -1 til 1. Her kan det gjøres feil hvis en ikke er forsiktig. Det kan bli en sterk korrelasjon mellom to fenomener, men de kan jo ha en felles bakenforliggende årsak. F.eks. er det påvist en sterk korrelasjon mellom røking og eksamensnervøsitet. En slik korrelasjon indikerer at røking påvirker eksamensnervøsitet, men det kan jo tenkes at nervøse personer røker meget og har eksamensnerver uten at røkingen er årsaken.

Statistikk Hvorfor gjøres det så mye statistisk arbeid? I Norge er det Statistisk sentralbyrå, SSB, som utfører det meste, men det er også firma som f.eks. Norsk Gallup, TSN Gallup m.fl. SSB samler statistikk som er viktig for å styre Norge. Statistisk årbok viser landets tilstand. Ordet statistikk kommer fra status som betyr tilstand. Gallupundersøkelser brukes mye i reklame (Ni av ti filmstjerner bruker Lano), og ved valg (partibarometre). Her følger noen eksempler tatt fra Statistisk årbok:

Statistikk Dette bildet gir en enkel oversikt: Systempris på elektrisk kraft omsatt over Nord Pool Spot. Januar 2004-april Øre/kWh

Statistikk Her er et mer dystert bilde som gir mer informasjon i ett bilde enn det forrige.

Statistikk En av de viktigste indeksene fra SSB er Konsumprisindeksen. Dataene samles inn av SSB den 15. i hver måned, og månedens indeks offentliggjøres den 10. i måneden etter.

Statistikk Her vises samtidig flytteveger og mengder. Slik kan statistisk materiale illustreres på en enkel måte.

Statistikk Statistisk årbok inneholder mange kategorier: 00 Generelt 01 Naturressurser og miljø 02 Befolkning 03 Helse, sosial og kriminalitet 04 Utdanning 05 Personlig økonomi og boforhold 06 Arbeidsliv, yrkesdeltaking og lønn 07 Fritid, kultur, sport 08 Prisindekser og konjunkturindikatorer 09 Nasjonalregnskap og utenrikshandel 10 Næringsvirksomhet 11 Finansmarkeder og konkurser 12 Offentlige finanser Hvert av disse områdene inneholder mange statistikker.

THUNDERSTORMS Are 6 times less likely to happen in a kitchen

Statistikk Dersom du klarer å bli 100 år, så ligger du godt an. Statistikken viser nemlig at det er svært få over 100 år som dør.