Statistikk 2 Sentral- og spredningsmål

Slides:



Advertisements
Liknende presentasjoner
Statistikk og sannsynlighetsregning
Advertisements

Kap 03 Beskrivende statistikk
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Statistikk 2 M1 årskurs HVE 31. august 2009.
M1 årskurs HVE 7. september 2009
Statistikk M4 Mandag 20. april 2009.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Introduksjon.  ITIL står for Information Technology Infrastructure Library.  Det er mye snakk om ITIL i næringslivet for tiden, og veldig mange bedrifter.
Bevegelse I samlingen snaket vi om bevegelse. Hva tenker barna når vi sier ordet bevegelse? De reiser seg og forklarer at når vi gjør sånn og sånn med.
Tallinja Audun Merete Veronika. En kort beskrivelse; Målet er å få en større forståelse for tall og tallinja, å kunne plassere hele tal, negative og positive,
Kapittel 1 Læring og undervisning i sosialkunnskap.
Kapittel 12. Det internasjonale samfunnet Del 5 Internasjonale forhold Denne delen skal hjelpe elevene til å nå følgende kompetansemål i læreplanen: 5a.
Livsmot og livsmestring -Kunnskap om sunnhet som grunnlag – Martha Bjelland Bø – Sagavoll folkehøgskole.
Observasjonstema: Glede av hverandre. Denne gangen har vi valgt å lage en power point presentasjon, vi håper dette gir dere enda bedre mulighet til å se.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
DOMMERMANUAL TEMA NORDEN NM 2016 Trondhjem mars.
SKRIV OM SLIK AT SETNINGENE BETYR OMTRENT DET SAMME Kapittel 8 oppgave j.
Accountability – med tilstandsrapportering som eksempel ”6- Fylkeskommunesamarbeidet” Oslo
VURDERING FOR LÆRING Forskrift til Opplæringsloven, § 3
Fem viktigste tips Som hjelper deg med å vinne i online Bingo Innsendt av :
GENG , A 08:30-11:15 B 11:30-14:15.
Alkoholbruk blant unge i Agder
En faktor i utvikling av teori om sinnet og sosial kompetanse
Hva handler matematikk om? Om hvorfor har vi det i skolen?
Refleksjon over egen læring har stor effekt
Multiplikasjon og divisjon
Matematikk 101 og 102.
MAT0100V Sannsynlighetsregning og kombinatorikk
Kompleksitetsanalyse
Hvorfor er det vanskelig å ta gode beslutninger?
Beregningsmodell for hverdagsrehabilitering
Setningsanalyse og tekstsammenbindere
VELKOMMEN TIL HØSTENS FORELDREMØTE I 2C
Gang.
Identitet handler om hva du tror er den dypeste og mest virkelige virkeligheten, om hvem eller hva som beskriver denne virkeligheten, hvordan du forholder.
Å leve med assistanse Denne bolken holdes av noen som selv lever med assistent i parforholdet. Ca 1time brukes på dette. Veldig fint med dialog mellom.
1 Egenomsorg og helse.
Kapittel 1 Helse og sykdom
Brukerveiledning til programmering av LEGO Mindstorm NXT-roboter
Video i undervisningen
Brønnbygging i Afrika.
Kapittel 46 Utviklingssamtale.
Bli kjent med ordboka - en oversikt over innholdet
GOD SKOLE FOR BARN I KAMBODSJA
Bergeningsrente og KS sitt høringssvar
Kor attraktiv er Bø og korleis kan vi påvirke nærings- og besøksattraktiviteten? 16. Februar 2015.
Velkommen til Newtonrommet
Hva vet vi om barn og smak
Sannsynlighetsregning 4
Samtaletrekk B – Samarbeid
Statistikk 1 Stolpe- og sektordiagrammer og misoppfatninger
Medarbeiderundersøkelsen UiT 2011
Den matematiske samtalen
Utforskende undervisning A – Forarbeid
KOMPETANSE FOR MANGFOLD
Samtaletrekk B – Samarbeid
Bevis i matematikk- undervisningen
Elektronisk løgndetektor
Kjennetegn på problemløsing B – Samarbeid
Gjennomføring etter 5 år
Oppfølging av Høstrapporten
SAMM Systematisk Arbeid Med Motivasjon i ungdomsskole
Fysisk og psykisk helse
Vi beklager, men opptaket mangler for første del av talen
Tannhelseundervisning for innvandrere
Tilpasset opplæring Kurs 5
Kapittel 5 Argumentasjon
Oppsummering fra forrige gang
Utskrift av presentasjonen:

Statistikk 2 Sentral- og spredningsmål Grunnskolelærerutdanningen 1–7, nett Matematikk 1, modul 2 Forelesning mandag 9. januar 2017 Statistikk 2 Sentral- og spredningsmål

Sentralmål Gitt en datamengde kan vi regne ut gjennomsnitt, median og typetall for å få et inntrykk av datamaterialet som helhet. La oss tenke oss at vi er på en fest i England. Ifølge kulturen der er det forventet at man tar med drikke til fellesskapet (altså ikke sånn som i Norge). Og det er sosialt selvmord å ta med mye mindre enn det alle andre har tatt med. La oss forestille oss at vi har med oss 3 flasker med Clausthaler. Vi registrerer at de andre gjestene har med seg følgende antall flasker: 1 4 3 3 3 3 6 5 2 7 3 1 3 6 8

Sentralmål Betyr dette at vi har tatt med oss for lite? Eller er det passe? Vi bruker statistikkens språk for å undersøke! Typetall: Det tallet som opptrer flest ganger. (Hvis alle tallene er forskjellige, sier vi at typetallet ikke er definert.) I vårt tilfelle er typetallet 3. Det er altså «mest typisk» å ta med seg 3 flasker Clausthaler. Sånn sett kan vi føle oss sosialt trygge. Median: Vi stiller opp tallene i stigende rekkefølge og velger det midterste. Hvis det er et partall observasjoner, er medianen gjennomsnittet av de to midterste. I vårt tilfelle: 1 1 2 3 3 3 3 3 3 4 5 6 6 7 8. Medianen er 3. Altså er det like mange som har mindre enn eller lik 3 flasker, som det er folk som har større enn eller lik 3 flasker. Det virker bra for vår del.

Sentralmål Men det er noen som har tatt med seg både 6, 7 og 8 flasker, og disse trekker jo opp det man forventer at folk tar med seg. Medianen tar ikke noe hensyn til dette. Så vi må regne på en annen måte: Gjennomsnitt: Summen av alle flaskene delt på antall folk. 1+4+3+3+3+3+6+5+2+7+3+1+3+6+8 15 =3,87. Vi ligger altså under snittet i hva vi har med oss. Det er ikke så bra.

Spredningsmål Det kan være lurt å se litt på hvor langt unna gjennomsnittet vi befinner oss. Da tar man i bruk spredningsmål for å undersøke. Variasjonsbredde: Største minus minste verdi. I vårt tilfelle: 8–1 = 7 flasker. Det er altså stor forskjell mellom den som har med mest, og den som har med minst. Variasjonsbredden gir et dårlig bilde av situasjonen hvis vi har ekstreme avvik fra datamengden. Men hvis variasjonsbredden er liten, er vi sikre på at det er lite variasjon blant alle tallene.

Spredningsmål Kvartildifferansen: Her stiller vi opp dataene i stigende rekkefølge, og tar observasjon nr. 𝑛⋅0,75 minus observasjon nr. 𝑛⋅0,25, der n er antall observasjoner. I vårt tilfelle er n = 15, så vi skal ta observasjon nr. 15⋅0,75≈11 minus observasjon nr. 15⋅0,25≈4. Vi har 1 1 2 3 3 3 3 3 3 4 5 6 6 7 8, altså er 5 den 11. observasjonen, og 3 er den 4. observasjonen. Kvartildifferansen er da 5 – 3 = 2. Kvartildifferansen forteller oss hvor mye variasjon det er blant de 50 % midterste observasjonene, som vi på en måte regner som de mest typiske. Denne gjør at ekstreme observasjoner lukes vekk og ikke påvirker spredningsmålet på resten av datamaterialet. I vårt tilfelle ser vi at blant de 50 % midterste observasjonene er det ikke mer enn 2 flasker som skiller. En ulempe med kvartildifferanse er at den er lite brukt i praksis, og at definisjonen på hvordan den skal regnes ut, varierer mye. (Alfa bruker en litt annen definisjon enn det som står her.)

Spredningsmål Gjennomsnittlig absoluttavvik: Her regner vi ut gjennomsnittet på hvor mye forskjell det er på alle tallene fra gjennomsnittet: Først litt notasjon: Absoluttverditegnet, som er en loddrett strek vi setter på hver side av tallet, betyr at vi tar vekk minusen foran tallet hvis det er et minustegn der. F.eks. er −5 =5 og 7 =7 (her var det ikke noe minustegn). Hvis vi har et regnestykke innimellom de loddrette strekene, regner vi ut stykket først, og så fjerner evt. minustegn. F.eks. er 2−5 = −3 =3. Her er gjennomsnittlig absoluttavvik i vårt eksempel: 1−3,87 + 4−3,87 + 3−3,87 + 3−3,87 + 3−3,87 + 3−3,87 + 6−3,87 + 5−3,87 + 2−3,87 + 7−3,87 + 3−3,87 + 1−3,87 + 3−3,87 + 6−3,87 + 8−3,87 15 = 2,87+0,13+0,87+0,87+0,87+0,87+2,13+1,13+1,87+3,13+0,87+2,87+0,87+2,13+4,13 15 ≈1,7. Dette forteller oss at selv om gjennomsnittet er 3,87 flasker, så er det også sånn at det er «typisk» å ha med 1,7 flasker over eller under dette gjennomsnittet. Dette spredningsmålet er også ikke brukt så mye i praksis, og tar tid å regne ut. Men den gir et bra bilde av situasjonen.

Spredningsmål Standardavvik er det mest brukte spredningsmålet, og har flest egenskaper knyttet til seg. I vårt eksempel er standardavviket følgende: S = 1−3,87 2 + 4−3,87 2 + 3−3,87 2 + 3−3,87 2 + 3−3,87 2 + 3−3,87 2 + 6−3,87 2 + 5−3,87 2 + 2−3,87 2 + 7−3,87 2 + 3−3,87 2 + 1−3,87 2 + 3−3,87 2 + 6−3,87 2 + 8−3,87 2 15 = −2,87 2 + 0,13 2 + −0,87 2 + −0,87 2 + −0,87 2 + −0,87 2 + 2,13 2 + 1,13 2 + −1,87 2 + 3,13 2 + −0,87 2 + −2,87 2 + −0,87 2 + 2,13 2 +4,13 2 15 ≈2,0 Dette tallet kan tolkes hvis vi slår opp på s. 553 i Alfa. Der finner vi at man kan regne med å finne minst 75 % av datamaterialet innenfor 2 standardavvik fra gjennomsnittet. I vårt eksempel betyr dette at vi kan regne med å finne minst 75 % av datamaterialet mellom 3,87–2·2,0 = –1,87 (vi tolker det som 0) og 3,87 + 2·2,0 = 7,87. Med små datamengder som vi har her, er det naturlig at teorien avviker litt fra virkeligheten. Men i praksis, når det gjerne er flere hundre eller tusen observasjoner man skal behandle, gir standardavviket et svært godt bilde av situasjonen. F.eks. hvis denne festen her hadde hatt flere hundre deltagere, ville dette standardavviket fortalt oss at det ville vært sosialt akseptabelt med alt mellom 0 og 7 flasker Clausthaler.

Oppgaver Hentet fra kontinuasjonseksamen for 2NGLU(ss) våren 2012: En person har vært heldig og fått fiskekort i Altaelva. På de døgnene han fisket fikk han fem laks som veide: (Vekten er oppgitt i kg og avrundet til nærmeste hele kg) 2 2 3 10 12 Regn ut gjennomsnittet og medianen. Hva blir variasjonsbredden og gjennomsnittlig absoluttavvik? De som driver Altaelva fører nøye oversikt over hvor mange laks som er tatt og hva hver enkelt fisk veier. Ene sesongen viste det seg at det var tatt 400 laks. Gjennomsnittsvekten var 7 kilo og standardavviket var 5. Gi en beskrivelse av størrelsen på laksen som ble tatt i Altaelva denne sesongen.

Oppgaver dere kan gjøre hjemme Alfa: 6.1 (a)(b)(c), 6.2 (a) (unntatt histogrammet) (c), 6.5, 6.8. Alfa: 6.15 (bare finn standardavviket), 6.16 (kvartilavvik er det samme som kvartildifferanse), 6.17 Oppgave 9 fra eksamen våren 2012: For å få delta i New York maraton må en enten klare et kvalifiseringskrav (som er ganske tøft), eller så må en melde seg på i et lotteri der arrangøren trekker tilfeldig ut hvem som skal få delta. De siste årene er det ca. 15 % av de som melder seg på lotteriet som har fått startplass. I denne oppgaven regner vi derfor at det en sannsynlighet på 0,15 for å vinne en startplass i New York maraton. To av medlemmer i den lokale løpeklubben (Hans og Grete) har lyst til å løpe New York maraton, og begge melder seg på lotteriet siden de ikke er gode nok til å klare kvalifiseringskravet. Hva er sannsynligheten for at Hans vinner i lotteriet? Hva er sannsynligheten for at både Hans og Grete vinner i lotteriet? Hva er sannsynligheten for at minst en av dem får gleden av å delta i New York maraton?