Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Statistikk 2 Sentral- og spredningsmål

Liknende presentasjoner


Presentasjon om: "Statistikk 2 Sentral- og spredningsmål"— Utskrift av presentasjonen:

1 Statistikk 2 Sentral- og spredningsmål
Grunnskolelærerutdanningen 1–7, nett Matematikk 1, modul 2 Forelesning mandag 9. januar 2017 Statistikk 2 Sentral- og spredningsmål

2 Sentralmål Gitt en datamengde kan vi regne ut gjennomsnitt, median og typetall for å få et inntrykk av datamaterialet som helhet. La oss tenke oss at vi er på en fest i England. Ifølge kulturen der er det forventet at man tar med drikke til fellesskapet (altså ikke sånn som i Norge). Og det er sosialt selvmord å ta med mye mindre enn det alle andre har tatt med. La oss forestille oss at vi har med oss 3 flasker med Clausthaler. Vi registrerer at de andre gjestene har med seg følgende antall flasker:

3 Sentralmål Betyr dette at vi har tatt med oss for lite? Eller er det passe? Vi bruker statistikkens språk for å undersøke! Typetall: Det tallet som opptrer flest ganger. (Hvis alle tallene er forskjellige, sier vi at typetallet ikke er definert.) I vårt tilfelle er typetallet 3. Det er altså «mest typisk» å ta med seg 3 flasker Clausthaler. Sånn sett kan vi føle oss sosialt trygge. Median: Vi stiller opp tallene i stigende rekkefølge og velger det midterste. Hvis det er et partall observasjoner, er medianen gjennomsnittet av de to midterste. I vårt tilfelle: Medianen er 3. Altså er det like mange som har mindre enn eller lik 3 flasker, som det er folk som har større enn eller lik 3 flasker. Det virker bra for vår del.

4 Sentralmål Men det er noen som har tatt med seg både 6, 7 og 8 flasker, og disse trekker jo opp det man forventer at folk tar med seg. Medianen tar ikke noe hensyn til dette. Så vi må regne på en annen måte: Gjennomsnitt: Summen av alle flaskene delt på antall folk =3,87. Vi ligger altså under snittet i hva vi har med oss. Det er ikke så bra.

5 Spredningsmål Det kan være lurt å se litt på hvor langt unna gjennomsnittet vi befinner oss. Da tar man i bruk spredningsmål for å undersøke. Variasjonsbredde: Største minus minste verdi. I vårt tilfelle: 8–1 = 7 flasker. Det er altså stor forskjell mellom den som har med mest, og den som har med minst. Variasjonsbredden gir et dårlig bilde av situasjonen hvis vi har ekstreme avvik fra datamengden. Men hvis variasjonsbredden er liten, er vi sikre på at det er lite variasjon blant alle tallene.

6 Spredningsmål Kvartildifferansen: Her stiller vi opp dataene i stigende rekkefølge, og tar observasjon nr. 𝑛⋅0,75 minus observasjon nr. 𝑛⋅0,25, der n er antall observasjoner. I vårt tilfelle er n = 15, så vi skal ta observasjon nr. 15⋅0,75≈11 minus observasjon nr. 15⋅0,25≈4. Vi har , altså er 5 den 11. observasjonen, og 3 er den 4. observasjonen. Kvartildifferansen er da 5 – 3 = 2. Kvartildifferansen forteller oss hvor mye variasjon det er blant de 50 % midterste observasjonene, som vi på en måte regner som de mest typiske. Denne gjør at ekstreme observasjoner lukes vekk og ikke påvirker spredningsmålet på resten av datamaterialet. I vårt tilfelle ser vi at blant de 50 % midterste observasjonene er det ikke mer enn 2 flasker som skiller. En ulempe med kvartildifferanse er at den er lite brukt i praksis, og at definisjonen på hvordan den skal regnes ut, varierer mye. (Alfa bruker en litt annen definisjon enn det som står her.)

7 Spredningsmål Gjennomsnittlig absoluttavvik: Her regner vi ut gjennomsnittet på hvor mye forskjell det er på alle tallene fra gjennomsnittet: Først litt notasjon: Absoluttverditegnet, som er en loddrett strek vi setter på hver side av tallet, betyr at vi tar vekk minusen foran tallet hvis det er et minustegn der. F.eks. er −5 =5 og 7 =7 (her var det ikke noe minustegn). Hvis vi har et regnestykke innimellom de loddrette strekene, regner vi ut stykket først, og så fjerner evt. minustegn. F.eks. er 2−5 = −3 =3. Her er gjennomsnittlig absoluttavvik i vårt eksempel: 1−3,87 + 4−3,87 + 3−3,87 + 3−3,87 + 3−3,87 + 3−3,87 + 6−3,87 + 5−3,87 + 2−3,87 + 7−3,87 + 3−3,87 + 1−3,87 + 3−3,87 + 6−3,87 + 8−3,87 15 = 2,87+0,13+0,87+0,87+0,87+0,87+2,13+1,13+1,87+3,13+0,87+2,87+0,87+2,13+4,13 15 ≈1,7. Dette forteller oss at selv om gjennomsnittet er 3,87 flasker, så er det også sånn at det er «typisk» å ha med 1,7 flasker over eller under dette gjennomsnittet. Dette spredningsmålet er også ikke brukt så mye i praksis, og tar tid å regne ut. Men den gir et bra bilde av situasjonen.

8 Spredningsmål Standardavvik er det mest brukte spredningsmålet, og har flest egenskaper knyttet til seg. I vårt eksempel er standardavviket følgende: S = 1−3, −3, −3, −3, −3, −3, −3, −3, −3, −3, −3, −3, −3, −3, −3, = −2, , −0, −0, −0, −0, , , −1, , −0, −2, −0, , , ≈2,0 Dette tallet kan tolkes hvis vi slår opp på s. 553 i Alfa. Der finner vi at man kan regne med å finne minst 75 % av datamaterialet innenfor 2 standardavvik fra gjennomsnittet. I vårt eksempel betyr dette at vi kan regne med å finne minst 75 % av datamaterialet mellom 3,87–2·2,0 = –1,87 (vi tolker det som 0) og 3,87 + 2·2,0 = 7,87. Med små datamengder som vi har her, er det naturlig at teorien avviker litt fra virkeligheten. Men i praksis, når det gjerne er flere hundre eller tusen observasjoner man skal behandle, gir standardavviket et svært godt bilde av situasjonen. F.eks. hvis denne festen her hadde hatt flere hundre deltagere, ville dette standardavviket fortalt oss at det ville vært sosialt akseptabelt med alt mellom 0 og 7 flasker Clausthaler.

9 Oppgaver Hentet fra kontinuasjonseksamen for 2NGLU(ss) våren 2012:
En person har vært heldig og fått fiskekort i Altaelva. På de døgnene han fisket fikk han fem laks som veide: (Vekten er oppgitt i kg og avrundet til nærmeste hele kg) Regn ut gjennomsnittet og medianen. Hva blir variasjonsbredden og gjennomsnittlig absoluttavvik? De som driver Altaelva fører nøye oversikt over hvor mange laks som er tatt og hva hver enkelt fisk veier. Ene sesongen viste det seg at det var tatt 400 laks. Gjennomsnittsvekten var 7 kilo og standardavviket var 5. Gi en beskrivelse av størrelsen på laksen som ble tatt i Altaelva denne sesongen.

10 Oppgaver dere kan gjøre hjemme
Alfa: 6.1 (a)(b)(c), 6.2 (a) (unntatt histogrammet) (c), 6.5, 6.8. Alfa: 6.15 (bare finn standardavviket), 6.16 (kvartilavvik er det samme som kvartildifferanse), 6.17 Oppgave 9 fra eksamen våren 2012: For å få delta i New York maraton må en enten klare et kvalifiseringskrav (som er ganske tøft), eller så må en melde seg på i et lotteri der arrangøren trekker tilfeldig ut hvem som skal få delta. De siste årene er det ca. 15 % av de som melder seg på lotteriet som har fått startplass. I denne oppgaven regner vi derfor at det en sannsynlighet på 0,15 for å vinne en startplass i New York maraton. To av medlemmer i den lokale løpeklubben (Hans og Grete) har lyst til å løpe New York maraton, og begge melder seg på lotteriet siden de ikke er gode nok til å klare kvalifiseringskravet. Hva er sannsynligheten for at Hans vinner i lotteriet? Hva er sannsynligheten for at både Hans og Grete vinner i lotteriet? Hva er sannsynligheten for at minst en av dem får gleden av å delta i New York maraton?


Laste ned ppt "Statistikk 2 Sentral- og spredningsmål"

Liknende presentasjoner


Annonser fra Google