M1 årskurs HVE 7. september 2009 Statistikk 3 M1 årskurs HVE 7. september 2009
Innhold Sentralmål og skjevhet Spredningsmål Undersøkelser Misvisende statistikk IKT i statistikk
Formler for gjennomsnitt og median Tenk om vi har et (kvantitativt) datamateriale som vi tenker sortert i stigende rekkefølge. Gjennomsnitt / middelverdi:
Medianen
§1. Sentralmål og skjevhet Vi sammenligner sentralmålene ved datamaterialene 7, 9, 10, 14, 15 og 4, 6, 8, 11, 15.
Generelt: Er gjennomsnittet / medianen større i ett datamateriale enn i et annet, betyr dette at observasjonene i det første er gjennomgående større enn observasjonene i det andre. (Se Lysø, s. 51.)
Men hvis observasjonene i ett av datamaterialene er mer skjevt fordelt enn i det andre, kan det bli et visst avvik fra dette prinsippet: De største observasjonene hos 7, 9, 10, 14, 15 og 4, 6, 8, 11, 15 er like.
Skjevhet Et mål for “symmetri” i et datamateriale: Skjevhet > 1: Øvre halvpart av observasjonene fordelt over et større område enn nederste halvparten Skjevhet < 1: Omvendt
Skjevhet og sentralmål Skjevhet > 1: Ofte er gjennomsnittet større enn medianen. Skjevhet < 1: Ofte er medianen større enn gjennomsnittet. Eks.: Sammenlign 5, 8, 10, 10, 12 og 7, 9, 10, 14, 15. Obs: Skjevhet er følsom mot ekstreme observasjoner.
Oppgave: Regn ut gjennomsnitt, median og modus for datamaterialene
§2. Spredningsmål Ulike måter å måle hvor mye avvik det er fra gjennomsnittet Variasjonsbredde er differensen mellom største og minste observasjon.
Kvartildifferense Da variasjonsbredde er mye påvirket av ekstreme observasjoner, brukes ofte kvartildifferense / kvartilavstand / midtspredning. Første (henh. andre, tredje) kvartil er en verdi slik at 25% (henh. 50%, 75%) av observasjonene er mindre enn eller lik denne verdien.
Vi skriver Q1, Q2 og Q3 for kvartilene. Q2 er ikke annet enn medianen. Kvartildifferensen er differensen Q3 − Q1. Kvartildifferensen/2 = kvartilavvik.
Andre spredningsmål Gjennomsnittsavvik er alltid 0! Gjennomsnittlig absoluttverdiavvik: Hvor stort er gjennomsnittlig avvik fra middelverdien?
Mest brukte spredningsmål Varians Standardavvik
Bruk av standardavviket (Se Lysø, s. 71) Tilbake til prøven i klassen: Intervall Utregnet (1.72 , 5.17) (−0.01, 6.9) Antall elever 15 18 (alle) Andel elever 83.33% 100%
Ved en erfaring som gjentas mange ganger, er det alltid tilfeldig variasjon i resultatene. Dermed vektlegges ofte bare observasjoner hvis avviket er større enn standardavviket, altså som faller utenfor intervallet
Normalfordeling En type fordeling der 68,2% av observasjonene ligger innenfor ett standardavvik av gjennomsnittet, og 95,2% innen to standardavvik av gjennomsnittet Beskriver godt bl.a. IQ og høyde i en befolkning “Normalplanen” (1939)
§3. Undersøkelser (Se Lysø, kap. 9) Stor populasjon å undersøke ~ stikkprøve Tilfeldig variasjon Populasjonsplanet og utvalgsplanet Sannsynlighetsutvalg og ikke-sannsynlighetsutvalg Responsfeil
Spørreskjemaer Nøytrale spørsmål Lukkede spørsmål (f.eks. flervalgs) Validitet / gyldighet Reliabilitet / pålitelighet Praktisk anvendelse: Eksamenene vi gjennomfører med elever!
§4. Misvisende statistikk Maria og ukelønn (Lysø, s. 30-31) Bildediagrammer (Lysø, s. 25)
§5. Digitale verktøy En “vitenskaplig” lommeregner har mange statistiske funksjoner. Regneark som Excel er svært godt egnet statistisk arbeid, både for å gjennomføre beregninger og presentere data i tabell og ulike typer diagram. Obs: (BV, s. 175) “Fornuftig bruk av tekniske hjelpemidler krever god innsikt i statistikk”!
Kilder for statistikk Statistisk sentralbyrå ( www.ssb.no ) har grundig undersøkt veldig mange aspekter med liv i Norge. Her kan det hentes reelle eksempler på tabeller, ulike diagrammer o.l.