Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Statistikk Forkurs 2016. Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.

Liknende presentasjoner


Presentasjon om: "Statistikk Forkurs 2016. Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele."— Utskrift av presentasjonen:

1 Statistikk Forkurs 2016

2 Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele inn i to hovedområder: Samle inn og ordne opplysninger på en hensiktsmessig måte. Tolke og trekke slutninger på grunnlag av disse opplysningene på en vitenskapelig forsvarlig måte.

3 Beskrivende statistikk (også kalt deskriptiv statistikk) Når vi jobber med beskrivende statistikk så lager vi tabeller og diagrammer samt finner sentral og spredningsmål. Observasjonene kan fremstilles enkeltvis og i klassedelt materiale.

4 Statistisk undersøkelse La oss se på en tenkt undersøkelse blant 20 tilfeldige lærerstudenter. Spørsmålet de fikk var følgende: Hvor mange arbeidstimer jobbet du med studiet i forrige uke?

5 NummerStudentArbeidstimer 1 A31 2 B24 3 C38 4 D42 5 E29 6 F31 7 G41 8 H42 9 I0 10 J39 11 K38 12 L4 13 M42 14 N38 15 O6 16 P38 17 Q40 18 R3 19 S32 20 T40 Tabell 1 Tabellen viser ukentlige arbeidstimer for 20 tilfeldige studenter (i tabellen er studentene nummerert fra A til T). Eks. Forrige uke brukte student A 31 timer, mens student B brukte 24 timer på studiene.

6 Tabell 2 Dataene ordnet etter Størrelse. Student I brukte 0 arbeidstimer, mens student M brukte 42 arbeidstimer. Totalt antall arbeidstimer for alle studentene var 598 timer. NummerStudentArbeidstimer 1 I0 2 R3 3 L4 4 O6 5 B24 6 E29 7 A31 8 F 9 S32 10 C38 11 K38 12 N38 13 P38 14 J39 15 Q40 16 T40 17 G41 18 D42 19 H42 20 M42 Sum: 598

7 Ulike sentralmål Størrelser som angir den typiske (vanligste) verdien til variabelen i et tallmateriale. Gjennomsnitt (Middelverdi) Gjennomsnittsverdien er gjerne det sentralmålet som blir brukt mest. En størrelse som angir en typisk størrelse i et datamateriale. Når en beregner gjennomsnittet så tillegges alle verdiene like stor vekt, gjennomsnittet vil dermed bli påvirket av ekstreme verdier.

8 Gjennomsnitt - aritmetisk middelverdi Gjennomsnittet i vårt tenke datamateriale er: 598 : 20 = 29,9

9 Median

10 Det midterste tallet når dataene er ordnet etter størrelse. En finner det midterste tallet ved å regne ut (n+1)/2, der n er antall observasjoner i datamaterialet. I vårt eksempeler n = 20. Da er den midterste observasjonen (20+1) : 2=10,5 Hva gjør vi da? Da tar vi gjennomsnittet av observasjon nr. 10 og nr. 11: (38+38) : 2 = 38

11 Typetall Den verdien som har høyest frekvens. Dersom det er flere verdier som har høyest frekvens, har vi ikke typetall. Typetall betegnes som T. En fordel med typetallet er at det ikke blir påvirket av verdier som er lite typiske for datamaterialet.

12 Typetall Det utfallet som forekommer oftest/ hyppigst i et datamateriale. Fra tabell 2 ser vi at det er 38

13 Da har vi funnet ut at Gjennomsnitt = 29,9 Typetall = 38 Median = 38 Hvilke av sentralmålene gir oss best informasjon om datamaterialet?

14 Gjennomsnitt i et gruppert materiale Dersom datamateriale er gruppert og vi ikke lenger har tilgang til enkeltobservasjoner, kan vi finne tilnærmet verdi for gjennomsnittet. Vi går da ut fra dataene fordeler seg jevnt i hver klasse og bruker klassemidtpunktet som utgangspunkt. Summen av observasjoner i hver klasse er tilnærmet lik klassemidtpunktet multiplisert med frekvensen. Vi legger sammen resultatene for alle klassene og dividerer med antall observasjoner som før.

15 Diagrammer Hvilke diagrammer har vi?

16 Punktdiagram

17 Stolpediagram

18 Stolpediagram, klassedelt materiale

19 Sektordiagram

20 Histogram Tabellen viser resultatene fra Alle som var lavere enn 165 cm er plassert i klassen [160,165> og alle som var 195 cm eller høyere er plassert i klassen [195, 200> Når en skal framstille fordelingen i et histogram. Må man dividerer relativ frekvens med klassebredde for å finne histogramhøyde. Arealet av hvert rektangel i histogrammet er lik den relative frekvensen (sannsynligheten) for klassen, og det samlede arealet av rektanglene er lik 1.

21 Histogram Histogram: Vi dividerer relativ frekvens med klassebredde for å finne histogramhøyde.

22 Spredningsmål Vi ønsker også å si noe om spredningen av datamaterialet. I en klasse er det 27 studenter. På en prøve fikk studentene disse karakterene: 3, 5, 4, 1, 3, 4, 2, 3, 1, 4, 1, 6, 3, 3, 2, 1, 5, 2, 4, 3, 4, 3, 2, 5, 2, 4, 5 Utfallsrom: De mulige verdiene en variabel kan få i et forsøk kaller vi utfallsrommet. I vårt eksempel er U = {1, 2, 3, 4, 5, 6}

23 Kvartilbredde Når vi skal dele datamateriale i kvartiler skal vi dele i fire(omtrent) like store deler. Eks. Vi ser på karakterfordelingen i en klasse med 27 elever og skriver karakterene i stigende rekkefølge: 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6 Første/nedre kvartil er karakteren 2, det er data nummer 7. Andre kvartil eller medianen er karakteren 3, det er data nummer 14. Tredje/øvre kvartil er karakteren 4, det er data nummer 21. Hvis datamateriale er et partall ligger medianen mellom to tall eks. 1, 1, 2, 2, 3 I 3, 4, 4, 4, 4 Blir første/nedre kvartil: 2 og tredje/øvre kvartil : 4

24 Kvartilbredde Kvartilbredden er tredje kvartil (75% ligger under denne grensen) – første kvartil (25% ligger under denne grensen). I eksempelet vårt blir det da = 2. Kvartilbredden forteller oss hvor stor spredning det er i den halvdelen av datamaterialet som ligger nærmest medianen. Hvis kvartilbredden er liten, betyr det at det er lite spredning i denne delen av datamaterialet. Hvis spredningen er stor, vil kvartilbredden være stor.

25 Variasjonsbredde. Dette spredningsmålet er definert som differansen mellom den høyeste og den laveste verdien i datamaterialet. Tegnet r benyttes for å symbolisere variasjonsbredden. r = x (maks) - x (min) Variasjonsbredden tar ikke hensyn til hvordan spredningen på verdiene er mellom minste og største verdi. Den tar bare hensyn til den største og minste verdien og er derfor følsom mot ekstreme verdier. I vårt eksempelet med karakterene vil variasjonsbredden være: r = 6 – 1 = 5

26 Standardavvik

27 Frekvenstabell Begrepsavklaring Frekvens = antall observasjoner Relativ frekvens = andel, altså antall observasjoner innen en gitt grense sett i forhold til alle observasjoner. Summen av alle relative frekvenser i samme datamateriale er 1. Relativ kumulativ frekvens = oppsamlet relativ frekvens

28 Klassedelt materiale - frekvenstabell Timer Antall studenter Kumulativ frekvens Relativ Kumulativ frekvens [0-5>333/20 = 0,15 = 15% [5-10>144/20 = 0,20 = 20% [10-15>04 [15-20>044/20 = 0,20 = 20% [20-25>155/20 = 0,25 = 25% [25-30>166/20 = 0,30 = 30% [30-35>399/20 = 0,45 = 45% [35-40>51414/20 = 0,70 = 70% [40-45>62020/20 = 1,00 = 100% Sum:20100%

29 Nå skal vi regne oppgaver Oppgavene er hentet fra eksempelsoppgaver laget av Utdanningsdirektoratet og eksamen fra 2P 2016.

30

31

32

33

34

35

36

37


Laste ned ppt "Statistikk Forkurs 2016. Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele."

Liknende presentasjoner


Annonser fra Google