Statistikk Forkurs 2016. Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.

Slides:



Advertisements
Liknende presentasjoner
Kombinatorikk for lærerstudenter
Advertisements

STATISTISK KVALITETSSTYRING
Statistikk og sannsynlighetsregning
1 Sannsynlighetsregning Gjenfinningssystemer og verktøy II Jon Anjer.
Skedsmo 12. november 2009 Tonje Hilde Giæver
Statistikk og sannsynlighetsregning
Statistikk og sannsynlighetsregning
 Bodil og Fin Ask Bearbeiding av innsamlet informasjon Bodil Ask Delvis basert på Patel & Davidson: Forskningsmetodikkens grunnlag.
Enhalet og tohalet hypotesetest
Statistikk og sannsynlighetsregning
Formler og funksjoner.
René Descartes (1596–1650) Innførte koordinatsystemet
Vi har lært å bestemme: - Nullpunkter (y=0)
Introduksjon til statistikk
Eksempel AOA (Activity On Arc)
1: Gjengs leie Gjengs leie for hybler og leiligheter i Oslo første kvartal 2007.
MET 2211 Statistikk og dataanalyse
Innskriving av data (1) 1. Slik ser dataeditoren ut fra start.Vi
Prosjektoppgaven – krav og suksessfaktorer. Suksessfaktorer Bruk biblioteket Bruk veilederen Start skrivingen tidlig Jobb jevnt (lag gjerne tids- og handlingsplaner.
Analyse og tolkning av datamaterialet
Kap 03 Beskrivende statistikk
INDEKSER OG FORDELINGER
Hva er en artikkel?.
Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Statistikk på 20 2 timer PSY-1002
LÆREPLANEN Matematikk Vg2 – hovedprinsipper. Struktur (fra
Ch 4 INTEGRASJON Integrasjon innebærer å finne alle funksjoner F som har f derivert. Disse funksjoner kalles antiderivert av f og formelen for de er det.
Statistikk og sannsynlighetsregning
Diskrete stokastiske variable
Kapping av plater Mål: Vi skal lage komponenter for en møbelfabrikk ut fra standardiserte plater på 12 x 24 dm. Komponentene har lengde og bredde oppgitt.
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Presentasjon av data: deskriptiv statistikk
Bayesiansk statistikk Petter Mostad Overblikk Tilbakeblikk på sannsynlighetsbegrepet Hvordan gjøre Bayesianske analyser Analyser ved hjelp.
Hypotesetesting, og kontinuerlige stokastiske variable
Mål for sentraltendens:
Usikkerheter og sannsynligheter Petter Mostad
Siste forelesning er i morgen!
Studiebarometeret 2014 Resultater, metodikk og anvendelse Helge Sigurd Hansen 17.mars 2015.
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kombinatorikk og sannsynlighet
Kræsjkurs Del Ii Hypotesetesting
Statistikk 2 M1 årskurs HVE 31. august 2009.
Sannsynlighet og kombinatorikk
A2A / A2B M1 årskurs 4. november 2009
M1 årskurs HVE 7. september 2009
Statistikk M4 Mandag 20. april 2009.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Bolk 2 – Deskriptiv statistikk
Sannsynlighet. Fra LK trinn planleggje og samle inn data i samband med observasjonar, spørjeundersøkingar og eksperiment representere data i tabellar.
Statistikk Dette er Norge Å kunne tolke statistiske data er en.
MAT0100V Sannsynlighetsregning og kombinatorikk Ørnulf Borgan Matematisk institutt Universitetet i Oslo Forventning, varians og standardavvik Tilnærming.
Sinus 1P Sinus 2P Sinus 1P-Y Trondheim, 6. mai 2014.
MAT0100V Sannsynlighetsregning og kombinatorikk
Repetisjon av sannsynlighetsregning
To bruksmåter av statistikk
Statistikk 2 Sentral- og spredningsmål
MAT0100V Sannsynlighetsregning og kombinatorikk
MAT0100V Sannsynlighetsregning og kombinatorikk
Figur 9.1 Sannsynlighet beregnes på en skala fra 0 til 1.
Statistikk 1 Stolpe- og sektordiagrammer og misoppfatninger
MET 8006 Statistikk Forelesning nr. 1 Kapittel 1: Oversikt
MET 2211 Statistikk og dataanalyse
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
SIV : Kapittel 4 Statistisk metode 18/02/2019 Fred Wenstøp.
Å beskrive og generalisere fra en stikkprøve
Sykefraværsstatistikk for Det medisinske fakultet 2018
Utskrift av presentasjonen:

Statistikk Forkurs 2016

Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele inn i to hovedområder: Samle inn og ordne opplysninger på en hensiktsmessig måte. Tolke og trekke slutninger på grunnlag av disse opplysningene på en vitenskapelig forsvarlig måte.

Beskrivende statistikk (også kalt deskriptiv statistikk) Når vi jobber med beskrivende statistikk så lager vi tabeller og diagrammer samt finner sentral og spredningsmål. Observasjonene kan fremstilles enkeltvis og i klassedelt materiale.

Statistisk undersøkelse La oss se på en tenkt undersøkelse blant 20 tilfeldige lærerstudenter. Spørsmålet de fikk var følgende: Hvor mange arbeidstimer jobbet du med studiet i forrige uke?

NummerStudentArbeidstimer 1 A31 2 B24 3 C38 4 D42 5 E29 6 F31 7 G41 8 H42 9 I0 10 J39 11 K38 12 L4 13 M42 14 N38 15 O6 16 P38 17 Q40 18 R3 19 S32 20 T40 Tabell 1 Tabellen viser ukentlige arbeidstimer for 20 tilfeldige studenter (i tabellen er studentene nummerert fra A til T). Eks. Forrige uke brukte student A 31 timer, mens student B brukte 24 timer på studiene.

Tabell 2 Dataene ordnet etter Størrelse. Student I brukte 0 arbeidstimer, mens student M brukte 42 arbeidstimer. Totalt antall arbeidstimer for alle studentene var 598 timer. NummerStudentArbeidstimer 1 I0 2 R3 3 L4 4 O6 5 B24 6 E29 7 A31 8 F 9 S32 10 C38 11 K38 12 N38 13 P38 14 J39 15 Q40 16 T40 17 G41 18 D42 19 H42 20 M42 Sum: 598

Ulike sentralmål Størrelser som angir den typiske (vanligste) verdien til variabelen i et tallmateriale. Gjennomsnitt (Middelverdi) Gjennomsnittsverdien er gjerne det sentralmålet som blir brukt mest. En størrelse som angir en typisk størrelse i et datamateriale. Når en beregner gjennomsnittet så tillegges alle verdiene like stor vekt, gjennomsnittet vil dermed bli påvirket av ekstreme verdier.

Gjennomsnitt - aritmetisk middelverdi Gjennomsnittet i vårt tenke datamateriale er: 598 : 20 = 29,9

Median

Det midterste tallet når dataene er ordnet etter størrelse. En finner det midterste tallet ved å regne ut (n+1)/2, der n er antall observasjoner i datamaterialet. I vårt eksempeler n = 20. Da er den midterste observasjonen (20+1) : 2=10,5 Hva gjør vi da? Da tar vi gjennomsnittet av observasjon nr. 10 og nr. 11: (38+38) : 2 = 38

Typetall Den verdien som har høyest frekvens. Dersom det er flere verdier som har høyest frekvens, har vi ikke typetall. Typetall betegnes som T. En fordel med typetallet er at det ikke blir påvirket av verdier som er lite typiske for datamaterialet.

Typetall Det utfallet som forekommer oftest/ hyppigst i et datamateriale. Fra tabell 2 ser vi at det er 38

Da har vi funnet ut at Gjennomsnitt = 29,9 Typetall = 38 Median = 38 Hvilke av sentralmålene gir oss best informasjon om datamaterialet?

Gjennomsnitt i et gruppert materiale Dersom datamateriale er gruppert og vi ikke lenger har tilgang til enkeltobservasjoner, kan vi finne tilnærmet verdi for gjennomsnittet. Vi går da ut fra dataene fordeler seg jevnt i hver klasse og bruker klassemidtpunktet som utgangspunkt. Summen av observasjoner i hver klasse er tilnærmet lik klassemidtpunktet multiplisert med frekvensen. Vi legger sammen resultatene for alle klassene og dividerer med antall observasjoner som før.

Diagrammer Hvilke diagrammer har vi?

Punktdiagram

Stolpediagram

Stolpediagram, klassedelt materiale

Sektordiagram

Histogram Tabellen viser resultatene fra Alle som var lavere enn 165 cm er plassert i klassen [160,165> og alle som var 195 cm eller høyere er plassert i klassen [195, 200> Når en skal framstille fordelingen i et histogram. Må man dividerer relativ frekvens med klassebredde for å finne histogramhøyde. Arealet av hvert rektangel i histogrammet er lik den relative frekvensen (sannsynligheten) for klassen, og det samlede arealet av rektanglene er lik 1.

Histogram Histogram: Vi dividerer relativ frekvens med klassebredde for å finne histogramhøyde.

Spredningsmål Vi ønsker også å si noe om spredningen av datamaterialet. I en klasse er det 27 studenter. På en prøve fikk studentene disse karakterene: 3, 5, 4, 1, 3, 4, 2, 3, 1, 4, 1, 6, 3, 3, 2, 1, 5, 2, 4, 3, 4, 3, 2, 5, 2, 4, 5 Utfallsrom: De mulige verdiene en variabel kan få i et forsøk kaller vi utfallsrommet. I vårt eksempel er U = {1, 2, 3, 4, 5, 6}

Kvartilbredde Når vi skal dele datamateriale i kvartiler skal vi dele i fire(omtrent) like store deler. Eks. Vi ser på karakterfordelingen i en klasse med 27 elever og skriver karakterene i stigende rekkefølge: 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6 Første/nedre kvartil er karakteren 2, det er data nummer 7. Andre kvartil eller medianen er karakteren 3, det er data nummer 14. Tredje/øvre kvartil er karakteren 4, det er data nummer 21. Hvis datamateriale er et partall ligger medianen mellom to tall eks. 1, 1, 2, 2, 3 I 3, 4, 4, 4, 4 Blir første/nedre kvartil: 2 og tredje/øvre kvartil : 4

Kvartilbredde Kvartilbredden er tredje kvartil (75% ligger under denne grensen) – første kvartil (25% ligger under denne grensen). I eksempelet vårt blir det da = 2. Kvartilbredden forteller oss hvor stor spredning det er i den halvdelen av datamaterialet som ligger nærmest medianen. Hvis kvartilbredden er liten, betyr det at det er lite spredning i denne delen av datamaterialet. Hvis spredningen er stor, vil kvartilbredden være stor.

Variasjonsbredde. Dette spredningsmålet er definert som differansen mellom den høyeste og den laveste verdien i datamaterialet. Tegnet r benyttes for å symbolisere variasjonsbredden. r = x (maks) - x (min) Variasjonsbredden tar ikke hensyn til hvordan spredningen på verdiene er mellom minste og største verdi. Den tar bare hensyn til den største og minste verdien og er derfor følsom mot ekstreme verdier. I vårt eksempelet med karakterene vil variasjonsbredden være: r = 6 – 1 = 5

Standardavvik

Frekvenstabell Begrepsavklaring Frekvens = antall observasjoner Relativ frekvens = andel, altså antall observasjoner innen en gitt grense sett i forhold til alle observasjoner. Summen av alle relative frekvenser i samme datamateriale er 1. Relativ kumulativ frekvens = oppsamlet relativ frekvens

Klassedelt materiale - frekvenstabell Timer Antall studenter Kumulativ frekvens Relativ Kumulativ frekvens [0-5>333/20 = 0,15 = 15% [5-10>144/20 = 0,20 = 20% [10-15>04 [15-20>044/20 = 0,20 = 20% [20-25>155/20 = 0,25 = 25% [25-30>166/20 = 0,30 = 30% [30-35>399/20 = 0,45 = 45% [35-40>51414/20 = 0,70 = 70% [40-45>62020/20 = 1,00 = 100% Sum:20100%

Nå skal vi regne oppgaver Oppgavene er hentet fra eksempelsoppgaver laget av Utdanningsdirektoratet og eksamen fra 2P 2016.