SPSS-kurs Bolk 2 – Deskriptiv statistikk. Bolk 2: Deskriptiv statistikk I denne bolken skal vi bruke SPSS til å utforske og beskrive data gjennom ulike.

Slides:



Advertisements
Liknende presentasjoner
Tilpasse spørringer i RT Kolonnetilpassninger Egne spørringer Legge spørring til forside Legge spørring til Dashboard.
Advertisements

Klikk Aktiver redigering i meldingsfeltet,
Tilpasset fremvisning i PowerPoint
Statistikk på 50 5 minutter
SPSS (Statistical Packages for the Social Sciences)
Skedsmo 12. november 2009 Tonje Hilde Giæver
Kapittel 10 Inferens om gjennomsnitt AAKRE-V SPSS v 10.0 MET 8006 STATISTIKK OG DATAANLYSE Kapittel 10 Inferens om gjennomsnitt Pål Aakre, BI Oslo.
SPSS v Kapittel 8 AAKRE/MET Parvise sammenligninger Cornflakes-eksempelet fra læreboken tab Vi legger inn dataene i Dataeditoren, som.
Begrenset redigering “Klubbjournalister” For web ansvarlig klubb.
Varianskomponentmodeller
Introduksjon til statistikk
Statistikk for begynnere 2
Denne koden skal gi svar på følgende:
Simpel regresjon Plott av variablene Y mot X
Innskriving av data (1) 1. Slik ser dataeditoren ut fra start.Vi
Analyse og tolkning av datamaterialet
INDEKSER OG FORDELINGER
Harald Romstad Høgskolen i Hedmark
Statistikk på 20 2 timer PSY-1002
Andre funksjoner. Her kommer en beskrivelse av søkefunksjoner, knapper og annen funksjonalitet. 2.
Mønsterkonstruksjon i GIMP.
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Regresjonsanalyse Del 2
Presentasjon av data: deskriptiv statistikk
Hypotesetesting, og kontinuerlige stokastiske variable
Repeterte målinger - analyse av oppsummeringsmål
Regresjon Petter Mostad
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Statistikk 2 M1 årskurs HVE 31. august 2009.
SPSS-kurs. Program Dagen vil bli delt inn i fire bolker: Bolk 1 - 9:30-10:30 – Åpne/lagre datasett, datatyper, definere variable. Bolk 2 – 10:45-11:30.
M1 årskurs HVE 7. september 2009
Statistikk M4 Mandag 20. april 2009.
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Bolk 3 – Sammenligne gjennomsnitt i ulike grupper
Bolk 3 – Sammenligne gjennomsnitt i ulike grupper
SPSS-kurs.
Bolk 2 – Deskriptiv statistikk
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Funksjoner med digitale hjelpemidler- GeoGebra Høyskolen i Oslo og Akershus Mandag Trine Foyn.
Datakortet – Modul 3 Word 2003, Kap Modul 3.
Innleveringsoppgaver i forskningsmetode
Skriv inn prosjekttittelen her Navn Lærerens navn Skole
Prosjekttittel Ditt navn | Lærerens navn | Skolen din
To bruksmåter av statistikk
Forskningsprosjekt, tittel
Regresjonsforutsetninger i STATA
MET 2211 Statistikk og dataanalyse
Kapittel 8: Ikke-parametriske tester
Kapittel 13: Multippel regresjon Modelldiagnostikk
Tabeller og grafer B – Samarbeid
Figur 5.1 Måling av tilfredshet på ordinalt målenivå.
Figur 25.1 Sammenheng mellom inntekt i millioner NOK (y) og antall års utdanning (x) utover grunnskolen. I denne populasjonen er ß0 = 0.4 og ß1 =
Kapittel 14: Multippel regresjon
MET 2211 Statistikk og dataanalyse
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
Kapittel 15: Valg av metode Kapittel 16: Stokastiske variabler
Tester med SPSS prosedyrer og utskrifter
MET 2211 Statistikk og dataanalyse
Kapittel 11 Kategoriske variabler og normaltilnærmelsen
Tittel på forskningsprosjekt
Figur 17.1 Histogram for alle DNB-kundene i undersøkelsen.
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
SIV : Regresjon Kapittel 13 17/01/2019 Fred Wenstøp.
MET 2211 Statistikk og dataanalyse
SIV : t-testen for to stikkprøver
SIV : Variansanalyse Kapittel 14 17/02/2019 Fred Wenstøp.
Oppsummering fra forrige gang
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

SPSS-kurs Bolk 2 – Deskriptiv statistikk

Bolk 2: Deskriptiv statistikk I denne bolken skal vi bruke SPSS til å utforske og beskrive data gjennom ulike mål: gjennomsnitt, median, standardavvik, og visuelle plot: boxplot, histogram, scatterplot

Vi fortsetter å bruke data fra Caerphilly-studien.

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore»

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List»

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Under «Statistics»

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Under «Statistics» huker man kun av for «Descriptives»

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Klikk «Plots».

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Klikk «Plots». – Fjern «Stem-and-leaf».

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Klikk «Plots». – Fjern «Stem-and-leaf». – Huk av «Histogram».

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Klikk «Plots». – Fjern «Stem-and-leaf». – Huk av «Histogram». – Boxplot er automatisk valgt.

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Klikk «Plots». – Fjern «Stem-and-leaf». – Huk av «Histogram». – Boxplot er automatisk valgt. Ved å velge «Dependents together» plottes boxplottet til våre variabler i samme graf.

Deskriptiv statistikk Gå inn på «Analyze => Descriptive statistics => Explore» Drar de variablene man ønsker å analysere fra listen til høyre over til «Dependent List» Ønsker kun beskrivende målene og ikke plott, så merk av «Statistics» istedenfor «Both»

Output er da følgene tabell med blant annet gjennomsnitt, median og standardavvik

Split File: separate analyser Noen ganger er det praktisk å gjøre analyser separat for ulike sub-grupper. Da kan man bruke: «Data => Split File»

Split File: separate analyser Standardsettingen er «Analyze all cases, do not create groups» Da kan man ikke gjøre flere valg.

Split File: separate analyser Standardsettingen er «Analyze all cases, do not create groups» (ingen fler valg) Ved «Organize output by groups» kan man velde en kategorisk variabel, slik at alle analyser gjøres separat.

Split File: separate analyser Standardsettingen er «Analyze all cases, do not create groups» (ingen fler valg) Under «Current status» står det hvilken setting man er i.

Split File: separate analyser Standardsettingen er «Analyze all cases, do not create groups» (ingen fler valg) OBS! – ved en t-test kan man ikke ha på Split File på gruppen-variabelen.

Boxplot Boxplottet er den en god måte å framstille fordelingen av data grafisk på, ved å visualisere sentrering og variabilitet. Boxplottet viser Median (50% av dataen på hver side) Interquartile range IQR (25%, 75% på hver side) Ekstreme observasjoner merkes med o og *

Boxplot kan brukes til å visualisere sentrering og spredning av data. Gå inn «Graphs => Legacy dialogs => Boxplot» Boxplot

Boxplot kan brukes til å visualisere sentrering og spredning av data. Gå inn «Graphs => Legacy dialogs => Boxplot» Velg «Simple» og «Define»

Boxplot kan brukes til å visualisere sentrering og spredning av data. Gå inn «Graphs => Legacy dialogs => Boxplot» Flytt variabelen over til «Variable»

Boxplot kan brukes til å visualisere sentrering og spredning av data. Gå inn «Graphs => Legacy dialogs => Boxplot» Flytt variabelen over til «Variable» Kan dele inn i grupper med gruppevariabel i «Category Axis»

Vi ønsker å utforske sammenhengen mellom triglyserid i blod (trig) og BMI (bmicat) i Caerphilly-studien. Lag et boxplot over spredningen av triglyserid der det deles inn etter fire BMI-kategorier. Oppgave

Kan også bruke «explore» Legg gruperings- variabelen i «Factor list».

Scatterplot For å visualisere sammenhengen mellom to kontinuerlige variabler kan man bruke scatterplot. Gå inn «Graphs => Legacy dialogs => Scatter/Dot»

Scatterplot For å visualisere sammenhengen mellom to kontinuerlige variabler kan man bruke scatterplot. Gå inn «Graphs => Legacy dialogs => Scatter/Dot» Velg «Simple scatter» og «Define»

Har kan velge variabler fra listen til venstre: Flytt Triglyserid til «Y Axis» som vertikal akse

Har kan velge variabler fra listen til venstre: Flytt Triglyserid til «Y Axis» som vertikal akse Flytt HDL til «X axis» som horisontal akse Klikk «OK»

Har kan velge variabler fra listen til venstre: Flytt Triglyserid til «Y Axis» og HDL til «X axis» Flytt en kategorisk variabel til «Set markers by». Dette gir ulik farge for kategoriene.

OBS – hvis observasjonen for kategorien er MISSING, forsvinner sirkelen (med fargen «usynlig»)

Oppgave Lag et scatterplot for å undersøke sammenhengen mellom HDL kolesterol (hdlchol) og BMI som kontinuerlig variabel (bmi). Ser det ut til å være noen sammenheng? Lag det samme scatterplottet, men med ulik farge for røykere og ikke-røykere.

Ulike normalitetsplot I videre analyser er ofte fordelaktig å kunne anta normalfordelte data. For å undersøke om denne antagelsen holder bruker man tre plot: Histogram

Ulike normalitetsplot I videre analyser er ofte fordelaktig å kunne anta normalfordelte data. For å undersøke om denne antagelsen holder bruker man tre plot: Histogram Boxplot

Ulike normalitetsplot I videre analyser er ofte fordelaktig å kunne anta normalfordelte data. For å undersøke om denne antagelsen holder bruker man tre plot: Histogram Boxplot Kvantil-kvantil (QQ) plot

Ulike normalitetsplot I videre analyser er ofte fordelaktig å kunne anta normalfordelte data. For å undersøke om denne antagelsen holder bruker man tre plot: Histogram Boxplot Kvantil-kvantil (QQ) plot I de to første ser man om variabelen er symmetrisk og ikke skjev. I QQ-plottet ser man om observasjonene ligger mest mulig på en rett linje (avvik indikerer outliers og tunge haler).

Alle disse finner man under Explore: Gå inn på «Analyze => Descriptive statistics => Explore».

Alle disse finner man under Explore: Gå inn på «Analyze => Descriptive statistics => Explore». Klikk «Plots».

Alle disse finner man under Explore: Gå inn på «Analyze => Descriptive statistics => Explore». Klikk «Plots». Boxplot er automatisk valgt.

Alle disse finner man under Explore: Gå inn på «Analyze => Descriptive statistics => Explore». Klikk «Plots». Boxplot er automatisk valgt. Huk av «Histogram», og fjern «stem-and- leaf».

Alle disse finner man under Explore: Gå inn på «Analyze => Descriptive statistics => Explore». Klikk «Plots». Boxplot er automatisk valgt. Huk av «Histogram», og fjern «stem-and- leaf». For QQ-plot: huk av «Normality plots with tests».

Alle disse finner man under Explore: Gå inn på «Analyze => Descriptive statistics => Explore». Klikk «Plots». Boxplot er automatisk valgt. Huk av «Histogram», og fjern «stem-and- leaf». For QQ-plot: huk av «Normality plots with tests». Klikk «Continue» og «OK».

Oppgave Undersøk om variablene HDL kolesterol (hdlchol) og triglyserid (trig) fra Caerphilly-studien kan antas å være normalfordelt ved et histogram, boxplot og QQ-plot.

Konklusjon: Vi kan anta at HDL kolesterol er normalfordelt, men vi det virker ikke som vi kan anta at triglyserid er det.

Oppsummering Under «Graphs => Legacy dialogs» kan man lage mange ulike plot, f. eks. scatterplot og boxplot Under «Analyze => Descriptive statistics => Explore» kan man finne oppsummeringsmål og lage histogram, boxplot og normalitetsplot.