Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

 Bodil og Fin Ask Bearbeiding av innsamlet informasjon Bodil Ask Delvis basert på Patel & Davidson: Forskningsmetodikkens grunnlag.

Liknende presentasjoner


Presentasjon om: " Bodil og Fin Ask Bearbeiding av innsamlet informasjon Bodil Ask Delvis basert på Patel & Davidson: Forskningsmetodikkens grunnlag."— Utskrift av presentasjonen:

1  Bodil og Fin Ask Bearbeiding av innsamlet informasjon Bodil Ask Delvis basert på Patel & Davidson: Forskningsmetodikkens grunnlag

2  Bodil og Fin Ask Vi har kvantitative og kvalitative data Kvantitative data får vi når vi teller og måler.Kvalitative data får vi når vi beskriver, vurderer, observerer, etc. Kvantitative blir oftest behandlet statistisk Kjennskap til elementære statistiske metoder er nødvendig for å kunne forstå og vurdere den store mengden av forskningsrapporter som tar slike i bruk. Parallelt med dette har vi kvalitative arbeidsmetoder. Forskning kan ikke ha bare ett ben å stå på. En må også ha klart for seg at de to metodene har et solid felles etisk og filosofisk grunnlag som de begge må forholde seg til.

3  Bodil og Fin Ask Diskrete variabler er variabler som ikke har noen utstrekning. De er gjensidig utelukkende. Kontinuerlige variabler er variabler som har sammenhengende utstrekning i lengde, tid, volum. Her måler vi, og måleresultatet blir så fingradert som måleinstrumentet kan måle. Metermål og vekt kan gi svært fingraderte mål. Men skritter vi opp en lengde, blir det grovmål! (Dog bedre enn øyemål!) Eks. Mann – Kvinne. Det er enten eller. Kan ikke være noe imellom. Eks. Antall studenter. Enten er det 19 studenter til stede eller så er det 20. Kan ikke være 19,5 tilstede!!

4  Bodil og Fin Ask Tall Naturlige tall er tallene vi bruker når vi teller. Naturlige tall er hele tall og de er diskrete. Desimaltall er kontinuerlige tall: Det ene tallet begynner der det andre slutter. 19 cm begynner på 18,5 og slutter på 19,4 (når vi bruker en desimal). Tallet har en utstrekning. Merk: Diskrete tall kan være knyttet til en kontinuerlig variabel. Tallene i karakterskalaen er diskrete (6 - 1), men variabelen som måles er kontinuerlig. Og når vi nå bruker karakterskalaen A – F, så er bokstavene symboler for diskrete verdier på en kontinuerlig variabel. (Enten får du A eller så får du B, aldri noe i mellom)

5  Bodil og Fin Ask Innsamling og vurdering av data Når vi forsker eller undersøker noe, skaffer vi oss data på mange, ulike måter. Omtrent alt kan kalles ‘måling’, hvis vi definerer begrepet vidt. Vi kan sette opp fire ulike nivåer for måling: Intervallnivå: Viser rang, har like enheter, men har ikke sant nullpunkt. Eks: termometer; kalender Nominalnivå: Tall brukt som navn (latinsk: nomen) 1 står for sukker, 2 står for mel. 1 står for kvinne, 2 står for mann. Ordinalnivå: Viser rang, har ikke like enheter og ikke sant nullpunkt. Eks: Rangering med tall / ord / poeng / karakterer gitt ved skjønn Rationivå: Viser rang, har like enheter, har sant nullpunkt. Eks: Metermål, vekt, litermål, tid målt med stoppeklokke, etc

6  Bodil og Fin Ask Uansett hvordan måling foregår, om det skjer ved standardiserte prøver eller ved de vanlige kunnskapsprøvene vi har i skolen, må vi stille to spørsmål: 1. Spørsmål om validitet: Måler måleinstrumentet det det skal måle? Måler det det det gir seg ut for å måle? Er resultatet et gyldig mål for det vi ønsker å måle? Eks: Måler intelligenstester intelligens? 2. Spørsmål om reliabilitet: Måler måleinstrumentet nøyaktig? Måler det pålitelig? Eks: Får du samme resultat når du måler to ganger?

7  Bodil og Fin Ask Uttrykk vi bør kjenne til I forskningssammenheng arbeider vi med variabler. Eksempel: Norske elevers kunnskaper i matematikk Vi bestemmer oss for å la elevenes karakterer i matematikk være et uttrykk for kunnskapsnivået. I videregående skole vil matematikkarakteren ha verdiene 6-5-4-3-2-1. Hver elev får sin karakter ( sin skåre). Samler vi data fra mange elever, får vi en datamengde som bare forvirrer oss. Vi må ordne dataene. En måte er å sortere dem etter sin størrelse og telle opp hvor mange det er av hver verdi. Da får vi se hvordan elevene fordeler seg på karaktergradene. Vi får en fordeling. En fordeling er enten symmetrisk eller skjev. Den kan være positivt skjev eller negativt skjev.

8  Bodil og Fin Ask Symmetrisk fordeling Deler vi en symmetrisk fordeling på midten, er de to halvdelene et speilbilde av hverandre. Det er like mange av 1 og 6, 2 og 5, 3 og 4. En normalfordeling er en symmetrisk fordeling med et gitt prosenttall på hver skåreverdi. Tallene ville her være: 2 – 14 – 34 – 34 – 14 - 2 Vi finner midtpunktet på måleskalen ved å legge sammen laveste og høyeste verdi og dele på 2. (1 + 6) / 2 = 3,5 Symmetrisk fordeling - normalfordeling

9  Bodil og Fin Ask Hvis det er flere elever på de gode karakterene enn på de dårlige, har vi en negativt skjev fordeling. Negativt skjev fordeling Årsaken kan være at prøven var lett eller at elevene var flinke. Vi ser at det er flere skårer over midtpunktet (3,5) enn under.

10  Bodil og Fin Ask Positivt skjev fordeling Når tyngden av elever ligger på de dårlige karakterene, har vi en positivt skjev fordeling. Prøven har vært vanskelig, eller elevene har vært svake. Det er flere skårer under midtpunktet enn over.

11  Bodil og Fin Ask Formelen sier: For hver verdi av x skal vi finne avstanden til gjennomsnittet og kvadrere denne. Deretter skal vi summere alle kvadrerte avstander og dele summen med antallet (n). Til slutt trekker vi ut kvadratrota av det vi da har fått. Spredning og standardavvik Vi har lært at gjennomsnittet er balansepunktet for skårene i en fordeling. Vi sier ellers at gjennomsnittet er en sentral tendens i fordelingen. Nå skal vi se på hvordan skårene sprer seg rundt gjennomsnittet. Det kaller vi spredningen. Standardavviket er et mål på spredningen som forteller oss om skårene ligger tett rundt gjennomsnittet eller om de ligger mer spredt. Vi må regne oss fram til standardavviket etter denne formelen:

12  Bodil og Fin Ask Når skårene er normalfordelt, fordeler de seg slik som prosenttallene nedenfor viser. Alle er i det området som strekker seg 3 ganger stan- dardavviket på hver side av gjennomsnittet. ( ± 3 s) (Unntatt 0,2 %) Merk: Bare 4 % av skårene er så langt fra gjennomsnittet som ± 2 stan- dardavvik! Det er derfor en lang avstand uansett hvilke verdier skåren, gjennomsnittet eller standardavviket har!

13  Bodil og Fin Ask Når vi skal vurdere hvor god en prestasjon er, spør vi hvor langt den er fra gjennomsnittet, målt med standardavviket. Eksempler: Gro hadde skåret 25 poeng på en prøve der gjennomsnittet var 15 poeng og standardavviket 5 poeng. Hvor god er prestasjonen? 25p er 10p over gjennomsnittet. 10p tilsvarer 2 standardavvik. Bare 2% skårer bedre enn henne. Gros skåre er x. Vi regnet slik: Per skåret 10 p. Det blir (10p – 15p)/ 5p = -5p / 5p = -1 (dvs: -1s) Ca 16 % skåret dårligere enn Per. dvs 2s

14  Bodil og Fin Ask Z-skårer Z-skårer er en standard måleskala som har disse grunnverdiene: -3z -2z -1z 0z 1z 2z 3z Z-skårer fordeler seg slik: Z-skårene er desimaltall som kan deles opp i tideler, hundredeler etc, og kan ha høyere tallverdier enn ±3z. Gjennomsnittet = 0zStandardavviket = 1z

15  Bodil og Fin Ask Alle slags måleresultat som har gjennomsnitt og standardavvik, kan omregnes til z-skårer. Gjør vi det, kan vi sammenlikne prestasjoner, f eks til studenter som har hatt ulike eksamener. Vi regner skårene om til z-skårer ved å finne skårenes avstand fra gjennomsnittet og dele avstanden med standavviket. Det finnes tabeller over z-skårer og ‘hva de er verd’. Verdien avgjøres av hvor mange i en normalfordeling som gjør det bedre og dårligere enn den z-skåren vi vurderer. Siden gjennomsnittet for z-skårer = 0z og s = 1z, vil enhver z-skåre fortelle sin egen avstand fra gjennomsnittet, målt i standardavvik. En skåre på 1,5 z er 1,5 standardavvik fra gjennomsnittet. Bare ca 7% presterer bedre enn det! (Tallet er plukket fra en z-skåretabell)

16  Bodil og Fin Ask Innledning Symboler for utvalg: Aritmetisk gjennomsnitt : Standardavvik: s Antallet i utvalget: n Disse kalles statistiske størrelser. Slutningsstatistikk - hypoteseprøving Symboler for populasjonen: Aritmetisk gjennomsnitt: μ my) Standardavviket: σ (sigma) Antallet i populasjonen: N (number) Disse kalles parametre.

17  Bodil og Fin Ask Populasjoner og utvalg En populasjon er det totale antall personer, ting eller forhold som har en eller flere egenskaper felles. Et utvalg er representativt hvis det avspeiler populasjonens egenskaper på en nærpå riktig måte. Et utvalg er skjevt hvis det ikke avspeiler populasjonens egenskaper på en nærpå riktig måte. Utvalg får navn etter måten utvelgingen skjer på: 1)Systematisk utvalg (tar hver n’te forekomst i populasjonen) 2)Tilfeldig utvalg (utvelging etter loddtrekningsprinsippet) 3)Stratifisert utvalg (utvelging hvor en sikrer seg riktig antall på enkelte kriteria, slike som: kjønn, alder, bygd/by, klassetrinn, etc..)

18  Bodil og Fin Ask Vi undersøker et utvalg for å få vite noe som kan gjelde generelt for populasjonen. Eksempel: Er skriveopplæring mer effektiv med PC enn med penn og blyant ? Kan datasimulering føre til bedre forståelse av elektriske koblings- skjemaer? Vi stiller mange krav til forskning på utvalg: Er utvalget representativt for populasjonen? Er målingene valide og reliable? Er statistikken riktig tilpasset datamaterialet? Har analysene og konklusjonene god dekning i datamaterialet? Etc …

19  Bodil og Fin Ask Sett at vi gir alle personene i et representativt utvalg en og samme test og regner ut gjennomsnittet for deres prestasjoner. Vil da gjennomsnittet vi får bli likt populasjonens gjennomsnitt på samme test? Vi opplever i praksis at om vi trekker ut flere representative og like store utvalg fra en populasjon, så får vi ikke det samme gjennomsnitt i dem alle. Gjennomsnittet i de forskjellige utvalg varierer, men: De varierer normalfordelt rundt gjennomsnittet (μ) for populasjonen! Fordelingen av utvalgsgjennomsnittene kalles en sampelfordeling Sampelfordelinger følger normalfordelingen Vi kan beregne standardavviket for fordelingen av utvalgsgjen- nomsnitt, men vi kaller det standardfeilen til gjennomsnittet Standardfeilen til gjennomsnittet

20  Bodil og Fin Ask

21 Standardfeilen til gjennomsnittet peiler inn μ for populasjonen Formelen for standardfeilen ser slik ut: Vi finner altså standardfeilen for utvalgets gjennomsnitt ved å dele standardavviket for populasjonen med rota av antall personer i utvalget. (NB! Øker antallet n, minker standardfeilen!) (Kjenner vi ikke σ for populasjonen, bruker vi s for utvalget) μ for populasjonen er ukjent for oss, men vi vet at μ ikke ligger lenger borte fra for utvalget enn ± 3 ganger. Da kan vi peile inn μ. Figuren på forrige bilde sa oss: Det er 68% sjanse for at μ er innenfor en avstand av ±1 fra. Det er 96% sjanse for at μ er innenfor en avstand av ±2 fra.

22  Bodil og Fin Ask Hypotestesting Eksempel: Vi vil undersøke om jenter og gutter er like gløgge. Vi trekker et tilfeldig utvalg fra hver av de to populasjonene, tester dem med samme intelligenstest og regner ut gjennomsnittet for hvert utvalg. Vi kan få følgende: 1. Utvalget av gutter får høyere gjennomsnitt enn jentene 2. Utvalget av gutter får samme gjennomsnitt som jentene 3. Utvalget av gutter får lavere gjennomsnitt enn jentene Hvis utvalget av gutter får samme gjennomsnittsverdi som jentene, konkluderer vi med at jenter og gutter ser ut til å være like gløgge. Hvis utvalget av gutter får lavere eller høyere gjennomsnittsverdi enn jentene, da må vi undersøke om dette skyldes tilfeldigheter i utvalget - eller om forskjellen er reell, signifikant.

23  Bodil og Fin Ask Merk! Om to populasjonen har lik μ, må vi likevel forvente ulike gjennomsnitt i utvalg vi tar fra dem. Differansen kommer av tilfeldige ’feil’ ved utvelgingen. Fra nå av forutsetter vi da at μ g – μ j er lik 0. Arbeidet med å finne svar på dette kaller vi hypotese-testing. Vi starter med en hypotese om at det ikke er forskjell på populasjonene. Det kalles en null-hypotese. Hvis to populasjoner har ulik μ, må vi i hvert fall forvente ulike gjennomsnitt i utvalg vi tar fra dem. Differansen kommer av den reelle forskjellen i populasjonene. Når vil vi si: Differansen skyldes ’tilfeldige feil i utvalget’’? Når kan vi si: Differansen skyldes en reell forskjell i populasjonene? H 0 : μ 1 – μ 2 = 0

24  Bodil og Fin Ask Hvis differansen mellom gjennomsnittsverdiene for våre utvalg er liten, kan den komme av tilfeldigheter ved utvelgingen. Da vil vi si: Differansen er ikke signifikant! Er forskjellen så stor at den neppe skyldes tilfeldigheter i utvalgene, vil vi si: Differansen er signifikant Størrelsen avgjør altså om differansen er signifikant eller ikke. Men: Når er en differanse stor?

25  Bodil og Fin Ask Vi kan beregne spredningen for differansene og kaller den standardfeilen til differansen. Vi regner den ut slik: Vi kvadrerer standardfeilen til gjennomsnittene for hver av de to utvalgene, legger sammen de to produktene og trekker ut rota av summen. Da har vi standardfeilen til differansen som gjør at vi kan vi regne differansen om til en z-skåre. Tar vi et utvalg fra hver av to populasjoner, har vi et utvalgspar, og vi kan regne ut differansen mellom deres gjennomsnitt, Fra to populasjoner kan vi ta mange slike utvalgspar, og får da mange ulike differanser, men opplever at de sprer seg symmetrisk rundt differansen μ 1 – μ 2 for de to populasjonene de tilhører.

26  Bodil og Fin Ask Differansen vi har funnet mellom gjennomsnittet for guttene og for jentene, er å betrakte som en skåre, som x i formelen. Gjennomsnittet for populasjonene gutter og jenter, er i formelen. Vår hypotese er at μ g - μ j = 0. Da kan vi ta det leddet bort i formelen. Vi hadde formelen for z: μ g – μ j, I nevneren blir det å sette standardfeilen til differansen: Vi kan altså regne om differansen vi har funnet i vårt utvalgspar til z-skåre ved å dividere differansen med standarfeilen til differansen Om z-skårer vet vi dette:

27  Bodil og Fin Ask Innenfor ±3z ligger 99,8% av alle differanser som kan skyldes tilfeldigheter ved utvelgingen. Får vi en z-verdi som ligger utenfor dette, er det 99,8% sannsynlighet for at differansen ikke skyldes tilfeldigheter med utvalgene våre. Vi vil si: Differansen er signifikant (p<0,998) Imidlertid er det sjelden vi har behov for å være så sikre som 99,8%. Vi godtar at differansen er signifikant hvis det er 95% eller 99% sannsynlighet for det. Det tilsvarer z-skårer på 1,96z eller 2,58z. Ergo: Hvis differansen vi har fått mellom to utvalg, omregnet til z-skåre, blir ≥1,96z, sier vi den er signifikant på 5% nivået (p<0,05) Hvis differansen vi har fått mellom to utvalg, omregnet til z-skåre, blir ≥ 2,58, sier vi at den er signifikant på 1% nivået (p<0,01) Dersom differansen vi har fått, ikke er signifikant, beholder vi null- hypotesen. Er den signifikant, forkaster vi null-hypotesen!

28  Bodil og Fin Ask


Laste ned ppt " Bodil og Fin Ask Bearbeiding av innsamlet informasjon Bodil Ask Delvis basert på Patel & Davidson: Forskningsmetodikkens grunnlag."

Liknende presentasjoner


Annonser fra Google