Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Metode - Rolf Gjestad www.gjestad.biz 1 Sammenheng mellom flere variabler – Bivariat Analyse Kap 13.

Liknende presentasjoner


Presentasjon om: "Metode - Rolf Gjestad www.gjestad.biz 1 Sammenheng mellom flere variabler – Bivariat Analyse Kap 13."— Utskrift av presentasjonen:

1 Metode - Rolf Gjestad 1 Sammenheng mellom flere variabler – Bivariat Analyse Kap 13

2 Metode - Rolf Gjestad 2www.gjestad.biz Type variabler – type analyser  Kategoriske variabler: Krysstabell  1 kat. og 1 kont. variabel: Gj.snittsverdi / median  Kontinuerlige variabler: Korrelasjonsanalyse

3 Metode - Rolf Gjestad 3www.gjestad.biz Krysstabell  Eks fra boka (s. 250): Sammenheng mellom medarbeidersamtale og størrelsen på bedriften?  Størrelsen på bedriften kategoriseres – TEIT !  Mister informasjon / nyanser  Hvor sette grensene mellom kategoriene?  IKKE gjør det hvis du ikke må !

4 Metode - Rolf Gjestad 4www.gjestad.biz Krysstabell  2 frekvensfordelinger som sees i sammenheng  Marginalfordelinger  frekvensfordeling på hver variabel  Prosentfordelinger i hver celle, i begge retninger.  Avhengig av hva frekvensen sammenlignes mot  Se side 252 – tabell 13.4

5 Metode - Rolf Gjestad 5www.gjestad.biz Krysstabell  Eget eks: 2 x 2 tabell: Alkohol og dødsfall over en års periode Død I live N / % Kvinner med alkohol- problemer Matchede Population kontroller N / %

6 Metode - Rolf Gjestad 6www.gjestad.biz Avhengig og uavhengig variabel  Årsak – virkning  Logisk begrunnelse for retning: X Y  Eks: Resultat til eksamen – Hvor mye lese til eksamen  Verdien i den avhengige variabelen er avhengig av verdien i den uavhengige variabelen.

7 Metode - Rolf Gjestad 7www.gjestad.biz Avhengig og uavhengig variabel  Eks: Fattigdom – Psykisk Helse  Oppsett:  Avhengig variabel – rekke  Uavhengig variabel – kolonne  Mye diskusjon på hva som skal stå hvor og det å begrunne dette i presentasjonen av data – TULL !  Slå sammen kategorier (celler) hvis få individer  Bruk av % vs. antall (N)

8 Metode - Rolf Gjestad 8www.gjestad.biz Avhengig og uavhengig variabel  Bruk av desimaler ?  Usikkerhet tilsier at vi ikke bruker desimaler. Men gjøres.  Usikkerhet ivaretas av test-statistikk.

9 Metode - Rolf Gjestad 9www.gjestad.biz Tabell-tolkning  Vanskelig beskrevet  Jo større antall i cellene, jo mindre trenger forskjellen å være  10 % forskjell  Av 1000  Av 30  Hva er en stor forskjell? – Ja, si det !  Teori og kunnskap påvirker ALLE tolkning av resultater

10 Metode - Rolf Gjestad 10www.gjestad.biz Sammenlikning av Statistiske mål  Kontinuerlige variabler vs. kategoriske variabler  Kategorisering? Beholde helst målenivået.  Beregne:  Sentraltendens: Aritmetisk gjennomsnitt / Median  Spredning (varians / standardavvik)  Tabell 13.6  Viser at X middel = og at de som har personansvar har lenger arbeidsuke enn de som ikke har personansvar – Men hva med standardavviket?

11 Metode - Rolf Gjestad 11www.gjestad.biz Mål for samvariasjon – Korrelasjon  Bytte ut det ene leddet i variansformelen:  Varians: individuell variasjon på en variabel  Kovarians: Hvordan individers skårer på en variabel er relatert til skårer på en annen variabel  Kovariansmatrise  Inneholder både varianser og kovarianser

12 Metode - Rolf Gjestad 12www.gjestad.biz Mål for samvariasjon - Korrelasjon  Korrealsjon (r)  Pearson Produkt Moment Korrelasjons Koeffisient.  Syx = Kovarians (av utvalget)  Sy, Sx = Standardavvik (av utvalget)  r = standardisert kovarians.

13 Metode - Rolf Gjestad 13www.gjestad.biz Andre formler for korrelasjon:

14 Metode - Rolf Gjestad 14www.gjestad.biz Mål for samvariasjon - Korrelasjon  Enhetene til måleinstrumentene påvirker ikke korrelasjonens styrke, men likevel problematisk å bruke måle-enhetene gitt en bestemt korrelasjon  r uavhengig av enhetene til måleinstrumentene.  Verdiområde for r  -1: perfekt negativ relasjon  0: ingen lineær relasjon  +1: perfekt positiv relasjon

15 Metode - Rolf Gjestad 15www.gjestad.biz Mål for samvariasjon – Korrelasjon  Positiv korrelasjon: Økning i skåre på en variabel forbundet med økning i skåre på den andre variabelen  Negativ korrelasjon: Økning i skåre på en variabel forbundet med reduksjon i skåre på den andre variabelen  X-tra: r 2 – forklart varians X Y r2r2

16 Metode - Rolf Gjestad 16www.gjestad.biz Mål for samvariasjon - Korrelasjon  Side 257  fig 13.2  Obs. 2 ?  Obs. 1 også ?

17 Metode - Rolf Gjestad 17www.gjestad.biz Mål for samvariasjon - Korrelasjon  Side 258

18 Metode - Rolf Gjestad 18www.gjestad.biz Mål for samvariasjon - Korrelasjon  Side 258

19 Metode - Rolf Gjestad 19www.gjestad.biz Mål for samvariasjon – Korrelasjon  Hva er en høy korrelasjon?  Ikke et fasitsvar: avhengig av hva som studeres og forventninger  Så presenteres lav, middels og høy: , og over.50 !!!  Bivariat analyse og målenivå  Tabell - Side 259

20 Metode - Rolf Gjestad 20www.gjestad.biz Er sammenhenger kausale ?  Nei, som regel ikke.  Lovmessighet? Nei, sjelden.  Regel: 1. Sammenheng mellom X og Y 2. X må komme før Y (eller i det minste samtidig) 3. Kontroll for andre teoretisk relevante variabler

21 Metode - Rolf Gjestad 21www.gjestad.biz Kausale sammenhenger?  Underliggende variabler - 3.variabler  Spuriøse sammenhenger? Condfoundere  Medierende effekt? x y z

22 Metode - Rolf Gjestad 22www.gjestad.biz Kausale sammenhenger? 1. Sammenheng?  Bare en forutsetning, men sier ikke noe om kausalitet. 2. X før Y  Et designproblem: Eksperimentelle studier / flere tidspunkt / panel-studier  Et teoriproblem: Logisk rekkefølge. Eks.: SES hos foreldre – Barns utdanningsvalg.  Hva med underliggende forklaringer her?

23 Metode - Rolf Gjestad 23www.gjestad.biz Kausale sammenhenger? 3. Kontroll for andre relevante variabler?  Vanskelig / umulig å oppfylle  Bare exp. studier som kan?  Mekanisme: som kan belyses/diskuteres. TEORI  Konklusjon: Vanskelig å påvise kausalitet. Vil aldri kunne kontrollere for alle relevante variabler  Derfor: vær MODERAT når trekke slutninger.  TEORETISK FORTOLKNING.  Eksp. Studier: indre og ytre validitet

24 Metode - Rolf Gjestad 24 Kontroll for tredje variabel – Trivariat Analyse Kap 14

25 Metode - Rolf Gjestad 25www.gjestad.biz To Bivariate Sammenhenger  Kontroll for tredje variabler  Trivariate (3) – et særtilfelle av multivariate  Eks.: prediksjon av inntekt  Prediktorer: Utdanning (H L), Yrkesstatus (H L), Kjønn, Ansinitet.  Prosentfordeling og Prosentdifferanse (=forskjell på 2 prosenttall)  Separate analyser

26 Metode - Rolf Gjestad 26www.gjestad.biz Y Y Trivariat analyse  2 separate sammenhenger kan bli seende annerledes ut når disse studeres samtidig. X1 X2 X1 X2

27 Metode - Rolf Gjestad 27www.gjestad.biz Trivariat analyse x y z ? Alder Størrelse på føtter Lese- ferdigheter  Hva forklarer at barn blir flinkere til å lese? Føtter eller alder? ?

28 Metode - Rolf Gjestad 28www.gjestad.biz Trivariat analyse  Finne ut ved å holde en variabel konstant  Se på et og et nivå av en variabel om gangen.  Eks.: se på en aldergruppe om gangen, eks. 10 år.  Se om leseferdighet varierer med forskjellig skostørrelse  Så holde skostørrelse konstant  Se om leseferdighet varierer med forskjellig alder  Sammenheng mellom skostørrelse og leseferdighet er falsk /spuriøs

29 Metode - Rolf Gjestad 29www.gjestad.biz Trivariat analyse  Sammenhengen skyldes at vi IKKE har tatt hensyn til aldersvariabelen – eller andre variabler  Nytt eksempel:  Yrkesstatus  Utdanning  Yrkesstatus en spuriøs sammenheng, dvs. den viktige variabelen er utdanning. Er det slik?  Fiktive data Inntekt

30 Metode - Rolf Gjestad 30www.gjestad.biz Trivariat analyse – Alternative modeller Yrkesstatus Utdanning Inntekt Utdanning Yrkesstatus Inntekt ?

31 Metode - Rolf Gjestad 31www.gjestad.biz Trivariat analyse  Hvis vi ikke kontrollerer for relevante variabler, vil det kunne se ut som om det er en sterkere sammenheng mellom 2 variabler enn det som det egentlig er.  MEN: Vi kan også få sterkere sammenhenger når kontrollerer for andre variabler.  Side : Holde nivåer konstante av en variabel når studere sammenhenger mellom 2 andre variabler

32 Metode - Rolf Gjestad 32www.gjestad.biz Trivariat analyse – Samspill  Sammenheng mellom 2 variabler er forskjellig på ulike nivåer av en tredje variabel.  Dette er definisjonen på en interaksjon  Eks fra 272: Utdanning har størst betydning på lønnsnivå for dem som har lav yrkesstatus.  Muligheter for multivariate analyser med flere hovedeffekter og interaksjonseffekter.

33 Metode - Rolf Gjestad 33 Del IV: Slutningsstatistikk – Å generalisere fra utvalg til populasjon

34 Metode - Rolf Gjestad 34www.gjestad.biz Fra utvalg til populasjon  Populasjon: alle tenkelige observasjoner  Et teoretisk begrep  Resultater fra utvalg (statistikk) som representative for populasjon?  Generaliserbare?  Trukket representativt?  Usikkerhet knyttet til generalisering av resultater  Slutninger om sentraltendens og fordeling  Fordeling i utvalg vs fordeling i populasjon

35 Metode - Rolf Gjestad 35 Beregning av sikkerhetsmargin for gjennomsnitt – estimering Kap 15

36 Metode - Rolf Gjestad 36www.gjestad.biz Estimering  Utgangspunkt: Normalfordeling  Fordeling i populasjon er ukjent !  For å vite snitt og spredning - kartlegg ALLE !  Estimere fordelingen (parameter-verdier) i populasjonen basert på utvalg  Fra NOEN (estimat-verdi) til ALLE (parameter-verdi)  Tilfeldig utvalg: Sannsynlig at estimat av snittet ligger i nærheten av pop.snittet (boka: i området til???)  Trekke nye utvalg (re-sampling), få nye estimater

37 Metode - Rolf Gjestad 37www.gjestad.biz Estimering  Tabell 15.1: To valgdagsmålinger og valgresultatet.  Over/Under-representasjon?  Feilmargin – bruke normalfordelingskurven

38 Metode - Rolf Gjestad 38www.gjestad.biz Normalfordelingskurven  Høyde blant gutter  Fordeling av frekvenser  Flest i midten, så stadig færre jo lenger ut (avvik fra snittet)  Eks: Mange er rundt snittet, få er svært lave/høye  …estimere hva som er området for gj.sn.høyden i populasjonen gutter i vernepliktig alder. (Området?)  Skjevfordeling (skewness)  pos skjev (høyre hale)/neg skjev (venstre hale)  Fordelingens bredde (kurtosis)  Smal og høy vs. Vid og lav  Normalfordeling: snittet separerer 50% over og under.

39 Metode - Rolf Gjestad 39www.gjestad.biz Normalfordelingskurven  Fordelingsform og standardavvik:  jo bredere fordeling, jo større st.avvik  1 st.avvik: 34% * 2 = 68% innen +/- 1 st.avvik  1.96 st.avvik: 95% (13.5% ekstra * 2)  Standardskåre: z = x – x(middel) / s  Hvor mange standardavvik et individ avviker fra snittet.  Snittet = 0, 1 st.avvik = 1

40 Metode - Rolf Gjestad 40www.gjestad.biz Å Estimere et gj.snitt i populasjonen ved utvalgets gj.snitt  Uendelig mange utvalg fra populasjonen  Gir fordeling av estimat-verdien: flere verdier, mange nær pop.verdien, noen mer avvikende.  Utvalgs/Samplingsfordeling av verdier fra mange utvalg (sannsynlighetsfordeling)  Gjennomsnitt og Standardavvik  Hvis uendelig mange utvalg: samplingssnittet = pop.snittet  Sentralgrenseteoremet (Central limit theorem): Normalfordeling av utvalgsverdier, uavhengig av hvordan verdiene i populasjonen fordeler seg.

41 Metode - Rolf Gjestad 41www.gjestad.biz Egenskaper ved tilfeldige utvalg  Hvis trekke for eksempel 40 utvalg fra en populasjon med gitte parametere:  Utvalgsgj.snitt et estimat av populasjons-gj.snitt  Snittet av utvalg-gj.snittene  Populasjon-gj.snitt  Gjennomsnittsverdiene vil variere  Standard-feil = Standardavviket av utvalgenes gjennomsnittsverdier. Utvalgsfordeling (Sample distribution). Det gjennomsnittlige avviket av utvalgsgjennomsnittene  Estimert standardavvik: N-1 (df). Et estimat av populasjonsverdien

42 Metode - Rolf Gjestad 42www.gjestad.biz Å Estimere et gj.snitt i populasjonen ved utvalgets gj.snitt  Mest sannsynlig med verdier nær samplingsgjennomsnittet  Minst sannsynlig at utvalgsgjennomsnitt ligger langt fra samplingsgjennomsnittet  3 typer fordelinger:  Populasjonsfordeling  Samplingsfordeling  Utvalgsfordeling

43 Metode - Rolf Gjestad 43www.gjestad.biz Fra små til større utvalg:  Mindre spredning i utvalgsgjennomsnitt og  utvlagets gjennomsnitt mer likt populasjonens gjennomsnitt.  Fordelingskurven blir smalere  Konklusjon: Større utvalg produserer bedre estimater på gjennomsnittsverdien i populasjonen enn små utvalg.

44 Metode - Rolf Gjestad 44www.gjestad.biz Bruk av hele populasjonen  Hvis alle skårer ble målt:  En ren observasjon hvorvidt det var forskjell på en gitt variabel.  Slipper problemet m/ utvalgsfeil (sampling-error)  Andre mulige typer av feil som kan være årsaken til en gitt forskjell: måling, rekoding

45 Metode - Rolf Gjestad 45www.gjestad.biz Å Estimere et gj.snitt i populasjonen ved utvalgets gj.snitt  Sannsynlig at beregnet snitt estimerer snittet i populasjonen. Det samme / i nærheten av  2 forhold påvirker:  Utvalgsstørrelse – Jo større, jo bedre  Spredningen i utvalget – Jo større, jo mindre presist (større konfidensintervall)  Forutsetning:  Samplingssnittet settes lik utvalgsgj.snittet

46 Metode - Rolf Gjestad 46www.gjestad.biz Å Estimere et gj.snitt i populasjonen ved utvalgets gj.snitt  Spredning / standardavviket til samplingsgjennomsnittene = standardfeil = Observert st.avvik / roten av antall enheter  Estimat på usikkerhet om hva som kan være populasjonens gjennomsnitt

47 Metode - Rolf Gjestad 47www.gjestad.biz Å Estimere et gj.snitt i populasjonen ved utvalgets gj.snitt  Hvis vi trakk en uendelig mengde utvalg fra samme populasjon, ville 95% av disse utvalgsgjennomsnittene befinne seg innenfor +/ standardfeil.  Konklusjon: 95% sannsynlig at vi har rett når vi sier at pop.snittet befinner seg i området innenfor +/ st.feil (0.98 cm hver retning).  5% sannsynlig at vi tar feil – når sier at pop.snittet ligger innen dette området.

48 Metode - Rolf Gjestad 48www.gjestad.biz Å Estimere et gj.snitt i populasjonen ved utvalgets gj.snitt  Området til standardfeilen = Konfidensintervall: Området som populasjonssnittet ved en gitt sannsynlighet befinner seg innenfor  Vanligvis 95% - men og 99% (+/ st.feil)  Estimering dreier seg om sannsynlighet for å gjøre et riktig estimat  5% sannsynlighet for at vi sier at pop.snittet er innenfor konfidensintervallet. Men det kan være over (2.5% sannsynlig) og under (2.5% sanns.)

49 Metode - Rolf Gjestad 49 Beregning av forskjeller mellom grupper – hypotesetesting Kap 16

50 Metode - Rolf Gjestad 50www.gjestad.biz Hypotesetesting  Statistisk signifikanstesting: å undersøke om eventuelle forskjeller mellom utvalg kan generaliseres til også å gjelde mellom populasjonene disse utvalgene er trukket fra.  Påvirket av:  Størrelsen på forskjellen.  Størrelsen på utvalget

51 Metode - Rolf Gjestad 51www.gjestad.biz Hypotesetesting  Hypotesetest: statistisk sannsynlighet for hvilken konklusjon som er riktig:  H0 = ingen forskjell – Denne som testes og eventuelt forkastes !  H1 = forskjell

52 Metode - Rolf Gjestad 52www.gjestad.biz Hypotesetesting  Gitt at ingen forskjell mellom populasjonene:  Trekke uendelig mengde par utvalg (høyskolestudenter og univ.studenter)  Samplingsfordeling:  Svært mange vil få null i differanseskåre.  Noen differanser vil avvike fra null.  Lite sannsynlig med stort avvik.

53 Metode - Rolf Gjestad 53www.gjestad.biz Testing av differanser mellom gjennomsnitt: t-test  Tabell 16.1 side 293: arbeidstid vs. ant. ansatte.  Hvis standardfeilen til differansen blir større enn 1.96 st.feil, da må Ho avvises  Formel: side 294  Finne standardfeil  multiplisere denne med 1.96 for å få kritisk verdi  Er oppnådd verdi mindre / større enn kritisk verdi?  Hvis større, forkaste Ho-hypotesen.

54 Metode - Rolf Gjestad 54www.gjestad.biz Testing av differanser mellom gjennomsnitt: t-test  Når få individer: t-fordeling i stedet for Normalfordeling - tar hensyn til ant. Individer  Ensidig og Tosidig signifikanstesting: Plasserer forkastningsområdet på den ene eller begge sidene av fordelingen.  Forventning til retning på resultatet?  Eks.: pos eller neg. Differanse?

55 Metode - Rolf Gjestad 55www.gjestad.biz Rapportering av resultater fra signifikanstesting  Bestemme signifikansnivå først  Med hvor stor sannsynlighet aksepterer vi å begå feil i forhold til det å forkaste Ho?  Vanlig med 5% (p <.05 / *)  men også 1% (p <.01 / **) og (p <.001 / ***).  p-verdier beregnes fra t-skåren (eller F, χ 2 …)  Lenger ut på t-fordelingen, større t-verdi og lavere p- verdi  Praksis: Hvis oppnådd p-verdi < kritisk p-verdi, da forkaste Ho – dvs. forskjell mellom / relasjon i populasjonen(e).

56 Metode - Rolf Gjestad 56www.gjestad.biz Rapportering av resultater fra signifikanstesting  IKKE BEVIS, men sannsynliggjøring.  Mulig å generalisere fra utvalget  Men jo lavere p-verdi, jo mer sikre på at forskjell.  p <.05: svært lite sannsynlig at en korrekt Ho blir forkastet.  MEN: IKKE det samme som at forskjellen / relasjonen er betydelig / stor

57 Metode - Rolf Gjestad 57www.gjestad.biz Feiltolkning av P-verdier  Ikke styrken til resultatet  p<.05, (bra?), p<.01 (bedre?), p<.001 (best?)  Statistisk signifikans og Substansiell viktighet  r-kvadrert  Klinisk signifikant - Opplevelse

58 Metode - Rolf Gjestad 58www.gjestad.biz Beslutningsbasert Strategi  Effekt-størrelse:  Forskjellen mellom gjennom-snittene (2.3 vs. 2.7 på en skala 1-10), korrelasjonens størrelse. Kan være sterk, men likevel ikke substansiell viktig.  Utvalg-størrelse:  Jo flere personer, jo lettere statistisk signifikant resultat.

59 Metode - Rolf Gjestad 59www.gjestad.biz Signifikans-Testing: p-verdier  Null-hypotese = Ho  Ingen sammenheng, forskjell i populasjonen  Forskningshypotese = H1  Hvis usannsynlig at utvalget kommer fra populasjonen definert av Ho, da forkaste Ho.  Sannsynligheten for Ho som følge av utvalgsfeil.  Hvis mindre enn 5% sannsynlig, da forkaste Ho.  Hvis forkaste Ho, da godta H1? H2, H3, H4….?

60 Metode - Rolf Gjestad 60www.gjestad.biz Tolkning av P-verdier  P-verdi:  Sannsynligheten for at resultatet oppstår som følge av utvalgsfeil.  Hvis p er liten, da forkaste null-hypotesen.  Signifikanstesting = bevisføring mot Ho.  Eks.: r =.66, p<.01: antatt at korrelasjonen mellom variablene er null i populasjonen (null-hypotesen), så er sannsynligheten for å oppnå en korrelasjon på.66 i utvalget mindre enn 1 av 100.  Grense for p-verdi? Ingen absolutt grense.

61 Metode - Rolf Gjestad 61www.gjestad.biz Type 1 og 2 feil (- Kap. 17)  Type 1-feil:  Feilaktig forkaste Ho når Ho er sann for populasjonen som utvalget ble trukket fra. FALSK POSITIV KONKLUSJON. (Jfr. forkaste tvilen om at tiltalte var skyldig, når det faktisk var rimelig grunn til tvil om skyld – ”Justismord”)  Type 2-feil:  Ikke forkaste Ho når den burde vært forkastet, dvs. H1 i populasjonen. FALSK NEGATIV.

62 Metode - Rolf Gjestad 62www.gjestad.biz Testing av sammenhenger i krysstabeller – Khi-kvadrat (χ 2 )  Ikke gjennomsnitt, st.avvik, st.feil  Forventet frekvenser under null-hypotesen – at det ikke er noen sammenheng  Ser da på snittet over gruppene – fordelingen for JA og NEI når kjønns-kategoriene er slått sammen.  se tab 16.3 side 298  Lages nye N i cellene ut fra at det ikke er noen sammenheng, slik at prosentfordelingen blir lik

63 Metode - Rolf Gjestad 63www.gjestad.biz Testing av sammenhenger i krysstabeller – Khi-kvadrat (χ 2 )  Beregne differansen mellom faktisk og forventet fordeling  Hvis denne er liten, lite sannsynlig at det er forskjell i populasjonene (dvs. sannsynlighet for at Ho er riktig)  Utregning – side 300  Store avvik – stort tall  Frihetsgrader (df):  Produktet (ant kategorier minus 1 for alle variablene)

64 Metode - Rolf Gjestad 64www.gjestad.biz Testing av sammenhenger i krysstabeller – Khi-kvadrat (χ 2 )  χ 2 - verdier ved antall frihetsgrader (df)  χ 2 har egen fordeling m/ kritiske verdier (s. 301)  SPSS-utskrift – side 302

65 Metode - Rolf Gjestad 65www.gjestad.biz Sammenhenger mellom variabler – signifikanstest av korrelasjon  Korrelasjon i utvalg – korrelasjon i populasjon  Ho: ingen korrelasjon i populasjonen  Ikke to grupper, men sammenheng mellom variabler som testes  Igjen: ved lav korrelasjon, sannsynlig å beholde Ho. Men hvor er kritisk verdi?  SPSS-resultat – side 303

66 Metode - Rolf Gjestad 66www.gjestad.biz Korrelasjonskoeffisienten  Gitt at: r = 0 i populasjon  r-verdiene i utvalgene vil variere rundt 0.  Noen r vil avvike signifikant mye.  95% av korrelasjonene er sannsynlige under Ho gitt at r=0 i populasjonen.  5% av korrelasjonene er så usannsynlige at muligheten for at r=0 i populasjonen da blir forkastet. Resultatet blir statistisk signifikant.  Dvs.: at vårt utvalg faller i den ekstreme enden av fordelingen av utvalg, gitt at nullhypotesen er korrekt.

67 Metode - Rolf Gjestad 67www.gjestad.biz Korrelasjonskoeffisienten  Egenskaper ved utvalget blir brukt for å avgjøre hvorvidt korrelasjonen i utvalget kommer fra en populasjon hvor korrelasjonen er null !

68 Metode - Rolf Gjestad 68www.gjestad.biz Sammenhenger mellom variabler – signifikanstest av korrelasjon  Standardfeil til korrelasjon:  Finne kritisk verdi  Statistisk signifikans?  Formelen er påvirket av r og n. Dette er viktig å huske.

69 Metode - Rolf Gjestad 69www.gjestad.biz T-test av korrelasjonskoeffisienten  F=t 2  T-test er et særtilfelle av F-test

70 Metode - Rolf Gjestad 70 Hvordan vurdere slutningsstatistikk? Kap 17

71 Metode - Rolf Gjestad 71www.gjestad.biz Hvordan vurdere slutningsstatistikk?

72 Metode - Rolf Gjestad 72www.gjestad.biz Feilslutninger  Konkludere med Ho, men H1 er riktig  Konkludere med at Ho er feil, når Ho er riktig  NB: Hvor viktige er eventuelle statistiske signifikante forskjeller?  ALLTID Ho-HYPOTESEN SOM TESTES !  Hypotesetesting: beregne hvor stor sannsynlighet for å få det observerte resultatet dersom nullhypotesen er sann (p-verdien angir denne sannsynligheten)

73 Metode - Rolf Gjestad 73www.gjestad.biz Feilslutninger  Hvis p er stor (eks.: p =.40), er det 40% sannsynlig å få dette resultatet dersom Ho er sann  Frekventistisk statistikk: Får dette resultatet i 40% av alle utvalg som kan trekkes (samples) fra populasjonen.  = det er 40% sannsynlighet for å forkaste en riktig Ho.

74 Metode - Rolf Gjestad 74www.gjestad.biz Feilslutninger  Konvensjon: Akseptere 5% sannsynlighet for å forkaste en Ho som er korrekt.  p <.05 (i boka: p≤.05): forkaste Ho. Men fortsatt en liten sannsynlighet for at Ho er riktig (Type I–feil)  Redusere faren for type I-feil ved å bruke 1% i stedet for 5%  p ≥.05: godta Ho-hypotesen. Også mulig å godta Ho når denne ikke er sann (Type II-feil).

75 Metode - Rolf Gjestad 75www.gjestad.biz Feilslutninger  Kan velge andre signifikansnivå, f.eks. 10%.  Reduserer type II-feil  Innledende faser i forskning

76 Metode - Rolf Gjestad 76www.gjestad.biz Statistisk og Innholdsmessig signifikans  Signifikanstesting: for å kunne generalisere fra utvalg til populasjon  Hva skal generaliseres? Alternativ hypotese (H1)  Hvis forskjell - Hvor stor forskjell?  Hvis nullhypotesen får støtte (= korrekt) er dette også interessant.  Store utvalg: selv små forskjeller kan bli stat.sign.  Substansielt (innholdsmessig) interessant?

77 Metode - Rolf Gjestad 77www.gjestad.biz Slutningsstatistikk og ytre validitet  Fra utvalg til populasjon handler også om representativitet i data.  Tilfeldig frafall? (Missing at random)  Generaliserbarhet:  Geografisk / kulturell / subkultur  Land  Historisk – tid  Eks.: er relasjonen mellom arbeidsledighet og sosial tilhørighet lik over ulike land i Europa?


Laste ned ppt "Metode - Rolf Gjestad www.gjestad.biz 1 Sammenheng mellom flere variabler – Bivariat Analyse Kap 13."

Liknende presentasjoner


Annonser fra Google