Transformasjoner Men hva hvis relasjonen er kurvelinjær? OLS-regresjon forutsetter at det er en linjær sammenheng mellom x’ene og y. Men hva hvis relasjonen er kurvelinjær? ► Transformasjon av x eller y Dvs.: opphøye x i en eller annen potens: x2, x0,3, x4, x0,7 etc NB: Mest vanlig å transformere en eller flere x-variabler Annen effekt av transformasjoner er at feilleddene får en bedre fordeling, og at innflytelsesrike case mister styrke ► Ofte grunn god nok til å vurdere transformasjoner JFRYE2005
1: Fokus på kurvilinjære spesifikasjoner av modellen (’SUBSTANSIELT MOTIVERT TRANSFORMASJON’) JFRYE2005
y x JFRYE2005
y x JFRYE2005
y x JFRYE2005
y x JFRYE2005
y x JFRYE2005
y x JFRYE2005
Trikset er grovt sett å erstatte casenes originale verdier med disse verdiene opphøyd i en eller annen potens. For eksempel X: 1 2 3 4 … X2: 1 4 9 16 … JFRYE2005
Effekten av ett ekstra ’poeng’ på x-aksen stiger desto høyere opp man er i utgangspunktet Si at y = b1 + b2x1 y = 1 + 2x1 Hvis x = 1, y = 3 x = 2, y = 5 x = 3, y = 7 x = 4, y = 9 x = 5, y = 11 x = 6, y = 13 JFRYE2005
JFRYE2005
Effekten av ett ekstra ’poeng’ på x-aksen stiger desto høyere opp man er i utgangspunktet Si at y = b1 + b2(x12) y = 1 + 2 (x12) Hvis x = 1, y = 3 x = 2, y = 9 x = 3, y = 19 x = 4, y = 33 x = 5, y = 51 x = 6, y = 73 JFRYE2005
JFRYE2005
Uttalige variasjoner… y = b1 - b2 * (x12) MINUS I STEDET FOR PLUSS y = b1 + b2 * (x1 + x12) ANNETGRADSLEDD y = b1 + b2 * (x13) TREDJE POTENS y = b1 + b2 * (x1 + x12 - x13 + 40x1) osv… JFRYE2005
y = b1 - b2(x12) JFRYE2005
y = b1 + b2(x1 + x12) JFRYE2005
y = b1 + b2 * (x13) JFRYE2005
Hvilken potens og matematisk form skal man velge? Svar: Hva passer best til dine data? ►Teoretisk spørsmål… ►…og et empirisk spørsmål JFRYE2005
Hint: Lag skatterplott JFRYE2005
Dette kommer vi tilbake til senere i kurset Vær oppmerksom på at det også finnes to andre fremgangsmåter for å modellere kurvilinjære relasjoner ► Dummier ► Båndregresjon Dette kommer vi tilbake til senere i kurset JFRYE2005
2: Fokus på problemet med feilfordelte feilledd og innflytelsesrike case (’METODISK MOTIVERT TRANSFORMASJON’) JFRYE2005
Huskeregel Normalfordelte variabler (y og x’er) gir som regel normalfordelte feilledd og færre innflytelsesrike case Derfor er det lurt å jobbe med variablene, selv om det egentlig er feilleddene og de innflytelsesrike casene man er ute etter å modifisere JFRYE2005
Eksempler fra ESS-datasettet JFRYE2005
Hvis variablen er positiv skeiv - velg potens < 1 Hvis variablen er negativ skeiv - velg potens > 1 (Potens = 1 gir ingen endring, ettersom a1 = a) NB: ET EMPIRISK VALG – PRØVE OG FEILE-METODEN SOS3003/JFRYE
Transformasjoner av Y Problem: Du sitter ikke igjen med kunnskap om hvordan X påvirker Y – men hvordan X påvirker den transformerte Y Fungerer ofte greit statistisk Men: Forverrer den substansielle fortolkningen av resultatene Må transformere resultatene ’tilbake’ – dvs. foreta en invers transformasjon Transformasjon: Yq Invers transformasjon: Y1/q SOS3003/JFRYE