Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

1 Kap 12 Korrelasjon / Regresjon. 2 Begrep Korrelasjon:Et mål for lineær samvariasjon. Regresjon:Tilpasning av en rett linje til et sett punkter. Estimere.

Liknende presentasjoner


Presentasjon om: "1 Kap 12 Korrelasjon / Regresjon. 2 Begrep Korrelasjon:Et mål for lineær samvariasjon. Regresjon:Tilpasning av en rett linje til et sett punkter. Estimere."— Utskrift av presentasjonen:

1 1 Kap 12 Korrelasjon / Regresjon

2 2 Begrep Korrelasjon:Et mål for lineær samvariasjon. Regresjon:Tilpasning av en rett linje til et sett punkter. Estimere den avhengige variable ut fra den uavhengige variable. Regresjonsanalyse:Inferens.

3 3 Minste kvadraters metode (MKM) Tilpasning av en rett linje xixi 00 Y X didi (x i, y i ) Best mulig tilpassede rette linje Ønsker å minimalisere

4 4 Minste kvadraters metode (MKM) xixi 00 Y X didi (x i, y i ) Best mulig tilpassede rette linje Ønsker å minimalisere denne

5 5 Minste kvadraters metode (MKM) xixi 00 Y X didi (x i, y i ) Best mulig tilpassede rette linje Ønsker å minimalisere denne

6 6 Minste kvadraters metode (MKM) xixi 00 Y X (5,4) Best mulig tilpassede rette linje (2,1) (3,3) (7,2) (8,3) Eks

7 7 Et mål for lineær samvariasjon: Korrelasjon Kurs År Dødsfall pr innb. Sigaretter pr person Aksjekurs for Bergen Bank og DNC Røyking og kreft

8 8 Korrelasjon / Kryssproduktsum DNC - DNCsnitt BB - BBsnitt Aksediagram Kurs År Aksjekurs for Bergen Bank og DNC Bergen BankBBsnitt: DNCDNCsnitt: Kryssproduktsum:

9 9 Kryssproduktsum BB - DNC: Kreft: Presse: Styrke:-Fortegn (positiv eller negativ samvariasjon) Svakhet:-Intetsigende tallstørrelse (jo flere data, jo større sum) -Intetsigende benevning Samvariasjon i aksjekurser Samvariasjon i røyking og kreft Samvariasjon i pressestøtte og opplag

10 10 Kryssproduktsum / Kovarians Kovarians = gjennomsnittlig kryssproduktsum

11 11 Kovarians Def X, Y Stokastiske variable I(X-  1 ) > 0 (X-  2 ) > 0V > 0Positiv samvariasjon (X-  1 ) 0 II (X-  1 ) > 0 (X-  2 ) < 0V < 0Negativ samvariasjon (X-  1 ) 0V < 0 Korrelasjonskoeffisient  nær 1:Høy positiv korrelasjon  nær -1:Høy negativ korrelasjon  nær 0:Svært liten korrelasjon

12 12 Estimering av korrelasjonskoeffisient Som estimator for korrelasjonskoeffisienten  basert på n par av observasjoner av X og Y brukes den empiriske korrelasjonskoeffisienten R gitt ved:

13 13 Estimering av korrelasjonskoeffisient Eks X i (cm) Y i (kg) Høyde (X) og Vekt (Y) for n = 10 kvinnelige toppidrettsutøvere: Y X Klar positiv korrelasjon mellom høyde og vekt for kvinnelige toppidrettsutøvere.

14 14 Korrelasjonskoeffisient Alternative uttrykk

15 15 Regresjonsanalyse Ofte er vi interessert i å finne en sammenheng mellom en resultatvariabel Y og en forklaringsvariabel X. Eks:Y = AvlingsmengdeX = Gjødselsmengde Y = Solgt kvantum av et produktX = Reklameinnsats Enkel regresjonsmodell Konstantledd Regresjonskoeffisient Feilledd (med forventning 0)

16 16 Enkel regresjonsmodell YUavhengig Normalfordelt XIkke-stokastisk ( = x) n par av observasjoner av x og Y: (x 1,Y 1 ) - (x 2,Y 2 ) -…- (x n,Y n ) Modell-antakelser: U 1, U 2, …, U n er uavhengige og normalfordelte med forventning 0 og varians  2.

17 17 Enkel regresjonsmodell x1x1 x2x2 x3x3 00 Y X  0 +  1 x Y1Y1 Y2Y2 Y3Y3 Y Regresjonsmodell: Spredningsdiagram: Skal estimere  0 og  1

18 18 Enkel regresjonsmodell Minste kvadraters metode (MKM) xixi 00 Y X Y i - (  0 +  1 x i )

19 19 Enkel regresjonsmodell Minste kvadraters metode (MKM)

20 20 Enkel regresjonsmodell Minste kvadraters metode (MKM)

21 21 Den estimerte regresjonslinjen: Forventning / Varians : Enkel regresjonsmodell

22 22 Enkel regresjonsmodell Utledning av uttrykk for estimator og varians

23 23 En ny type gjødsel skal prøves ut ved dyrking av mais. Forsøket skal foregå på forsøksfelt som er delt opp i 15 jordstykker, hvert på 4 mål. Vi antar at avlingsmengden Y (tonn) på et jordstykke kan oppfattes som en normalfordelt stokastisk variabel. Forventet avlingsmengde er avhengig av hvor mye gjødsel som blir brukt, og vi antar E(Y) =  0 +  1 x når det blir gjødslet med x hundre kg gjødsel. Standardavviket  = 0.40 er kjent, og avlingsmengder på forskjellige jordstykker er uavhengige variable. X i Y i Eks: Gjødsel og avling Enkel regresjonsmodell Minste kvadraters metode (MKM)

24 24 X i Y i Eks: Gjødsel og avling Estimering Beregning av estimatene: Estimert regresjonslinje: Enkel regresjonsmodell Minste kvadraters metode (MKM)

25 25 X i Y i Et 95% konfidensintervall for  1 er gitt ved: Estimert regresjonslinje: Eks: Gjødsel og avling Konfidensintervall Enkel regresjonsmodell Minste kvadraters metode (MKM)

26 26 Hypotesetest Erfaring fra en mye brukt gjødseltype går ut på at økning i gjødselmengden på 100 kg på det aktuelle arealet i gjennomsnitt gir 0.25 tonn i økt avlingsmengde. Vi vil teste om den nye gjødseltypen er bedre, dvs om den fører til større økning i avlingsmengden. Vi stiller altså spørsmålet om  1 > Nullhypotesen: Alternativ hypotese: Påstår H 1 dersom: (5% signifikansnivå) Kritisk verdi: Resultatene tyder på at den nye gjødseltypen gir større avling.

27 27 Signifikanssannsynlighet Vi kan alternativt regne ut signifikanssannsynligheten: Siden p = < 0.05 påstår vi H 1. Den lave signifikanssannsynligheten tyder på at den nye gjødseltypen er klart best.

28 28 Estimator / Varians: Konfidensintervall for Y 95% konfidensintervall for forventet avlingsmengde når det brukes 250 kg gjødsel, dvs x=2.5: Estimert avling ved gjødselmengde x: Forventet avling ved gjødselmengde x: Estimert avling ved gjødselmengde 2.5kg:

29 29 Estimator / Varians: Konfidensintervall for Y Utledning av uttrykk for estimator og varians

30 30 Prediksjon Prediksjon av Y for gitt x - Prediksjonsintervall for Y En bonde som skal dyrke mais, er nok mer interessert i kunnskap om selve avlingen han vil få, enn i kunnskap om forventet avling. Vi ønsker å estimere avlingen Y for en gitt x-verdi, samt finne et intervall som inneholder Y med en gitt (høy) grad av sikkerhet. Det å anslå størrelsen på uobserverte stokastiske variabler er en form for estimering som vi kaller prediksjon, i motsetning til ’vanlig’ estimering som går ut på å anslå størrelsen av ukjente parametre. Vi sier at vi skal predikere Y for en gitt verdi av x, og vi ønsker dessuten å finne et såkalt prediksjonsintervall for Y. Prediksjonsintervall: Konfidensintervall for en uobservert stokastisk variabel Vanlig konfidensintervall:Konfidensintervall for en ukjent parameter Prediksjonsintervall: Gjelder en enkelt Y-verdi Konfidensintervall:Gjelder populsjonsgjennomsnittet

31 31 Prediksjon Prediksjon av Y for gitt x - Prediksjonsintervall for Y Når vi skal resonnere oss frem til en metode for prediksjon av en ny observasjon Y, tar vi utgangspunkt i differensen (Y - Y hatt ). Denne differensen er normalfordelt siden Y og Y hatt begge er normalfordelte. Videre er Y uavhengig av Y hatt fordi Y er en ny observasjon og Y hatt bygger på gamle observasjoner.

32 32 Prediksjon Prediksjon av Y for gitt x - Prediksjonsintervall for Y Forventning til differensen: Siden forventningen til differensen er 0, er det naturlig å bruke følgende estimator eller prediktor for Y: Varians: Prediksjonsintervall for Y. Inneholder Y med sannsynlighet 1-  :

33 33 Standardestimator for variansen  2 i regresjonsmodellen: Ukjent 

34 34 Standardestimator for variansen  2 i regresjonsmodellen: Ukjent  95% konfidensintervall for  1 : Test med nivå 5% ved å påstå H 1 dersom : Regner ut T 0 : Påstår H 1 fordi :

35 35 Standardestimator for variansen  2 i regresjonsmodellen: Oppsummering I Korrelasjon : Enkel regresjonsmodell : Konfidensintervall for  1 :

36 36 Estimator / Varians: Konfidensintervall Estimert Y: Forventning til Y : Prediksjon: Prediksjonsintervall Oppsummering II

37 37 ENDEND


Laste ned ppt "1 Kap 12 Korrelasjon / Regresjon. 2 Begrep Korrelasjon:Et mål for lineær samvariasjon. Regresjon:Tilpasning av en rett linje til et sett punkter. Estimere."

Liknende presentasjoner


Annonser fra Google