Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

Managerial Decision Modeling Cliff Ragsdale 6. edition Rasmus RasmussenBØK350 OPERASJONSANALYSE1 Chapter 9 Regression Analysis.

Liknende presentasjoner


Presentasjon om: "Managerial Decision Modeling Cliff Ragsdale 6. edition Rasmus RasmussenBØK350 OPERASJONSANALYSE1 Chapter 9 Regression Analysis."— Utskrift av presentasjonen:

1 Managerial Decision Modeling Cliff Ragsdale 6. edition Rasmus RasmussenBØK350 OPERASJONSANALYSE1 Chapter 9 Regression Analysis

2 Rasmus RasmussenBØK350 OPERASJONSANALYSE Regresjonsanalyse brukes for å estimere en funksjon f ( ) som beskriver sammenhengen mellom en kontinuerlig avhengig variabel (Y) og en eller flere uavhengige variabler (X). Y = f(X 1, X 2, X 3,…, X n ) +  Merk: f ( ) beskriver den systematiske variasjonen i sammenhengen.  angir den usystematiske variasjonen (eller stokastisk avvik) i sammenhengen. Introduksjon til Regresjonsanalyse 2

3 Rasmus RasmussenBØK350 OPERASJONSANALYSE3 Betrakt forholdet mellom reklame ( X 1 ) og salg ( Y ) for et selskap. Det eksisterer sannsynligvis en sammenheng......når reklamen øker, bør også salget øke. Men hvordan kan vi måle og kvantifisere denne sammenhengen ? Et eksempel

4 Rasmus RasmussenBØK350 OPERASJONSANALYSE4 Data

5 Rasmus RasmussenBØK350 OPERASJONSANALYSE5 Et scatterdiagram over dataene

6 Rasmus RasmussenBØK350 OPERASJONSANALYSE6 Karakteristika for statistiske sammenhenger Regresjonskurve Sannsynlighetsfordelinger for Y ved forskjellige nivåer av X Y X

7 Rasmus RasmussenBØK350 OPERASJONSANALYSE7 Scatterdiagrammet indikerer en lineær sammenheng mellom reklame og salg. Dataene antyder derfor følgende regresjonsmodell, populasjonen Denne modellen representerer den sanne sammenhengen mellom hele populasjonen av reklame- og salgs-verdier. utvalg Den estimerte regresjonsfunksjonen (basert på vårt data- utvalg) angis som følger, En enkel regresjonsanalysemodell

8 Rasmus RasmussenBØK350 OPERASJONSANALYSE8 Vi må tildele numeriske verdier til b 0 og b 1 Minste kvadraters metode (“least squares”) finner de verdiene som minimerer: Hvis ESS =0 så passer vår estimerte funksjon perfekt til dataene. ESS = Error Sum of Squares, dvs. sum kvadrerte avvik. Vi kan løse problemet ved hjelp av Solver… Finne beste tilpassing (best fit)

9 Rasmus RasmussenBØK350 OPERASJONSANALYSE9 Modellen i regneark

10 Rasmus RasmussenBØK350 OPERASJONSANALYSE10 Tilpassing av funksjonen

11 Rasmus RasmussenBØK350 OPERASJONSANALYSE11 Den estimerte regresjonsfunksjonen er : Den estimerte regresjonsfunksjonen

12 Rasmus RasmussenBØK350 OPERASJONSANALYSE12 Legge til add-ins i Excel Klikk på Start-knappen Velg Excel Options Klikk på Add-Ins Velg Excel Add-ins og klikk på Go…

13 Rasmus RasmussenBØK350 OPERASJONSANALYSE13 Legge til add-ins i Excel Velg Analysis ToolPak Dukker opp sist under Data

14 Rasmus RasmussenBØK350 OPERASJONSANALYSE14 Excel har også innebygde funksjoner for regresjonsanalyse som : Er enklere å bruke Gir mye mere informasjon om problemet Bruk av regresjonshjelpemidler

15 Rasmus RasmussenBØK350 OPERASJONSANALYSE15 Regresjonsanalyse i Excel

16 Rasmus RasmussenBØK350 OPERASJONSANALYSE16 Regresjonsresultat

17 Rasmus RasmussenBØK350 OPERASJONSANALYSE17 TREND(Y-område; X-område; X-verdi for prediksjon) der: Y-område er området i regnearket som inneholder verdiene for den avhengige Y variabelen, X-område er området i regnearket som inneholder verdiene for de(n) uavhengige X variablene, X-verdi for prediksjon er en celle (eller celler) som inneholder verdier for X variabelen(e) som vi ønsker å bruke til å estimere verdier for Y. Merk: TREND( ) funksjonen blir dynamisk oppdatert hver gang dataene til funksjonen endres. Imidlertid gir den ikke den statistiske informasjonen som regresjonsanalysen gir. TREND() funksjonen

18 Rasmus RasmussenBØK350 OPERASJONSANALYSE18 Evaluere “tilpassingen” Høyre-klikk på punktene i scatter- diagrammet:

19 Rasmus RasmussenBØK350 OPERASJONSANALYSE19 R 2 indikerer hvor godt den estimerte regresjonsfunksjonen passer dataene. 0 ≤ R 2 ≤ 1 Den måler andelen av den totale variasjonen i Y rundt gjennomsnittet, som kan forklares med den estimerte regresjonsfunksjonen. For å forstå dette bedre, betrakt følgende figur... R 2 Determinasjonskoeffisienten

20 Rasmus RasmussenBØK350 OPERASJONSANALYSE20 Dekomponering av estimeringsfeil Y X * Y i (faktisk verdi) Y { Y i - Y ^ Y = b 0 + b 1 X Y i (estimert verdi) ^ Y i -YiYi } Y i - Y ^ } ^ TotalavvikTSS Forklarte avvik RSS Uforklarte avvik ESS

21 Rasmus RasmussenBØK350 OPERASJONSANALYSE21 TSS = ESS + RSS TSS = Total Sum of Squares ESS = Error Sum of Squares RSS = Regression Sum of Squares

22 Rasmus RasmussenBØK350 OPERASJONSANALYSE22 Anta at vi er interessert i å estimere forventet salgsnivå hvis $ brukes på reklame. Estimert salg= 36, ,550 * 65 = 397,092 Så hvis $65000 brukes på reklame, vil vi forvente at omsetningen i gjennomsnitt vil ligge på $ (Husk: Alle tall er i tusen.) Prediksjoner for markedsføring

23 Rasmus RasmussenBØK350 OPERASJONSANALYSE23 Regresjonens standardavvik måler spredningen av de faktiske data omkring den estimerte regresjonslinjen. der k = antall uavhengige variabler I vårt eksempel er S e = 20,421 Dette er nyttig hvis vi skal lage prediksjoner... Regresjonens standardavvik

24 Rasmus RasmussenBØK350 OPERASJONSANALYSE24 Et tilnærmet 95% prediksjonsintervall for en ny verdi til Y når X 1 =X 1 h kan finnes ved : der: Eksempel: Hvis $65(000) brukes på reklame: 95% nedre prediksjonsintervall = 397, *20,421 = 356,250 95% øvre prediksjonsintervall = 397, *20,421 = 437,934 Hvis vi bruker $ i reklame kan vi være omtrent 95% sikre på at virkelig omsetning vil ligge mellom $ og $ Et tilnærmet prediksjonsintervall

25 Rasmus RasmussenBØK350 OPERASJONSANALYSE25 Et (1-  )% prediksjonsintervall for en ny verdi på Y når X 1 =X 1 h finnes ved : der: Et eksakt prediksjonsintervall

26 Rasmus RasmussenBØK350 OPERASJONSANALYSE26 t -Tabell

27 Rasmus RasmussenBØK350 OPERASJONSANALYSE27 Hvis $65(000) brukes til reklame: 95% nedre prediksjonsintervall = 397, ,306*21,489 = 347,556 95% øvre prediksjonsintervall = 397, ,306*21,489 = 446,666 Hvis vi bruker $ på reklame kan vi være 95% sikre på at faktisk omsetning vil være mellom $ og $ Dette intervallet er bare omtrent $ større enn det tilnærmede beregnet tidligere, men er mye vanskeligere å beregne. Den ekstra nøyaktigheten er ikke bestandig verd bryet. Et eksempel

28 Rasmus RasmussenBØK350 OPERASJONSANALYSE28 Sammenligning av prediksjonsintervall-teknikker

29 Rasmus RasmussenBØK350 OPERASJONSANALYSE29 Prediksjonsintervall i Excel

30 Rasmus RasmussenBØK350 OPERASJONSANALYSE30 Et (1-  )% konfidensintervall for det virkelige gjennomsnittet for Y når X 1 =X 1 h er gitt ved : der: Konfidensintervall for gjennomsnittet

31 Rasmus RasmussenBØK350 OPERASJONSANALYSE31 Prediksjoner basert på en estimert regresjonsligning vil ha liten eller ingen gyldighet hvis verdier til den uavhengige variabelen er langt utenfor det intervall som regresjonsanalysen er basert på. (Dvs. Når X gis en verdi som er mye mindre eller større enn de verdier som finnes i datasettet.) En kommentar til ekstrapolering

32 Rasmus RasmussenBØK350 OPERASJONSANALYSE32 Regresjonens gyldighetsområde Y X Regresjonslinje Konfidensintervall

33 Rasmus RasmussenBØK350 OPERASJONSANALYSE33

34 Rasmus RasmussenBØK350 OPERASJONSANALYSE34 Mange regresjonsanalyser omfatter mer enn én uavhengig variabel (dvs. har mange forklaringsvariabler). Hvis hver uavhengig variabel varierer lineært med Y, så vil den estimerte regresjonsfunksjonen være : De optimale verdiene b j kan fortsatt finnes ved å minimere ESS. Resultatet er en funksjon som tilpasser et hyperplan til datautvalget. Multippel Regresjonsanalyse

35 Rasmus RasmussenBØK350 OPERASJONSANALYSE35 Eksempel på regresjonsplan for to uavhengige variabler Y X1X1 X2X2 * * * * * * * * * * * * * * * * * * * * * * *

36 Rasmus RasmussenBØK350 OPERASJONSANALYSE36 En eiendomsmegler ønsker å lage en modell til hjelp ved fastsettelsen av en nøytral markedsverdi av eneboliger. Tre uavhengige variabler vil bli brukt for å estimere salgsverdien på et hus : Totalt flateinnhold Antall soverom Størrelse på garasjen Multippel regresjonsanalyse: Eiendomstakst

37 Rasmus RasmussenBØK350 OPERASJONSANALYSE37 Datagrunnlag

38 Rasmus RasmussenBØK350 OPERASJONSANALYSE38 Scatter plots

39 Rasmus RasmussenBØK350 OPERASJONSANALYSE39 Vi ønsker å finne den enkleste modellen som gir tilstrekkelig forklaring av den systematiske variasjonen i Y variabelen. Vilkårlig bruk av alle uavhengige variabler kan resultere i overtilpassing. Et utvalg gjenspeiler karakteristika: Representative for populasjonen Spesifikk for utvalget Vi ønsker å unngå å tilpasse regresjonen til utvalgsspesifikke karakteristika – dvs. overtilpasse modellen. Valg av regresjonsmodell

40 Rasmus RasmussenBØK350 OPERASJONSANALYSE40 Med tanke på enkelhet, kan vi foreta regresjonsanalyse av følgende tre modeller: FlateinnholdGarasjerSoverom De viktigste regresjonsresultatene er: Modellen basert på X 1 forklarer 87% av variasjonen i Y, resterende 13% er uforklart. Modeller med én uavhengig variabel Variabler i modellen R 2 Justert R 2 SeSe Parameter Estimater X1X1 0,8700,85510,299b 0 =9,503, b 1 =56,394 X2X2 0,7590,73114,030b 0 =78,290, b 2 =28,382 X3X3 0,7930,77012,982b 0 =16,250, b 3 =27,607

41 Rasmus RasmussenBØK350 OPERASJONSANALYSE41 Evaluering av modellen Større enn 5%. Ikke Ikke signifikant forskjellig fra 0.

42 Rasmus RasmussenBØK350 OPERASJONSANALYSE42 Ved bruk av mer enn én uavhengig variabel, må alle X-variablene være plassert i ett sammenhengende område av celler. Dvs. X-variablene må ligge i tilgrensende kolonner. Viktig programvarebegrensing

43 Rasmus RasmussenBØK350 OPERASJONSANALYSE43 Anta at vi kjører regresjonsanalysen for følgende to modeller: Flateinnhold + Garasjer Flateinnhold + Soverom De viktigste regresjonsresultatene er: Modellen basert på X 1 og X 2 forklarer 93,9% av variasjonen i Y, resterende 6,1% er uforklart. Modeller med to forklaringsvariabler Variabler i modellen R 2 Justert R 2 SeSe Parameter Estimater X1X1 0,8700,85510,299b 0 =9,503, b 1 =56,394 X 1 & X 2 0,9390,924 7,471b 0 =27,684, b 1 =38,576 b 2 =12,875 X 1 & X 3 0,8770,84710,609b 0 =8,311, b 1 =44,313 b 3 =6,743

44 Rasmus RasmussenBØK350 OPERASJONSANALYSE44 Etter hvert som nye uavhengige variabler tilføyes i modellen: R 2 (determinasjonskoeffisienten) kan bare øke. Justert-R 2 kan øke eller minke. R 2 kan økes kunstig ved å legge til en hvilken som helst ny uavhengig variabel. Vi kan sammenligne justert-R 2 verdier som en heuristikk (brukbar forenkling) for å avgjøre om en ny uavhengig variabel har vært til hjelp i å forbedre regresjonsmodellen. Justert R 2

45 Rasmus RasmussenBØK350 OPERASJONSANALYSE45 Det bør ikke overraske at å legge til X 3 (antall soverom) til modellen med X 1 (total grunnflate) ikke utgjorde noen signifikant forbedring. Begge variablene representerer det samme (eller lignende forhold) – størrelsen på huset. Disse X-variablene er sterkt korrelert (kolineære). Multikolineæritet bør unngås. Multikolineæritet

46 Rasmus RasmussenBØK350 OPERASJONSANALYSE46 Anta at vi foretar regresjonsanalyse med følgende modell med tre forklaringsvariabler: Flateinnhold + Garasjer + Soverom De viktigste regresjonsresultatene er: Modellen basert på X 1 og X 2 synes å være best: - Størst justert-R 2 - Lavest S e (mest presise prediksjonsintervall) Modell med tre forklaringsvariabler Variabler i modellen R 2 Justert R 2 SeSe Parameter Estimater X1X1 0,8700,85510,299b 0 =9,503, b 1 =56,394 X 1 & X 2 0,9390,924 7,471b 0 =27,684, b 1 =38,576, b 2 =12,875 X 1, X 2 & X 3 0,9430,9187,762b 0 =26,440, b 1 =30,803, b 2 =12,567, b 3 =4,576

47 Rasmus RasmussenBØK350 OPERASJONSANALYSE47 Evaluering av modellen Skifter fortegn. Ikke Ikke signifikant forskjellig fra 0.

48 Rasmus RasmussenBØK350 OPERASJONSANALYSE48 Residual Plots

49 Rasmus RasmussenBØK350 OPERASJONSANALYSE49 La oss estimere salgsprisen for et hus på 2100 m 2 og med 2 garasjer (husk tall i 1000, unntatt garasje og soverom) : Estimert gjennomsnittlig salgspris er $ Et 95% prediksjonsintervall for faktisk salgspris er omtrent: 95% nedre prediksjonsintervall = 134, *7,471 = $119,502 95% øvre prediksjonsintervall = 134, *7,471 = $149,386 Foreta prediksjoner

50 Rasmus RasmussenBØK350 OPERASJONSANALYSE50 Andre typer ikke-kvantifiserbare faktorer kan inkluderes i analysen ved å bruke binærvariabler. Eksempel: Om det finnes et svømmebasseng: Eksempel: Hvorvidt taket er i god, gjennomsnittlig eller dårlig forfatning, Binære forklaringsvariabler

51 Rasmus RasmussenBØK350 OPERASJONSANALYSE51 Noen ganger er sammenhengen mellom en avhengig og uavhengig variabel ikke lineær. Polynomisk Regresjon Grafen antyder en kvadratisk sammenheng mellom flatemål (X) og salgspris (Y).

52 Rasmus RasmussenBØK350 OPERASJONSANALYSE52 En passende regresjonsmodell i dette tilfellet kan være : Eller ekvivalent: Der: Regresjonsmodellen

53 Rasmus RasmussenBØK350 OPERASJONSANALYSE53 Implementere modellen

54 Rasmus RasmussenBØK350 OPERASJONSANALYSE54 Graf i Excel

55 Rasmus RasmussenBØK350 OPERASJONSANALYSE55 Graf med estimert kvadratisk regresjonsfunksjon

56 Rasmus RasmussenBØK350 OPERASJONSANALYSE56 Vi kan på samme måte tilpasse en tredje ordens polynomisk modell, Eller ekvivalent: Der: Tilpasse en tredje ordens polynomisk modell

57 Rasmus RasmussenBØK350 OPERASJONSANALYSE57

58 Rasmus RasmussenBØK350 OPERASJONSANALYSE58 Signifikant modell ? Ikke signifikant forskjellig fra 0 ved 5% signifikansnivå.

59 Rasmus RasmussenBØK350 OPERASJONSANALYSE59 Ved tilpassing av polynomiske modeller, må en være forsiktig for å unngå overtilpassing. Den justerte-R 2 kan også brukes for å undersøke overtilpassing. Vi kan dessuten få problemer med multikolineæritet. Overtilpassing

60 Rasmus RasmussenBØK350 OPERASJONSANALYSE60 1.Velg modell – lag en regresjonsligning: Y = b 0 + b 1 X (Forklar også med ord!) 2.Plott dataene (scatterplot). Lineær funksjon? 3.Foreta regresjonsanalyse: a) Er modellen ”god” ? (Sjekk R 2 ) b) Er koeffisientene signifikante (Sjekk p)? c) Hvis ikke signifikant modell, gå tilbake til trinn 1. 4.Foreta prediksjoner. Lag konfidensintervall. 5.Kan bruke TREND() for å lage prediksjoner. Regresjon - Tilpasse en funksjon

61 Rasmus RasmussenBØK350 OPERASJONSANALYSE61 Slutt på kapittel 9


Laste ned ppt "Managerial Decision Modeling Cliff Ragsdale 6. edition Rasmus RasmussenBØK350 OPERASJONSANALYSE1 Chapter 9 Regression Analysis."

Liknende presentasjoner


Annonser fra Google