Regresjonsanalyse Korrelasjon HSTAT1101: 13. oktober 2004 Odd Aalen
Hovedproblemstilling i regresjon og korrelasjon Måler flere størrelser Ønsker å finne ut av sammenhengen mellom dem Regresjon og korrelasjon er statistiske metoder til å bestemme slike sammenhenger
Fra læreboka: Sammenheng mellom høyde og skonummer for 22 studenter.
Asia Pacific J Clin Nutr (2002) 11(1): 8–12 Dietary patterns and risk factors for Type 2 diabetes mellitus in Fijian, Japanese and Vietnamese populations Kazue Tomisaka and coauthors
Paper from British Medical Journal BMJ 2002;324:23 ( 5 January ) Education, income inequality, and mortality: a multiple regression analysis Andreas Muller
Mortality and level of education Age adjusted death rates by educational attainment for the 50 US states and the District of Columbia (DC), 1989-90 (y=6.16+0.103×x).
The Gini coefficient The Gini coefficient ranges from 0 to 1 and measures the degree of income inequality. A value of 0 indicates that each household obtains the same amount of income, while a value of 1 indicates that only one household earns all income
Mortality and Gini coefficient Age adjusted death rates by Gini coefficient for the 50 US states and the District of Columbia (DC), 1989-90 (y=1.831+15.705×x)
Tilpasning av linje til tre punkter Velger linjen som minimerer summen av kvadrat-avstandene
Formel for linje: y = a + b x a - skjæringspunkt med y-aksen b - helningskoeffisient a b
Correlation: How close are the points to a straight line? Correlation is always between -1 and +1. Correlation 0 means no association Correlation: 0
Eksempler på korrelasjoner
Data Målinger av PEF (Peak Expiratory Flow Rate) for 95 studenter. Tre målinger sittende og tre målinger stående. I eksemplene brukes gjennomsnittlig PEF (PEFMEAN) Registrering av kjønn,høyde og vekt
Spredningsdiagram (“scatter plot”) for PEF mot høyde Korrelasjon: 0.67
Spredningsdiagram for PEF mot høyde. Regresjonslinje