Presentasjon lastes. Vennligst vent

Presentasjon lastes. Vennligst vent

I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.

Liknende presentasjoner


Presentasjon om: "I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen."— Utskrift av presentasjonen:

1 I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen

2 Inferens for forventningen til en populasjon (7.1)
Kapittel 6: En antagelse om kjent standardavvik s i populasjonen Nå: Mer realistisk: Ukjent standardavvik s i populasjonen START KAPITTEL 7

3 Inferens om forventinger
En/to populasjoner Ukjent standardavvik t-fordeling Konfidensintervall Signifikanstester

4 En populasjon Anta x1,...,xn uavhengige fra N(μ,σ) Estimator for μ: x̄
σ kjent: Testobservator z=(x̄-μ)/(σ/√n) σ ukjent: Testobservator t=(x̄-μ)/(s/√n) σ/√n standardavvik for estimator x̄ s/√n estimert standardavvik for estimator x̄ SE = s/√n kalles standardfeil (standard error) for x̄

5 t-fordeling z=(x̄-μ)/(σ/√n) er N(0,1)-fordelt
t=(x̄-μ)/(s/√n) er t-fordelt med n-1 frihetsgrader Form som normalfordeling (symmetrisk om 0) Større spredning/usikkerhet pga ukjent σ Nærmer seg N(0,1) når n vokser

6

7 1 flervalgsspørsmål

8 Ett-utvalgs konfidensintervall
σ kjent: [x̄-z*σ/√n, x̄+z*σ/√n] z* er verdien slik at arealet mellom -z* og z* i N(0,1) fordelingen er lik C σ ukjent: [x̄-t*s/√n, x̄+t*s/√n] t* er verdien slik at arealet mellom -t* og t* i t(n-1) fordelingen er lik C t*s/√n er feilmarginen Eksakt hvis normalfordelte data Tilnærmet riktig for stor n ellers

9 Eksempel C-vitaminer i mais
Mengde C-vitaminer i mais (mg/100g) målt som 95% konfidensintervall for μ x̄ = 22.50, s = 7.19, n = 8 SEx̄ = s/√n = 7.19/√8 = 2.54 Med n = 8 og n-1 = 7 frihetsgrader blir t* = og intervallet [x̄ - t*s/√n, x̄ + t*s/√n] = [ ∙ 2.54, ∙ 2.54] = [16.5 , 28.5] Hvis vi ignorerte usikkerheten i s og brukte z* = 1.96 fås intervallet [x̄-z*σ/√n, x̄+z*σ/√n] = [17.5 , 27.5], som er betraktelig og urealistisk kortere

10

11 2 flervalgsspørsmål

12 Ett-utvalgs t-test σ kjent: Hypotesetester for μ basert på testobservator z = (x̄-μ0)/(σ/√n) σ ukjent: Hypotesetester for μ basert på testobservator t = (x̄-μ0)/(s/√n)

13

14 Eksempel C-vitaminer i mais
Ønsker å teste H0: μ = μ0 = 30 mot Ha: μ = μ0 ≠ 30 x̄= 22.50, n = 8, s = 7.19, SEx ̄= s/√n = 7.19/√8 = 2.54 Testobservator t = (x̄-μ0)/(s/√n) = ( )/2.54 = -2.95 P-verdi (tosidig) = (fra R, <P-verdi<0.040 fra Tabell D) Hvis vi ignorerer usikkerheten i s og beregner p-verdien basert på normalfordelingen ville vi fått p-verdi = 0.003, altså alt for lavt!

15

16 Ensidig eller tosidig test
Må bestemmes ut fra problemstilling Feil å først se på data, så bestemme seg for ensidig test Hvis i tvil, bruk tosidig

17 t-test i R Nytt eksempel fra ulvene: Tungt jaktet ulv, får de økt kortisol-nivå i forhold til normal verdi 16.0 pg/mg? Tester H0: μ = 16 mot Ha: μ > 16 basert på data fra 103 tilfeldig valgte tungt jaktede ulver > t.test(wolf.tungt$cpmg, mu=16, alternative="greater”) One Sample t-test data: wolf.tungt$cpmg t = 1.968, df = 102, p-value = alternative hypothesis: true mean is greater than percent confidence interval: Inf sample estimates: mean of x

18 Matchede par Sammenlignende eksperimenter ofte å foretrekke fremfor ett-utvalgs studier Beskyttende mot sammenblandede variable f.eks sammenligne ny medisin med placebo Matchede par studier Individer matchet i par Ønsker par som er mest mulig like To målinger fra samme individ Tvillinger Venstre og høyre fot

19 Sammenligning av to målemetoder m. MeasureMind 3D Multisensor
MM3DM er en programvare for måling av kompliserte maskindeler. En bruker av systemet oppdager at ved å slå av en opsjon i prosedyren, reduseres måletiden med 10%. Spørsmålet er om endringen påvirker måle-resultatene. Velger 51 ulike maskindeler. Måler dem med og uten opsjonen. Kaster mynt om hvilken metode som brukes først. Ser på differenser mellom målingene for hver del Differansene er ett enkelt utvalg Kan bruke metoder for ett-utvalgs data

20 Målinger for de 20 første maskindelene. Målingene er i micrometer
TABLE 7.2 Parts Measurements Using Optical Software Part OptionOn OptionOff Diff 1 118.63 119.01 0.38 11 119.03 118.66 −0.37 2 117.34 118.51 1.17 12 118.74 118.88 0.14 3 119.30 119.50 0.20 13 117.96 118.23 0.27 4 119.46 118.65 −0.81 14 118.40 118.96 0.56 5 118.12 118.06 −0.06 15 118.28 0.22 6 117.78 118.04 0.26 16 118.69 117.46 −1.23 7 119.29 119.25 −0.04 17 118.20 118.25 0.05 8 120.26 118.84 −1.42 18 119.54 0.72 9 118.42 −0.64 19 1.98 10 119.49 119.66 0.17 20 119.13 119.15 0.02

21 Histogram for differansen i 51 matchede par

22 Sammenligning av målinger forts.
Xi = differansen for maskindel nr. i, antar at Xi er N(m,s) og uavhengige H0: μ = 0 mot Ha: μ ≠ (merk: μ = 0 betyr ingen forskjell) x̄ = , s = , n = 51 Testobs. t = x̄ / (s/√n) = ( )/(0.6943/√51) = 0.52 P-verdi (tosidig, df=50) = fra R, Tabell D: >0.25 Forskjellen i målinger var ikke statistisk signifikant! OK å slå av opsjonen!

23 Robusthet av t-test Robust: Insensitiv til avvik fra antagelser
t-test: Basert på antagelse om normalfordelt populasjon Ikke robust mot uteliggere Robust mot ikke for store avvik fra normalfordeling Mer robust jo større n n < 15: Kun hvis data er nær normale n ≥ 15: Kan brukes hvis ingen uteliggere eller sterk skjevhet n ≥ 40: Kan brukes selv med sterk skjevhet

24 1 flervalgsspørsmål


Laste ned ppt "I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen."

Liknende presentasjoner


Annonser fra Google