Konfidensintervall og p-verdi

Slides:



Advertisements
Liknende presentasjoner
Hva trenger jeg av data, og hvordan skal jeg innhente disse?
Advertisements

Kap 10 Estimering.
Enhalet og tohalet hypotesetest
Vurdering av statistiske analysemetoder brukt i Læringslabens undersøkelser i videregående skole i Rogaland.
ART: Dokumentasjon av behandlingseffekt
Grunnleggende spørsmål om naturfag
STATISTISK GENERALISERING
Statistisk metode & dokumentasjon av legemidlers effekt
Ronny Klæboe Transportøkonomisk institutt
Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.
Levende HMS-system – hva betyr det i praksis?
Statistikk og hydrologi
Kritisk gjennomgang av vitenskapelige studier.
Kvantitativ forskning
BI 3010H05 Populasjonsgenetikk Halliburton Kap 1-3
Oppgave gjennomgang Kap. 3 og 4.
Kvalitetssikring av analyser til forskningsbruk
Velg Slide-Show fra PowerPoint-menyen og klikk med venstre museknapp!
Analyse og tolkning av datamaterialet
Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)
Oppgaver 1)Vi anser hvert av de seks utfallene på en terning for å være like sannsynlig og at to ulike terningkast er uavhengige. a)Hva er sannsynligheten.
Planlegging av klinisk forskning. Randomiserte studier, -fallgruber.
Statistikk på 20 2 timer PSY-1002
Bærekraftig utvikling - forskerspiren
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Effect of computerised evidence based guidelines on management of asthma and angina in adults in primary care: cluster randomised controlled trial Martin.
Diskrete stokastiske variable
1 Virker medisinen? Kliniske prøvninger. Thore Egeland, Rikshospitalet og UiO.
Hovedideen Anta at en hypotese er riktig (H 0 ) Det er bare to muligheter, enten er H 0 riktig, ellers er den ”omvendte” hypotesen (H 1 ) riktig Gå ut.
Forelesning 7 HSTAT1101 Ola Haug Norsk Regnesentral
Hypotesetesting, og kontinuerlige stokastiske variable
Innføring til forskningsmetode - fra spørsmål til design
Siste forelesning er i morgen!
Randomiserte kontrollerte studier
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Forelesning 6 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Lesing og vurdering av forskningslitteratur og forskningsbasert kunnskap Klinisk beslutningslære – IIA/IIB Kristine Pape, Institutt for samfunnsmedisin.
1 Unge voksne på trygd – hva betyr lese- og skrivevansker? Stipendiat Kristine Pape, Institutt for samfunnsmedisin, NTNU Prosjekt: Individual, cultural.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
MÅLINGER ER BRA - GOD STYRING VIKTIGST Jan Ubøe, professor i matematikk ved NHH.
Hva viser vår forskning med studenter
Retningslinjer for klinisk praksis
Laboratoriebruk ved diabetes. Kan vi stole på resultatene
MAT0100V Sannsynlighetsregning og kombinatorikk
Meta-analyser og systematiske oversikter
Metodevurdering for registrering av rømt oppdrettslaks – tellinger, andeler og årsprosent Anders Løland Assisterende forskningssjef Miljøseminar 2017,
Forskningsdesign: eksperiment
Punkter til diskusjon hovedfunn? randomisering (hensikt) intern vs ekstern validitet effektstørrelse RR vs OR (rare disease assumption) større variasjon.
Post-operativ strålebehandling av cancer prostata ved OUS
Bruk av postoperativ strålebehandling etter prostatektomi i Norge
Statistikk 2 Sentral- og spredningsmål
Hypotesetesting: Prinsipper
Måling, målefeil Forskningsmetoder Frode Svartdal UiTø H-2006
Kapittel 8: Ikke-parametriske tester
MET 2211 Statistikk og dataanalyse
Repetisjon, del I Metode
Kapittel 7: Hypoteseprøving
SIV : Repetisjon Kapittel /12/2018 Fred Wenstøp.
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
SIV : Kategoriske variabler og normaltilnærmelsen
MET 2211 Statistikk og dataanalyse
MET 2211 Statistikk og dataanalyse
Håvard Hansen Doktorgradsstipendiat Institutt for markedsføring
MET 2211 Statistikk og dataanalyse
To relaterte stikkprøver
SIV : Metodevalg Stokastiske variabler
SIV : Kapittel 4 Statistisk metode 18/02/2019 Fred Wenstøp.
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

Konfidensintervall og p-verdi Klinisk beslutningslære – IIA/IIB Kristine Pape, Institutt for samfunnsmedisin kristine.pape@ntnu.no

Hvorfor er det viktig? Som student I klinikken I forskning

Eksempel Du møter en mann på 60 år, som i forbindelse med en helsekontroll ønsket måling av PSA. PSA viste seg å være lett forhøyet (4), og han ble henvist til spesialistvurdering. Det ble tatt biopsi som viste lettgradig lokalisert Ca. prostata. Hva er den beste behandlingen for denne mannen?

8 33 5 13 4 16 10 år UK, 1999-2009 82429 menn 50-69 år PSA test Død metastaser 8 33 5 13 4 16 545 10 år 553 2664 lokalisert prostata-kreft 1643 randomisert 545

545/5393 8 33 553/5422 5 13 545/5339 4 16 Intervensjon Antall/personår Død metastaser Observasjon 545/5393 8 33 Kirurgi 553/5422 5 13 Stråling 545/5339 4 16 Kan vi trekke noen slutninger? Hva ønsker vi svar på før vi evt. kan benytte resultatene inn mot klinikken? (hvis vi forutsetter at studien er perfekt utført, uten bias. Selvfølgelig kan vi vanligvis heller ikke endre praksis ut ifra kun en studie) Er det forskjell på gruppene? Hva skyldes tilfeldigheter? Hvem/hva ønsker vi å si noe om?

Behov for statistiske verktøy for å vurdere tilfeldig variasjon Det vi vil si noe om «sannheten» «superpopulasjonen» Det vi kan si noe om Funn fra studien Studiepopulasjonen

To tilnærminger til tilfeldig variasjon Hypotesetesting Estimering Kvalitativ – JA/NEI Nullhypotese vs alternativ hypotese «Beslutningshjelp» P-verdi Sannsynligheten for å observere vårt punktestimat eller noe mer ekstremt, gitt at nullhypotesen er sann og modellen er riktig Kvantitativ (Hvor mye?) Hypotesespekter forenlig med data «Målehjelp» Konfidensintervall Ved repetisjoner av studien vil intervallet inneholde det sanne punktestimatet med en frekvens tilsvarende konfidensnivået, gitt at modellen er riktig

P-verdi (hypotesetesting) Mye brukt statistisk hjelpemiddel for å vurdere tilfeldig variasjon P for probabilility (sannsynlighet) Knyttet til hypotesetesting Forbundet med «statistisk signifikans» Omdiskutert pga misbruk, feilbruk og ukritisk bruk, særlig i forbindelse med signifikanstesting

Nullhypotese Alternativhypotese Ingen forskjell eller ingen effekt av en behandling eller eksponering. Alternativhypotese Nullhypotesen er ikke sann (det er en forskjell eller effekt av en behandling eller eksponering) P-verdien gir sannsynligheten for å oppnå de observerte funnene (eller funn som ligger lenger unna nullhypotesen) – gitt at nullhypotesen er korrekt Nullhypotesen relaterer seg til «superpopulasjonen» - bruker studiepopulasjonen til å teste

Hva betyr en p-verdi på 0.48? Hva betyr en p-verdi på 0.004?

Nullhypotese Alternativhypotese Det er ingen forskjell på dødelighet og sykdomsprogresjon avhengig av behandling (observasjon, kirurgi eller stråling) Alternativhypotese Det er forskjell på dødelighet og sykdomsprogresjon avhengig av behandling (observasjon, kirurgi eller stråling) P=0.48: Det er 48 % sannsynlighet for å oppnå de observerte tallene for 10 års dødelighet (eller mer ekstreme) gitt at nullhypotesen er sann P=0.004: Det er 0.4 % sannsynlighet for å oppnå de observerte tallene for utvikling av metastasesykdom på 10 år (eller mer ekstreme) gitt at nullhypotesen er sann Alle menn 50-59 med lokalisert prostatakreft påvist etter PSA-test (uten klinisk indikasjon)

Hva bestemmer p-verdien Presisjon Størrelsen på effektestimatet

Hva er p-verdien ikke ≠ sannsynligheten for at nullhypotesen er sann ≠ sannsynligheten for at funnene skyldes tilfeldigheter ≠ relatert til størrelsen på effekten eller til resultatets teoretiske, kliniske eller praktiske betydning ≠ graden av usikkerhet

Statistisk signifikans Basert på et definert nivå av en p-verdi som bestemmer om vi kan forkaste nullhypotesen Ofte satt til p < 0,05 Dersom p-verdi <0.05: Vi forkaster nullhypotesen, resultatene er statistisk signifikante Dersom p-verdi >0.05. Vi kan ikke forkaste null-hypotesen, resultatene er ikke statistisk signifikante Type I feil er den feilaktige forkastelse av en sann null-hypotese Type II feil er den feilaktige manglende forkastelsen av en usann null-hypotese.

Hvorfor 0,05? R.A Fisher 1920-tallet (Neyman + Pearson) …one in twenty trials… Knapp under en kopp, gjett riktig og vinn penger «Naturlig»/intuitivt? Sannhet: ingen knapp. Over halvparten av deltakerne var mistenksomme etter seks spilleomganger med gjentatt tap (p = 0,088) og nesten 90  % etter åtte omganger (p = 0,039).

Problemer med statistisk signifikans/signifikanstesting Ja eller nei (dikotomisering) mister viktig informasjon ofte heller ikke det svaret vi ønsker Bør ikke benytte p-verdier fra enkeltstudier for å gjøre kliniske beslutninger Hvis man har mange tester (f. eks i genetisk epidemiologi) Sier ingenting om klinisk signifikans Fått en for stor plass i medisinsk forskning?

Konfidensintervall (estimering) Statistisk hjelpemiddel for å vurdere tilfeldig variasjon Forkortes KI (norsk) eller CI (engelsk) Inneholder en øvre og en nedre grense – et intervall Benyttes oftest sammen med et punktestimat, og sier noe om «usikkerheten» av dette Ofte foretrukket framfor p-verdi

Konfidensintervall 95% konfidensintervall benyttes mest Tolkning: Hvis vi beregner gjentatte intervaller (fremtidige) fra superpopulasjonen vil 95 % av disse inneholde det sanne effektestimatet

Sammenhengen mellom p og konfidensintervall

Sammenhengen mellom p og konfidensintervall Nedre grense KI < 1 < Øvre grense KI p > 0.05 Øvre grense KI < 1 p < 0.05 Nedre grense KI > 1 Relative effektmål (RR, HR, IRR, OR) Nedre grense KI < 0 < Øvre grense KI p > 0.05 Øvre grense KI < 0 p < 0.05 Nedre grense KI > 0 Absolutte effektmål (gjennomsnitt, antall) H0

Hazard ratio er et relativt effektmål som benyttes når man ser på tid til hendelse – dvs har informasjon om personår i oppfølgingstid og benytter overlevelseanalyser (cox regresjon). svært vanlig i kohortstudier. samme tolkning som insidens rate ratio relativ risiko (ratio) RP= Surgery (Radical prostatectomy) AM= Active monitoring RT= Radiotherapy

Eksempler

Eksempler

Fordeler og ulemper P-verdi (hypotesetesting) Konfidensintervall (estimering) Enkelt med JA/NEI? Kan ikke skille effektstørrelsen fra presisjonen Dikotomisering -> utnytter ikke all informasjonen i data Kan gi opphav til feiltolkninger Skiller mellom effektstørrelse og presisjon Utnytter all informasjonen i data Skal mer til å feiltolke? To tall å forholde seg til i stedet for ett

Imres summary P value is often misinterpreted We shall avoid “statistical significance” as a simple dichotomy of study results Use of confidence intervals is preferable over p values

Kilder/Lese mer Regina Nuzzo. Scientific method: Statistical errors. Nature Volume:506, Pages:150–152 Date published:(13 February 2014) DOI:doi:10.1038/506150a Hamdy, F. C., et al. (2016). "10-Year Outcomes after Monitoring, Surgery, or Radiotherapy for Localized Prostate Cancer." New England Journal of Medicine 375(15): 1415-1424. Are Hugo Pripp: Hvorfor p-verdien er signifikant Tidsskr Nor Legeforen 2015; 135:1462-4 DOI: 10.4045/tidsskr.15.0493 Imre Janszky, Signe Opdal, og Eva Skovlunds presentasjoner Rothman: Bøker i epidemiologi (Modern Epidemiology)