Kritisk gjennomgang av vitenskapelige studier.

Slides:



Advertisements
Liknende presentasjoner
Kvalitative studier Trond Hatling Sintef Unimed Helsetjenesteforskning
Advertisements

Kan oppdrettsnæringen føre til endringer av virulens hos parasitter?
Førsteamanuensis/Psykologspesialist Leif Edward Ottesen Kennair
Unimed 1 Noe om status for forskning om akuttpsykiatriske tilbud Forskningssjef Torleif Ruud SINTEF Unimed Helsetjenesteforskning Avdeling for psykisk.
Enhalet og tohalet hypotesetest
Vurdering av statistiske analysemetoder brukt i Læringslabens undersøkelser i videregående skole i Rogaland.
ART: Dokumentasjon av behandlingseffekt
STATISTISK GENERALISERING
Statistisk metode & dokumentasjon av legemidlers effekt
Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.
Forelesning SOS1005: Terje Andreas Eikemo
Kap 05 Betinget sannsynlighet
Personlighetsbegrepet i veiledning
BI 3010H05 Populasjonsgenetikk Halliburton Kap 1-3
Prognose av framtidig etterspørsel
IA konferanse et friskere arbeidsliv
Planlegging av klinisk forskning. Randomiserte studier, -fallgruber.
Kontrollregler Z- tabell Kontrollregler Tillatt totalfeil
Design, evalueringsstudie 06/07
Randomisering av deltakere i eksperiment
Statistikk på 20 2 timer PSY-1002
Å arbeide kunnskapsbasert i Alderspsykiatrien
Hva slags kunnskap trenger vi
KUNNSKAPSBASERT PRAKSIS
PROSJEKT: UADRESSERT REKLAME Omnibus: 23. august – 30 august 2006
Fire problemer Operasjonaliseringsproblemet (måling/begrepsvaliditet)
Diskrete stokastiske variable
Eksperimentell metode - I
1 Virker medisinen? Kliniske prøvninger. Thore Egeland, Rikshospitalet og UiO.
Brukerundersøkelse gjennomført for Bergen kommune Foresattes tilfredshet med kommunens barnehager © TNS Gallup – Politikk & samfunn Avdelingsleder.
Studentprosjekt Videreutdanningen Frode Svartdal UiT/Diakonhjemmet Høgskole H-2014.
Meta-analyse Frode Svartdal UiTø Okt © Frode Svartdal.
Statistikk som “bevis” Kliniske prøvninger HSTAT1101: 3. november 2004 Odd Aalen.
Genital chlamydiainfeksjon Nye strategier for bekjemping av sykdommen Hilde Kløvstad Nasjonalt folkehelseinstitutt
1 Legen som kvalitativ forsker – en studie om arvelig høyt kolesterol Jan C. Frich Institutt for allmenn- og samfunnsmedisin Universitetet i Oslo / Nevrologisk.
Hypotesetesting, og kontinuerlige stokastiske variable
Repeterte målinger - analyse av oppsummeringsmål
Siste forelesning er i morgen!
Randomiserte kontrollerte studier
Historiske forløpere Frenologien Frenologien ”Animalsk magnetisme” (Mesmer) ”Animalsk magnetisme” (Mesmer) Tidlige pedagogisk-psykologiske kontorer (for.
Statistikk i forskningen. Del II
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Sannsynlighet og kombinatorikk
A2A / A2B M1 årskurs 4. november 2009
M1 årskurs HVE 7. september 2009
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
NIFU STEP studier av innovasjon, forskning og utdanning Har Kvalitetsreformen bidratt til redusert frafall og økt studieinnsats? Elisabeth.
1 Trombolytisk behandling av akutt iskemisk hjerneslag Eivind Berge Ullevål Universitetssykehus 1. november 2001.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Utvalg og datainnsamling For å gjennomføre en test av hypoteser i kvantitativ metode trenger vi et utvalg deltakere for å gjennomføre datainnsamling –
Kognitive testprofiler. 1 Kløveråsen: Poliklinikk: Hukommelse, demens, alderspsykiatri. Utredningsavdeling: Utredningsopphold. Kognitiv utredning for pasienter.
Hva viser vår forskning med studenter
Laboratoriebruk ved diabetes. Kan vi stole på resultatene
Ingun Ulstein Stipendiat Nasjonalt kompetansesenter for aldersdemens
Konfidensintervall og p-verdi
MAT0100V Sannsynlighetsregning og kombinatorikk
Om å vurdere effekten av medikamentell behandling
Forskningsdesign: eksperiment
Selvbilde Start med å forklare begrepet selvbilde. Les gjerne opp fra teksten i kursmateriellet om hva den amerikanske psykologen Wigfield fant ut i studie.
Refleksjoner rundt bruk av alternative behandlingsmetoder
Hypotesetesting: Prinsipper
SIV : Kategoriske variabler og normaltilnærmelsen
MET 2211 Statistikk og dataanalyse
Sett inn riktig form av adjektivene, med eller uten artikkel
Խելացի ժամանց Կառուցողական խաղեր Ուղեղի ունակությունների բացահայտում Զարգացում.
SIV : Kapittel 4 Statistisk metode 18/02/2019 Fred Wenstøp.
Oppsummering fra forrige gang
Kapittel 3 Produsere data
I dag Konfidensintervall og hypotesetesting – ukjent standardavvik (kap. 7.1) t-fordelingen.
Utskrift av presentasjonen:

Kritisk gjennomgang av vitenskapelige studier. Thore Egeland Biostatistikk, Rikshospitalet

Innhold Typiske innvendinger og mangler som kan reises mot artikler og studier Noen sentrale statistiske begreper

1. “...just regression to the mean..” Bra Dårlig Tid Oppsøker lege

Parallellstudie eller overkrysning? • parallellstudier: To grupper følges parallelt, en får behandling A, den andre B. • overkrysningsstudier (“cross-over”): Alle deltagere får begge behandlinger i randomisert rekkefølge. Eksempel. Parvis sammenligning:

‘The Cartoon Guide to Statistics’, Gonick og Smith

Randomisering Variasjon som kunne gitt systematiske skjevheter gjøres om til tilfeldig variasjon. - Parallellstudier: Variasjon mellom individer. - Overkrysningsstudier: Variasjon innen individer. Variasjonens effekt kan dermed beregnes. Omfatter tilfeldige utvalg.

2. “...not sufficient power...” Betyr: For få pasienter eller overdreven tiltro til behandlingseffekt.

Tre begreper p-verdi sannsynlighet for å konkludere galt, vanligvis kreves under 5% for signifikans. effekt “andel anfallsfrie fordoblet med nytt medikament” power sannsynlighet for å avsløre en effekt

Overkrysningsstudier. En gang til Brukes ved sykdom som varer over tid og er relativt stabil. Krever et mindre antall pasienter. Sårbar mot -overføringseffekt (“carry-over”), -periodeeffekter, -frafall. Insulin B Insulin A

P-verdier. Generelt først og så i overkrysningsstudien Medisinsk forskning fokuserer sterkt på p-verdier: p<0.05 Tolkes som en interessant forskjell mellom to behandlinger. p>0.05 Ingen signifikant forskjell; vi har ikke dermed vist at behandlingene er like. P-verdien er sannsynligheten for å observere et så rart resultat som studien viste (eller enda rarere) pga tilfeldighet.

Regneeksempel Klinisk utprøving av nytt medikament mot gammelt. Åtte pasienter prøver begge medikamenter i randomisert rekkefølge. Nullhypotese: Ho “Behandlingene like gode” Alternativ: H1 “Nytt medikament bedre”

Beregning av p-verdi P-verdi= sannsynligheten for å påstå H1 (“bedre”) når sannheten er Ho (“likhet”). Hvis alle får best resultat med nytt medikament blir p-verdien = 0.5*0.5* 0.5*0.5* 0.5*0.5* 0.5*0.5=0.004. Påstår at nytt medikament er bedre ettersom 0.004<0.05.

Effektmål og hypoteser Det må være ett hovedeffektmål: - Nødvendig for å planlegge studiens størrelse. - Forutsetning for at p-verdier etc. skal være direkte tolkbare. Det kan være sekundære effektmål, men begrenset antall. Evt. justering av p-verdier.

Eksempel på flere effektmål Reflux øsofagitt (aktiv vs placebo) Endepunkt Total bedring p=0.04 Endring i grad ns Ant. sure oppstøt: subjektivt n.s pH måling 24h n.s Ant. oppvåkninger p=0.03 Antacida forbruk n.s. Global smerte n.s. Ingen pre-spesifisert prioritering av endepunkter. Konklusjon?

Effektmål. Relative, absolutte og NNT(Number Neaded to Treat) Andel Relativ Risiko Abs diff NNT p-verdi 20% 10% 2 10% 10 2% 1% 2 1% 100 0.2% 0.1% 2 0.1% 1000 NNT=100*1/abs diff

Hvor stor skal studien være? Generelt: Effekt av tilfeldig variasjon neddempes når studiens størrelse øker. Studien må være så stor at det blir statistisk signifikante utslag når det er en klinisk viktig forskjell mellom behandlingene. Beregning av størrelse essensiell del av protokoll. En stor studie er også interessant om resultatet er ikke-signifikant.

Hannah et al. s 1378: “The required sample size was calculated to be 2800. This sample size had 80% power to find a reduction in risk of perinatal or neonatal mortality or serious neonatal morbidity from 0,8% with planned vaginal birth to 0,1% with planned caesarean section (one-sided type I error of 0,05)”. Beregninger i programmet nQuery:

“...not sufficient power...” Tilfelle 1 Signifikante resultater: - Urimelig innvending? - Publikasjonsskjevhet mulig problem:

Publikasjonsskjevhet Størst sjanse for å få publisert signifikante resultater. Behandlingsverdi overdrives. Kan motvirkes ved registrering av igangsatte studier (Cochrane).

“...not sufficient power...”. Tilfelle 2 Ikke-signifikante resultater: - Reformulere: “...no difference” til “no significant difference” “need to be confirmed in later studies” - Gjøre mer: “pool studies”:

Eksempel “Data from treatment centers should be pooled to achieve statistical power sufficient to test the efficacy of treatment...” Fra: SURGERY FOR EPILEPSY From: NIH Consensus Development Conference on Surgery for Epilepsy. 1990. http://neurosurgery.mgh.harvard.edu/epil-nih.htm

3. “...problems with confounding” Utdanning Fødselsvekt Røyking Røyking confounder; ‘tredjevariabel’, passasjereffekt.

Bivirkning Pille Confounder

Confounding. Mulige løsninger... Nytt design? Mer avansert statistisk analyse mulig hvis confoundervariabelen er kjent på individnivå.

4. “...should have been analysed by intention to treat..”

Intention to treat “A strategy for analyzing data in which all participants are included in the group to which they were assigned, whether or not they completed the intervention given to the group. Intention-to-treat analysis prevents bias caused by the loss of participants, which may disrupt the baseline equivalence established by random assignment and which may reflect non-adherence to the protocol”.

5. “...simply a chance finding...no bonferroni correction” Betyr: Hver ny test øker faren for feilaktig funn (“chance finding”): Med 20 tester på 5% signifikansnivå kan vi forvente et signifikant funn dersom ingen reelle effekter fins.

Bonferroni Svar: 1) Færre tester 2) Redusere signifikansnivået, 1% i stedet for 5%. 3) Bonferroni: Gange p-verdien med antall tester

Gjentatt signifikanstesting. Interimsanalyser Max antall tester på 5% signifikansnivå Totalt sign. nivå 1 5% 2 8% 5 14% 10 19% 50 32%

6. “...should have used non-parametric methods..” Problem: Antall anfall, tid til anfall, andel anfallsfrie... er typisk ikke normalfordelte størrelser Svar: “non-parametric methods” eller andre statistiske grep ...

“...no protocol..”

Protokoll Innledning Hensikt Forsøksplan Pasienter (inklusjo./eksklu.) Beskrivelse av behandling Oppfølging av pasienter Trekke seg Effektmål Randomisering/blinding Antall pasienter Statistisk analyse Godkjenning SLK, etisk kom., samtykke Reg./rapp. av bivirkninger Datahåndtering (QC) Publisering Adminstrativt

Oppsummering: Syv innvendinger “...just regression to the mean..” “...not sufficient power...” “...problems with confounding...” “... intention to treat...” “... no bonferroni correction...” “... use non-parametric methods...” “...no protocol...”