Planlegging av klinisk forskning. Randomiserte studier, -fallgruber.

Slides:



Advertisements
Liknende presentasjoner
Kombinatorikk for lærerstudenter
Advertisements

Kvalitative studier Trond Hatling Sintef Unimed Helsetjenesteforskning
Psykiske helsetjenester, etikk og tvang – foreløpige erfaringer fra en intervensjonsstudie med refleksjonsgrupper Reidar Pedersen Marit Helene Hem Bert.
Unimed 1 Noe om status for forskning om akuttpsykiatriske tilbud Forskningssjef Torleif Ruud SINTEF Unimed Helsetjenesteforskning Avdeling for psykisk.
Enhalet og tohalet hypotesetest
Vurdering av statistiske analysemetoder brukt i Læringslabens undersøkelser i videregående skole i Rogaland.
ART: Dokumentasjon av behandlingseffekt
Grunnleggende spørsmål om naturfag
STATISTISK GENERALISERING
Statistisk metode & dokumentasjon av legemidlers effekt
Meta-analyse Frode Svartdal UiTø April 2014 © Frode Svartdal.
Kap 05 Betinget sannsynlighet
EFFEKTER AV INTRAOPERATIV S (+) KETAMIN INFUSJON I TILLEGG TIL MULTIMODAL ANALGESI VED HEMORROIDEKTOMI Ulrich Spreng Stipendiat Sykehuset Asker og Bærum,
Placeboeffekter i smerte
Kritisk gjennomgang av vitenskapelige studier.
Analyse og tolkning av datamaterialet
Reidun Olstad NNPF Innføringskurs i klinisk forskning
Fasit 1) a)P(T>1)=P(T≠1)=1-P(T=1) = 1-1/6 = 5/6 ≈ 83.3%. Evt. P(T>1)=p(T=2)+P(T=3)+P(T=4)+P(T=5)+ P(T=6)=5/6. P(T=2 | T≠1) = P(T=2 og T≠1)/P(T≠1) = (1/6)/(5/6)
Kontrollregler Z- tabell Kontrollregler Tillatt totalfeil
Randomisering av deltakere i eksperiment

Nasjonale prøver.
Av Toril Sørheim Nilsen (UNN, UiTø)
Bærekraftig utvikling - forskerspiren
Folkehelseinstituttet Hege Bøen november 2008 Hvem er brukere av eldresentrene ? En sammenligning av hjemmeboende over 65 år som er brukere av eldresentrene.
Diskrete stokastiske variable
vidundermedikamentene??
Eksperimentell metode - I
1 Virker medisinen? Kliniske prøvninger. Thore Egeland, Rikshospitalet og UiO.
Eksperimentelle design Ikke-eksperimentelle design
Hva er utsiktene for og utfordringene ved en vaksine mot SARS? Hanne Nøkleby, Avdeling for vaksinasjon og immunitet, Folkehelseinstituttet ( )
Statistikk som “bevis” Kliniske prøvninger HSTAT1101: 3. november 2004 Odd Aalen.
1 Legen som kvalitativ forsker – en studie om arvelig høyt kolesterol Jan C. Frich Institutt for allmenn- og samfunnsmedisin Universitetet i Oslo / Nevrologisk.
1. samling, MEVIT4000 Om emnet og arbeidsprosessene.
Forskning – 3 grupper (OECD 1981) Grunnforskning Originale undersøkelser som har til hensikt å skape ny kunnskap og forståelse Karakteriseres ved at den.
Hovedoppgaveforberedende seminar
Repeterte målinger - analyse av oppsummeringsmål
Siste forelesning er i morgen!
Randomiserte kontrollerte studier
Pensum Bordens: Research design and methods A process approach 5. eller 6. utgave Kap Fordeling: Bjørnebekk har spesielt ansvar for delen ”Qualitative.
Historiske forløpere Frenologien Frenologien ”Animalsk magnetisme” (Mesmer) ”Animalsk magnetisme” (Mesmer) Tidlige pedagogisk-psykologiske kontorer (for.
Statistikk i forskningen. Del II
Forelesning 5 HSTAT1101 Ola Haug Norsk Regnesentral
Kræsjkurs Del Ii Hypotesetesting
Statistikk 2 M1 årskurs HVE 31. august 2009.
Sannsynlighet og kombinatorikk
M1 årskurs HVE 7. september 2009
Stian Grønning Master i samfunnsøkonomi Daglig leder i Recogni.
Å redusere unyttig helseforskning i Norge ved å bruke systematiske oversikter – kommentar sett fra erfaring med forskningsetiske vurdering i REKVEST Berit.
1 Trombolytisk behandling av akutt iskemisk hjerneslag Eivind Berge Ullevål Universitetssykehus 1. november 2001.
Statistikk Forkurs Hva er statistikk? undersøke registrere lage oversikt→ Presentasjon av informasjon formidle Arbeidet med statistikk kan vi dele.
Latent hypothyreose –Med vektlegging på eldre pasienter Up To Date 2001 Merck Manual of Geriatrics 1995 Kurs i endokrinologi Haukeland sykehus 2001.
Hva viser vår forskning med studenter
Laboratoriebruk ved diabetes. Kan vi stole på resultatene
Ingun Ulstein Stipendiat Nasjonalt kompetansesenter for aldersdemens
Konfidensintervall og p-verdi
MAT0100V Sannsynlighetsregning og kombinatorikk
Om å vurdere effekten av medikamentell behandling
Forskningsdesign: eksperiment
Punkter til diskusjon hovedfunn? randomisering (hensikt) intern vs ekstern validitet effektstørrelse RR vs OR (rare disease assumption) større variasjon.
Refleksjoner rundt bruk av alternative behandlingsmetoder
MET 2211 Statistikk og dataanalyse
Repetisjon, del I Metode
SIV : Ett gjennomsnitt Kapittel /12/2018 Fred Wenstøp.
SIV : Kategoriske variabler og normaltilnærmelsen
MET 2211 Statistikk og dataanalyse
Prosjektoppgavens helhetsbilde
Høstrapport – tall og statistikk
Oppsummering fra forrige gang
Regionale retningslinjer for (medisinsk og helsefaglig) forskning
Utskrift av presentasjonen:

Planlegging av klinisk forskning. Randomiserte studier, -fallgruber. Overlevelsesanalyser. Thore Egeland, Rikshospitalet og UiO 9/10/01

Innhold. Stikkord. Protokoll. Randomisert Klinisk Prøvning. P-verdier. Konfidensintervaller. Hvor stor studie? Fallgruber. Problemer. Overlevelsesanalyse.

Protokoll Innledning Hensikt Forsøksplan Pasienter (inklusjo./eksklu.) Beskrivelse av behandling Oppfølging av pasienter Trekke seg Effektmål Randomisering/blinding Antall pasienter Statistisk analyse Godkjenning SLK, etisk kom., samtykke Reg./rapp. av bivirkninger Datahåndtering (QC) Publisering Adminstrativt

Randomisert klinisk prøvning Regnes som gullstandarden. Sentralt element: randomisering. Kan danne grunnlaget for en logisk uangripelig slutning om behandlingseffekt. Forutsetter “equipose” (vet ikke om ny behandling er bedre). Ikke uproblematisk.

Parallellstudie eller overkrysning? Parallellstudier: To grupper følges parallelt, en får behandling A, den andre får behandling B. Overkrysningsstudier (“cross-over”): Alle deltagere får begge behandlinger.

Parallellstudier Brukes hyppigst. Krever flere pasienter. Det enkleste og dermed minst sårbare opplegget. Behandling A Pas. randomiseres Behandling B

Overkrysningsstudier Brukes ved sykdom som varer over tid og er relativt stabil. Krever et mindre antall pasienter. Sårbar mot -overføringseffekt (“carry-over”), -periodeeffekter, -frafall. Insulin B Insulin A

P-verdier. Generelt først og så i overkrysningsstudien Medisinsk forskning fokuserer sterkt på p-verdier: p<0.05 Tolkes som en interessant forskjell mellom to behandlinger. p>0.05 Ingen signifikant forskjell; vi har ikke dermed vist at behandlingene er like. P-verdien er sannsynligheten for å observere et så rart resultat som studien viste (eller enda rarere) pga tilfeldighet.

Regneeksempel Klinisk utprøving av nytt medikament mot gammelt. Åtte pasienter prøver begge medikamenter i randomisert rekkefølge. Nullhypotese: Ho “Behandlingene like gode” Alternativ: H1 “Nytt medikament bedre”

Beregning av p-verdi P-verdi= sannsynligheten for å påstå H1 (“bedre”) når sannheten er Ho (“likhet”). Hvis alle får best resultat med nytt medikament blir p-verdien = 0.5*0.5* 0.5*0.5* 0.5*0.5* 0.5*0.5=0.004. Påstår at nytt medikament er bedre ettersom 0.004<0.05.

Signifikanstest P(B)= “sannsynligheten for å forkaste Ho selv om den er sann” Ønskes lav, under 0.05 (5%). P(D)= “Teststyrke” (power). Ønskes høy, si 0.8 (dvs 80%).

Mer om randomisering Variasjon som kunne gitt systematiske skjevheter gjøres om til tilfeldig variasjon. - Parallellstudier: Variasjon mellom individer. - Overkrysningsstudier: Variasjon innen individer. Variasjonens effekt kan dermed beregnes. Omfatter tilfeldige utvalg.

Blinding Randomiseringen sikrer et “rettferdig” utgangspunkt. Blinding skal sikre at dette ikke ødelegges under studiens gang. Helst dobbeltblinding. Blinding er et generelt eksperimentelt prinsipp (f.eks. vurdering av røntgenbilder)

Effektmål og hypoteser Det må være ett hovedeffektmål: - Nødvendig for å planlegge studiens størrelse. - Forutsetning for at p-verdier etc. skal være direkte tolkbare. Det kan være sekundære effektmål, men begrenset antall. Evt. justering av p-verdier.

Eksempel på flere effektmål Reflux øsofagitt (aktiv vs placebo) Endepunkt Total bedring p=0.04 Endring i grad ns Ant. sure oppstøt: subjektivt n.s pH måling 24h n.s Ant. oppvåkninger p=0.03 Antacida forbruk n.s. Global smerte n.s. Ingen pre-spesifisert prioritering av endepunkter. Konklusjon?

Keisersnitt ved seteleie? Er keisersnitt bedre enn vaginal forløsning for utvalgte fostre i seteleie ved termin? Hannah et al., The Lancet Se Summary og Trial profile, s 1377 Parallelstudie. Randomisering, men ikke blinding!

Intention to treat “A strategy for analyzing data in which all participants are included in the group to which they were assigned, whether or not they completed the intervention given to the group. Intention-to-treat analysis prevents bias caused by the loss of participants, which may disrupt the baseline equivalence established by random assignment and which may reflect non- adherence to the protocol.”

Hvor stor skal studien være? Generelt: Effekt av tilfeldig variasjon neddempes når studiens størrelse øker. Studien må være så stor at det blir statistisk signifikante utslag når det er en klinisk viktig forskjell mellom behandlingene. Beregning av størrelse essensiell del av protokoll. En stor studie er også interessant om resultatet er ikke-signifikant.

Hannah et al. s 1378: “The required sample size was calculated to be 2800. This sample size had 80% power to find a reduction in risk of perinatal or neonatal mortality or serious neonatal morbidity from 0,8% with planned vaginal birth to 0,1% with planned caesarean section (one-sided type I error of 0,05)”. Beregning: http://www.statsol.com/tools

Utvalgsstørrelse. Kommentar Jo mindre forskjellen en ønsker å avdekke er, dess større må utvalget være.

Relativ Risiko (primært) utfall: perinatal/neonatal mortalitet eller alvorlig neonatal morbiditet Sannsynl. for utfall ved keisersnitt = 17/1039 = 0.016 = 1.6% Sannsynl. for utfall ved vag forløsning = 52/1039 = 0.050 = 5.0% Relativ risiko, RR = 1.6/5.0 = 0.33. P-verdi<0.0001. Fortolkning: Risikoen for utfall 1/3 for keisersnitt (eller: 3 ganger høyere for fødsel)

Konfidensintervall Hvor sikkert er anslaget 0.33 for RR? 95% konfidensintervall 0.19 til 0.56. Fortolkning: Vi er 95% sikre på at den sanne verdien er mellom 0.19 og 0.56. 99% konfidensintervall 0.16 til 0.65. Fortolkning?

Behandling etter hjerteinfarkt Lancet 6. juli 1996 Bruk av d-solatol vs placebo etter hjerteinfarkt. (D-solatol skulle forhindre arytmier som kan lede til plutselig død.) Planla å innrullere 6400 pasienter med nylig hjerteinfarkt. Randomisert i to grupper (parallelstudie). Dobbeltblindt

Resultater Studien ble stoppet etter at 3121 pasienter var inkludert. Da var: - 74 døde i behandlingsgruppen, - 48 døde i placebogruppen. Relativ risiko 1.65. Signifikant med p-verdi 0.005. Konklusjon: Det nye medikamentet øker risikoen for at pasienter dør. Dette er en konklusjon om kausalitet som bare er mulig pga randomisering.

Lærdommer Effekten kan gå i uventet retning. Effekten kunne neppe ha vært oppdaget uten i en randomisert klinisk prøving Det er viktig å kunne avslutte studien underveis (interimanalyser).

Alternativer og problemer Retrospektive studier. Historiske kontroller Problem: Endring over tid? Tendens til overoptisme. Årsakssammenheng? Surrogat-endepunkter ofte utilstrekkelige: - blodtrykk ist.f. redusert sykdom/død - CD4 ist.f. AIDS. Analyse av pasientdata ved sykehus. Bayesianske metoder innarbeider subjektive oppfatninger.

Regresjonsfenomenet Bra Dårlig Tid Oppsøker lege

Frafall - Dårlig “compliance” Frafall er problematisk hvis det har relasjon til behandlingen. Lite motiverte pasienter bør utgå før randomisering. Frafall etterpå kan lett føre til skjevhet fordi de som faller fra kan ha utypisk effekt (god eller dårlig) eller de kan ha mer bivirkninger.

Gjentatt signifikanstesting. Interimsanalyser Max antall tester på 5% signifikansnivå Totalt sign. nivå 1 5% 2 8% 5 14% 10 19% 50 32%

Publikasjonsskjevhet Publisering av resultater fra kliniske forsøk er selektiv: - Størst sjanse for å få publisert signifikante resultater. Behandlingsverdi overdrives. Kan motvirkes ved registrering av igangsatte studier (Cochrane).

Litteratur. Pocock, “Clinical trials”, Wiley 1983. Altman, “Practical statistics for medical research”, Chapman & Hall, 1993. “If you torture data long enough, they will tell you whatever you want to hear.” Mills (1993) NEJM 329, 1196-9