Slektskapsanalyser av molekylærgenetiske data Andreas Radtke Smittevernoverlege St.Olavs hospital
Molekylærgenetiske metoder PFGE MLST MLVA AFLP SNP CRISPR … Helgenomsekvensering
Ernst Haeckel, 1866
Ned-opp eller opp-ned tre Kan være vanskelig å vite hvem som er grunnleggeren av en cluster Enklere å definere slektskap mellom par av stammer og definere opprinnelse derfra
Mikrobiologisk phylogeni Ingen tokogeni Mutasjon og genopptak som drivende Generasjonstid Egenskap A Egenskap B Stamme 1 x1 y0 Stamme 2 x0 y1
Typingens formål? Overvåkning av infeksjonssykdom Nasjonal og internasjonal Undersøkelse av et utbrudd Patogenese og forløp av en infeksjon Virulente og avirulente stammer Bakteriell populasjonsgenetikk Species eller subspeciesnivå Epidemiologisk konkordans Gir analysen et sant bilde av epidemiologien? Gjelder både metoden og analysen
Overveininger for en typing Tid og geografi Enklere å finne korrekt slektskap mellom stammer fra samme tid og geografisk område Bias i stammesamlingen? F.eks. stammesamling GBS fra storfe i Trøndelag
Oppløsningsevne av typingsmetoder Høy oppløslighet, stor datamengde, f.eks. hel-genom-sekvensering Lav oppløslighet, liten datamengde, f.eks. antibiogramm
Genetisk klokke og typingsmetoder Mål: utbruddsoppklaring hurtige forandringer/mutasjoner Bringe frem mest mulig diversitet PFGE (, AFLP), MLVA Mål: epidemiologisk overvåkning Konserverte områder Mindre diversitet MLST, MLVA?
Dynamikk av genomer Evolusjonær mutasjonsrate Mutasjonsrate av et gen kjent? Isersjon/delesjon av sekvenser gir «hopp» i evolusjonen Plasmider
Monomorphe species Lav diversitet i sequensen Gir lav oppløsning i en rekke metoder, f.eks. MLST Viktige monomorfe species: M.tuberculosis Y.pestis B. anthracis Salmonella enterocolica (serovar thyphi) M. leprae
Interpretasjon av DNA fragmentmønster F.eks. PFGE Antall bånd Prosentuell likhet av mønstrene Mutasjoner må være i restriksjonsområde for å gi forskjell
Interpretasjon av PFGE (etter Tenover) Ingen forskjell 1-4 bånds forskjell: nært beslektet 5-8 bånds forskjell: mulig beslektet …men hvor mange mutasjoner ligger bak? Best å ha 10-15 bånd valg av restriksjonsenzym Tenover et al, J Clin Microbioll, 1995, 2233ff
Analyse av MLVA profiler Populasjonsanalyser kan indikere mutasjonsraten i repetisjonsområder Mutasjonsmønster kjent? Stegvis mutasjon mot tilfeldig Mutasjoner kan forekomme under et utbrudd
Interpretasjon av data fra DNA sekvenser Kvalitetssjekk av sekvenser svært viktig Kuratorer forlanger ofte rådataen fra sekvenseringen før de godkjenner nye alleler
Typingsmetoder og standartisering Gelbaserte metoder mot molekylære metoder Databaser må bli bygget på Standardiserte protokoller Strenge kuratorer Ringtester F.eks. PulseNet, MLST.net, spa-typing
eBurst Utviklet for MLST Analyserer hovedsakelig relasjonen mellom nært beslektede genotyper (klonale komplekser) Slektskap (distanse) mellom klonale komplekser blir ikke analysert Tar ikke hensyn til antall stammer i hver ST
Minimum spanning tree MST er et resultat av en graph som knytter alle hjørner sammen og gi dem en vekt.
Neighbor joining Det initiale treet er stjerneformet, nye noder blir tilføyet endene Forutsetter ikke en konstant evolusjonsrate Distans mellom to par må være kjent og er sentral Rask og ok for store dataset Avhengig av korrekt evolusjonsmodell
UPGMA Unweighted Pair Group Method with Arithmetic Mean Gir dendrogram Forutsetter en konstant evolusjonsrate “Molekylær klokke” Enkleste metode for konstruksjon av et tre
Konklusjon Analyse må ta hensyn til: Epidemiologisk spørsmålstilling Typingsmetode Interpretasjonsmetode Tilgjenglige epidemiologiske data må trekkes inn i tolkningen