GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL...
Transcript of GENOMICA GENOMICA DEL BACILLO TUBERCOLAREmyco09.pbworks.com/f/rindi09-Genomica.pdf · GENOMICA DEL...
1
GENOMICA DEL BACILLO TUBERCOLARE
Laura Rindi
Dipartimento di Patologia Sperimentale, Biotecnologie MedicheInfettivologia ed Epidemiologia - Università di Pisa
� branca della biologia molecolare che si occupa dello studio del genoma degli organismi
� studio della struttura, contenuto, funzione ed evoluzione del genoma
� Genomica comparativa → approccio che consente l’identificazione di variazioni genetiche tra gli organismi che possono spiegare differenze nella fisiologia, biochimica e virulenza
GENOMICA
…….The genome comprises 4,411,529 base pairs, contains around 4,000 genes, and hasa very high guanine + cytosine content thatis reflected in the biased amino-acid content of the proteins. M. tuberculosisdiffers radically from other bacteria in that a very large portion of its codingcapacity is devoted to the production of enzymes involved in lipogenesis and lipolysis, and to two new families of glycine-richproteins with a repetitive structure thatmay represent a source of antigenicvariation.
Nature 393, 537-544, 1998
Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence
S. T. Cole, et al.
Circular map of the chromosome of M. tuberculosis H37Rv
G + C content, with <65% G + C in yellow, and >65% G + C in red.
Scale in Mb, with 0 representing the origin of replication.Positions of stable RNA genes (tRNAs are
blue, others are pink) and the direct repeat region (pink cube);
coding sequence by strand (clockwise, dark green; anti-clockwise, light green);
repetitive DNA (insertion sequences, orange; 13E12 REP family, dark pink; prophage, blue);
PPE family members (green);
PE family members (purple, excluding PGRS);
PGRS sequences (dark red)
+ 82 geni
... Here the complete re-annotation of the genome sequence of Mycobacterium tuberculosisstrain H37Rv is presented almost 4 years after the first submission. Eighty-two new protein-coding sequences (CDS) have been included and 22 of these have a predicted function. .. The functional classification of 643 CDS has been changed based principally on recent sequencecomparisons and new experimental data from the literature. More than 300 gene names and over 1000 targeted citations have been added and the lengths of 60 genes have been modified. Presently, it is possible to assign a function to 2058 proteins (52% of the 3995 proteinspredicted) and only 376 putative proteins share no homology with known proteins and thus couldbe unique to M. tuberculosis.
Microbiology 148, 2967-2973, 2002
Re-annotation of the genome sequence of Mycobacteriumtuberculosis H37Rv
J. C. Camus, et al.
Nature 393, 537-544, 1998
Deciphering the biology of Mycobacteriumtuberculosis from the complete genome sequence
S. T. Cole, et al.
CARATTERISTICHE DEL GENOMA DI M. TUBERCULOSIS H37Rv
� 4.411.532 bp
� G+C 65.6%
� ∼∼∼∼ 4.000 geni codificanti proteine
� 50 geni codificanti RNA stabile
� Oltre il 51% dei geni è derivato dalla duplicazione genica
� Il 3.4% del genoma è composto da sequenze di inserzione e profagi
52% funzione definita
48% funzione ipotetica o sconosciuta
2
CLASSIFICAZIONE FUNZIONALE DEI GENI DI M. TUBERCULOSIS H37Rv
99Virulence, detoxification, adaptation0
1051Conserved hypothetical proteins10
189Regulatory proteins9
272Proteins of unknown function8
894Intermediary metabolism and respiration7
170PE and PPE proteins6
149Insertion sequences and phages5
50Stable RNAs4
708Cell wall and cell processes3
229Information pathways2
233Lipid metabolism1
NUMERO
DI GENIFUNZIONECLASSE
METABOLISMO LIPIDICO
∼8% del genoma è dedicato al metabolismo lipidico(oltre 200 enzimi rispetto ai 50 di E.coli)
Lipid metabolism.Degradation of host-cell lipids is vital in the intracellular life of M. tuberculosis. Host-cell membranesprovide precursors for many metabolic processes, as well as potential precursors of mycobacterial cell-wall constituents, through the actions of a broad family of b-oxidative enzymes encoded by multiple copies in the genome. These enzymes produce acetyl CoA, which can be converted into many differentmetabolites and fuel for the bacteria through the actions of the enzymes of the citric acid cycle and the glyoxylate shunt of this cycle.
PROTEINE PE E PPE
∼7% dei geni codifica per due nuove famiglie di proteine ricche in glicina
Ruolo immunologico
SEQUENZE DI DNA RIPETUTE
�Duplicazioni di geni/famiglie di geni
�Sequenze di inserzione
�Sequenze non codificanti disperse
Sequenze di DNA ripetute: SEQUENZE DI INSERZIONE
� Le sequenze di inserzione (IS) sono piccoli segmenti di DNA (<2.5kb) in grado di inserirsi in siti multipli del genoma.
� Il genoma di M. tuberculosis H37Rv contiene 56 copie di elementi IS appartenenti ad almeno 9 famiglie.
transposasi
IS1556ignota
IS1555, IS1557 (2), IS1557’, IS1561’, IS1606’’ISL3
IS1535, IS1536, IS1537, IS1538, IS1539, IS1602, IS1605’’IS1535
IS1081 (6), IS1552’, IS1553, IS1554IS256
IS1547 (2), IS1558, IS1558’, IS1607, IS1608’ (2)IS110
IS1603IS30
IS1532, IS1533, IS1534IS21
IS1560, IS1560’, IS-like (2)IS5
IS6110 (16), IS1540, IS1604IS3
MEMBRI IN M. TUBERCULOSISFAMIGLIA IS
� Ad eccezione di IS6110, che traspone “frequentemente”, gli elementi IS sono stabili in H37Rv e in altri isolati.
Sequenze di DNA ripetute: SEQUENZE NON CODIFICANTI DISPERSE
� MIRU : mycobacterialinterspersed repetitive unit.
41 loci
dimensioni 40-100 bp
� Locus DR : direct repeat.
Sequenze ripetute di 36 bpseparate da sequenze non ripetute (spacers) di 36-41 bp
3
http://genolist.pasteur.fr/TubercuList
Genome Res. Epub2008-04-15
656636 Kb5550 orfs
Mycobacterium marinum M, ATCC BAA-535
Unpublished2008-03-01
645067 Kb5041 orfs
Mycobacterium abscessus CIP 104536
Unpublished2007-06-07
65.64424 Kb4050 orfs
Mycobacterium tuberculosis F11 (ExPEC)
PLoS ONE 3, e23752007-06-01
65.64419 Kb4132 orfs
Mycobacterium tuberculosis H37Ra
Unpublished2007-04-12
675619 Kb5723 orfs
Mycobacterium flavenscens (gilvum) PYR-GCK
Unpublished2007-02-27
686048 Kb5899 orfs
Mycobacterium sp JLS
Unpublished2007-01-08
65.64374 Kb4033 orfs
Mycobacterium bovis BCG Pasteur 1173P2
Unpublished2006-12-27
67.86491 Kb6092 orfs
Mycobacterium vanbaalenii PYR-1
Unpublished2006-12-20
68.45737 Kb6133 orfs
Mycobacterium sp KMS
Genome Res 17, 192-2002006-12-01
65.55631 Kb4291 orfs
Mycobacterium ulcerans Agy99
Unpublished2006-11-20
695475 Kb5339 orfs
Mycobacterium avium 104
Unpublished2006-11-20
67.46988 Kb6978 orfs
Mycobacterium smegmatis MC2 155
Unpublished2006-06-09
685705 Kb5752 orfs
Mycobacterium sp MCS
PNAS 102, 12344-92004-01-30
69.34829 Kb4415 orfs
Mycobacterium avium paratuberculosis K-10
PNAS 100, 7877-78822003-06-24
65.64345 Kb4012 orfs
Mycobacterium bovis AF2122/97(spoligotype 9)
J Bacteriol 184, 5479-902001-10-02
65.64403 Kb4346 orfs
Mycobacterium tuberculosis CDC1551 (Oshkosh)
Nature 409, 1007-10112001-02-22
57.83268 Kb2749 orfs
Mycobacterium leprae TN
Nature 393,537-5441998-06-11
65.64411 Kb4060 orfs
Mycobacterium tuberculosis H37Rv (lab strain)
PUBLICATIONGC CONTENTSIZEORGANISM
34 ceppi micobattericicompletamente sequenziati
47 ceppi del complesso tubercolare in corso di sequenziamento
http://www.genomesonline.org/gold.cgi
M. tuberculosis complex
AF2122/97H37RvCDC1551H37Ra
M. tuberculosis M. africanum M. canettii M. microti M. bovis M. bovis BCG BCG-Pasteur
4.41 Mb
4.32 Mb 4.31Mb
in corso in corso in corso
Tutti i micobatteri appartenenti al complesso tubercolare condividono il 99.9% di identità a livello nucleotidico, ma differiscono ampiamente in termini di
spettro d’ospite e di patogenicità
PLASTICITA’DEL GENOMA
polimorfismi di singoli nucleotidi
eventi di inserzione e delezione
J. Bacteriol, 184, 5479-90, 2002
Whole-Genome Comparison of Mycobacterium tuberculosisClinical and Laboratory Strains
R. D. Fleischmann et al.
PNAS, 100, 7877-82, 2003
The complete genome sequenceof Mycobacterium bovis
T. Garnier et al.
10863-inserzioni
11772-delezioni
23481135-polimorfismi singoli
Rispetto a Mtb H37Rv:
3.9514.2493.995Geni codificanti per proteine
65.665.665.6G+C, %
4.345.4924.403.8364.411.532Dimensioni del genoma, bp
M. bovis AF2122/97M. tuberculosis CDC1551M. tuberculosis H37RvCaratteristiche
� Il genoma di M. bovis AF2122/97 (identico per oltre il 99.5% a quello di M tuberculosisH37Rv) rispetto a quelli dei due ceppi tubercolari è più piccolo di 70 kb e contiene circa 60
geni in meno.
� Il 55% delle inserzioni e delezioni tra i due ceppi tubercolari riguardano geni, soprattutto
quelli codificanti per le proteine PE e PPE.
� La variabilità tra M. bovis e Mtb riguarda prevalentemente componenti della parete
cellulare e proteine di secrezione.
Regioni genomiche che differiscono tra M. tuberculosis H37Rv e M. bovis BCG Pasteur
(phiRv2)
(phiRv1)
(fosfolipasi C)
(invasina)
(Esat-6, CFP-10)
Scheme of the proposed evolutionary pathway of
the tubercle bacilli illustrating successive loss of DNA in certain lineages (gray boxes). The scheme
is based on the presence or absence of conserved
deleted regions and on sequence polymorphisms in five selected genes. Note that the distances
between certain branches may not correspond to
actual phylogenetic differences calculated by othermethods. Blue arrows indicate that strains are
characterized by katG463. CTG (Leu), gyrA95 ACC
(Thr), typical for group 1 organisms. Green arrowsindicate that strains belong to group 2 characterized
by katG463 CGG (Arg), gyrA95 ACC (Thr). The red
arrow indicates that strains belong to group3, characterized by katG463 CGG (Arg), gyrA95 AGC
(Ser), as defined by Sreevatsan et al.
Brosch et al. 2002 PNAS 99:3684-9.
4
EvoluzioneEvoluzione del del complessocomplesso tubercolaretubercolare
M. bovis
M. tuberculosis
X
bacillo progenitore
M. bovis M. tuberculosis
EvoluzioneEvoluzione del del complessocomplesso tubercolaretubercolare
oxyR n285 G→→→→A
M. africanum
RD 7
RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9
M. tub.katG 463 CTG→→→→CGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal
oryx
goat
“classical”RD 1
BCG Tokyo
gyrA 95AGC→→→→ACC
pncAc57CAC→→→→GAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“modern”
“ancestral”
RD9 +
TbD1 -mmpL6 551AAC→→→→AAG
eg. Beijing cluster
eg. Haarlem cluster
eg. H37Rv
IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare
oxyR n285 G→→→→A
M. africanum
RD 7
RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTG→→→→CGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal-isolates
oryx-isolates
goat-isolates
“classical”RD 1
BCG Tokyo
gyrA 95AGC→→→→ACC
pncAc57CAC→→→→GAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“m
od
ern
”
“ancestral”
RD9 -
mmpL6 551AAC→→→→AAG
IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare
oxyR n285 G→→→→A
M. africanum
RD 7
RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTG→→→→CGG
M. microti
M. bovis
RDcan
RDmic
RDseal
“classical”RD 1
BCG Tokyo
gyrA 95AGC→→→→ACC
pncA 57CAC→→→→GAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“m
od
ern
”
“ancestral”
RD9 -
mmpL6 551AAC→→→→AAG
mmpL6 551 AAG
seal-isolates
oryx-isolates
goat-isolates
IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare
oxyR n285 G→→→→A
M. africanum
RD 7
RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTG→→→→CGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal
oryx
goat
“classical”RD 1
BCG Tokyo
gyrA 95AGC→→→→ACC
pncA 57CAC→→→→GAC
RD 4
RD 2
BCG Pasteur
RD 14
TbD 1
“m
od
ern
”
“ancestral”
RD9 -
mmpL6 551AAC→→→→AAG
RD4 -
IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare
5
oxyR n285 G→→→→A
M. africanum
RD 7
RD 8
RD 10
RD 12
RD 13
M. canettii
RD 9M. tub.katG 463 CTG→→→→CGG
M. microti
M. bovis
RDcan
RDmic
RDseal
seal
oryx
goat
“classical”RD 1
BCG
gyrA 95AGC→→→→ACC
pncA 57CAC→→→→GAC
RD 4
RD 2
RD 14
TbD 1
“m
od
ern
”
“ancestral”
RD9 -
mmpL6 551AAC→→→→AAG
RD1 -
IdentificazioneIdentificazione rapidarapida del del bacillobacillo tubercolaretubercolare
The composite MtbC PCR typing panel. Illustrated
are the typical MtbC PCR
panel typing results for a
single representative of each MtbC subspecies as
well as MOTT (M. avium
subsp. avium is shown).
Lanes:
1, 16S rRNA; 2, Rv0577;
3, IS1561';
4, Rv1510 (RD4);
5, Rv1970 (RD7); 6, Rv3877/8 (RD1);
7, Rv3120 (RD12).
J. Clin. Microbiol. 41, 1637-1650, 2003
PCR-Based Method To Differentiate the Subspecies of the Mycobacterium tuberculosis Complex on the Basis of GenomicDeletions
R. C. Huard, et al.
EVOLUZIONE DI MYCOBACTERIUM TUBERCULOSIS
Gagneux S. et.al. PNAS 2006;103:2869-2873
ERA POSTERA POST--GENOMICAGENOMICA
CARATTERIZZAZIONE GENOMICA
GENOMICA COMPARATIVA
� Identificazione di fattori di virulenza (confronto genoma Mtb/BCG) e di antigeni (proteine PE/PPE) →comprensione dei meccanismi di patogenicità e sviluppo di nuovi vaccini
� Allestimento di test diagnostici rapidi (identificazione delle specie del complesso tubercolare; diagnosi immunologica di infezione latente)
� Identificazione di molecole essenziali, potenziali bersagli per nuovi farmaci
� Studi evoluzionistici e di epidemiologia molecolare
Sviluppo di migliori strategie di controllo dell’infezione tubercolare