Biotecnologia molecular
-
Upload
rodrigo-martinez -
Category
Documents
-
view
218 -
download
3
description
Transcript of Biotecnologia molecular
Biotecnologa Molecular IIQ2693
Tarea 4
Integrantes:
Mauricio Gonzales
Rodrigo Martnez
Rodrigo Dedes
Pregunta 1
A) En el cromatograma los pulsos deben estar bien definidos, para que sea una zona de buena calidad de secuenciacin. En la Fig 1, la regin seleccionada es una zona poco confiable, mientras que la regin no seleccionada muestras pulsos ms definidos, zona de mejor calidad de secuenciacin. En la figura 2 se muestran regiones de mala calidad de secuenciacin, mientras que la figura 3, los pulsos estn perfectamente definidos una regin de muy buena calidad de secuenciacin.
Figura 1
Figura 2
Figura. 3
B) Utilizamos el Plsmido PET101, cuyo sitio de insercin del gen se puede apreciar en la Figura. 4 y Figura.5
Figura. 4
Figura.5
c) Usando la herramienta Nucleotide Blast, vemos que genoma alinea con nuestro gen secuenciado (sacando las regiones poco confiables del gen).
Usando P12+T7 Prom
Figura.6
El Blast muestra un 98% de identidad con Bifidobacterium longum subsp. infantis JCM 1222 DNA, complete genome y Bifidobacterium longum subsp. infantis ATCC 15697, complete genome
Usando P12+T7term.
Figura.7
Figura.8
Vemos que T7 term se alinea con muchos genomas pero el gen P12 se alinea con las mismas especies obtenidas anteriormente (Figura.8), Bifidobacterium longum subsp. infantis ATCC 15697 con un 97% . (Quevery Cover 88%) (Figura.7)
d) Buscando en la base de datos del NCBI para Bifidobacterium longum subsp. infantis ATCC 15697
Figura.9
Vemos que el nombre de Gen es Blon_2255 (Figura.9, Figura.10)
El Genoma completo del cromosoma Bifidobacterium longum subsp. infantis ATCC 15697 es el siguiente: (Fasta)
CGGCGACTACTGGACGAACGATATCGCTCCGGTGCGTGCCGCCGGTGGGCTTACCGCGTTCATCCACGAG
CCTGATCCATCCTTGCCCGCGACCATCACCGCCCCGACCTTGCGGCAGATGGTCGATGACATTGTGGATG
TATGCGCCGCCGCGACGGCGGATGCCGGTGGGGCCGAGGCCGCTTTCCGGGACTGACCGCAACCGTGTCC
GTTGACCCCGTTGACGGCTATCATGTCCTGAGGGCCAGAAGGCTCTATCTCGATGCAGAGGTCGAAAGGA
TATGTGGCTGCTATGGTGCAGGAACCAACATTGGAATGGCATGTCATACCGGAGCCGACGAATGTCGAGC
CGCTGGTGGGAACATGCTCGTTGCCGTTGTCGGGAACGGTTGTGGAGCAACGAGGTGCGGATGATGCGGA
GGCCGTGTTTGCGCGTCAGCTTGTCGACGACATTAAGCGCGTGTGCGGAGGCCGCTGGCAGGTGGCCTCC
GGAGAGGTTCAGCGGGAGGTGACTTTGCGGACCAGTCCTTCGCTCGATGACTGGTCGTACGTGCTTGAGG
TCTCGCCGGACGGCGTTGTGATCACTGGTTCGGGGTTCGAAGGCGTTCGCGATGGCGTGCAGACATTGCG
TCAGATTATTCGCCAGATTGGTTTGACGATACCGTGCATGGTCATCAGGGATCGGCCGGCGTTCTCGACC
CGCGGTTACTATCTGGACGTGACTCGTGGCCGTGTGCCCTCTATGGCTTGGCTGAAATCGTGGGTGGATC
GCCTGTGCTTCTACAAGTACAACCAATTCCAGTTGTACATCGAGCATACGTTCCAGTTCAATGGTCTTAG
CGAAGTGTGGCGTGGCGCCGATCCGTTGACTTCGTCCGACATTCTCGAGCTTGATTCCTATTGCGCGGCG
CGTGGCATAGAGCTCGTGCCCTCCGTGTCGACGTTCGGACATCATTACACCGCGCTGCGGACGCGGCAAC
TACGTGATCTGGGAGAGTTTCCGGAGGACGCGGATCGTCCTTTCAGCCTGATCGAGCGAATGACGCACCA
TACGCTCAACATCACCGATGAGCGGTCCTATGAGTTTTCGACATCATTGATCGATGAGCTGATGCCGTTG
TTCCGTTCGCGGAAGTTCAATATCTGCGCCGATGAGACGTTTGATCTCGGCAAGGGGAGGTCGAAGCAGG
AATCGGCGAAACGTGGCGTTGGCGCGATGTATGCCGATTTCGTCGAGCGACTGTGCCGCCATGTTGATGA
TCGTGGGCATGATGTCATGGTGTGGGCCGATGTCGCGCTCGAGCACCCTGAGATCATCGATACGCTTCCC
AAGAACATCACCTGGCTGAATTGGCAGTATGAGCCCAACGTGGATGATGGCACAACGGCAGCTCTCGCCG
ATGCCGGCGCGACGCAGATGGTGTGCCCGGCGGTGTGGTGCTGGAATGCGCTGATTCCGCGGATCGACGA
TGCGTGGAATAACATCACCAGGATGGCGCGCCATGGCCGCGCCCATGATGTTTCGGGGATGCTGGTCACT
GATTGGGGGGATTTCGGACACGTCAACGATCCCCGCATGTCGGTTCCGGGCATGATCTTCGGTGCGCAGC
AATCCTGGAATCCGGATGCCGAGCTCAGCGAAGTCGATATGCTGTCGCGCATATCCACCATCGAATACGG
CGACCATACTGGTAGCGTGGTCGGTGCGCTCAGGGGCGCTTCTGCCAAAGGCGGATTCTCGTGGAGCGAT
CTCGTCACCTATCTGGAACTGGACGACGGCCGTGGCGGATGCAATACGGAGATCGTGCGGGTCATGGGCT
GTCTGGAAGCGTATCGGAATGATTTGCCGCAGTCCGGTCAGGCAAGGTTGGCGGATGCTCGCGTTTCGAT
GCTGCGGACGTTGCGTGACTCCATTCTCGCGGGCCGGGAATTGAACGGCAAGCTTGACGATGCAGCCAAG
GATATCACCCAGCTGCTCCGCGTGGCCGGTGATCCCTCCTCCGCTGCGGTCTGGTCGTTGGCCATCGACG
GTCAGCGTCTGCTGAACCGTGTCGGGTTGGCGTTGTTGGCCGCGCATGGCGTGGTGCGGCAGGATGAGGC
CGGAATCGATGCGGCGAAGCTGGCCGATGAACTGGAATGCTGGACCGAACAGTATTCGAGGCTCTGGCAT
GAGGTCAGTCGGCAGTCGGAACTGGCCCGCATCCAACACGTGGTATGGCGCGCGGCGGACGTGCTGCGTT
CCATTTAGCCGGTTGCGTGGTGACGGGAGCGGCGGTGCGAGCGGGCCTGATGCAAATATGTTAAGGCTGT
TGACAGTGCTGGCTCCCGTACCTATCATGGTTGCGTCCATCTCATAGGTGTGATGGATGCAACCGAAGTC
ATCATCGACTCAAAGGAGAGACAATGAGGAATGTCGCGATGAAGGTGGGTGCTGCGGTATGCGCCGTGGC
CTTGCTGGGTTCGCTGTCTGCGTGTGGCAATAAGAAGTCGACCACGACGGCTGACGGCAAGCCGATTGTG
ACGGTTCTGGTCAAGAAGAACG
Buscamos en GeneBank, lo que nos entrega todo los datos del gen de inters y publicaciones relacionadas. Resulta ser una enzima que codifica para una protena Hidrolasa de la especie Bifidobacterium, Es parte de la microbiota intestinal. El gen Blon_2355 estara relacionado con la degradacin de oligosacridos complejos en la leche humana, que tiene relacin directa con la nutricin esencial en infantes.ProteinaMVQEPTLEWHVIPEPTNVEPLVGTCSLPLSGTVVEQRGADDAEAVFARQLVDDIKRVCGGRWQVASGEVQREVTLRTSPSLDDWSYVLEVSPDGVVITGSGFEGVRDGVQTLRQIIRQIGLTIPCMVIRDRPAFSTRGYYLDVTRGRVPSMAWLKSWVDRLCFYKYNQFQLYIEHTFQFNGLSEVWRGADPLTSSDILELDSYCAARGIELVPSVSTFGHHYTALRTRQLRDLGEFPEDADRPFSLIERMTHHTLNITDERSYEFSTSLIDELMPLFRSRKFNICADETFDLGKGRSKQESAKRGVGAMYADFVERLCRHVDDRGHDVMVWADVALEHPEIIDTLPKNITWLNWQYEPNVDDGTTAALADAGATQMVCPAVWCWNALIPRIDDAWNNITRMARHGRAHDVSGMLVTDWGDFGHVNDPRMSVPGMIFGAQQSWNPDAELSEVDMLSRISTIEYGDHTGSVVGALRGASAKGGFSWSDLVTYLELDDGRGGCNTEIVRVMGCLEAYRNDLPQSGQARLADARVSMLRTLRDSILAGRELNGKLDDAAKDITQLLRVAGDPSSAAVWSLAIDGQRLLNRVGLALLAAHGVVRQDEAGIDAAKLADELECWTEQYSRLWHEVSRQSELARIQHVVWRAADVLRSIFigura.10
Informacin Genebank: Glycoside hydrolase family protein [Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222]
LOCUS NC_011593 1956 bp DNA linear CON 10-JUN-2013DEFINITION Bifidobacterium longum subsp. infantis ATCC 15697 chromosome, complete genome.ACCESSION NC_011593 REGION: complement(2628314..2630269)VERSION NC_011593.1 GI:213690928DBLINK Project: 58677 BioProject: PRJNA58677KEYWORDS RefSeq.SOURCE Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM 20088 ORGANISM Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM 20088 Bacteria; Actinobacteria; Actinobacteridae; Bifidobacteriales; Bifidobacteriaceae; Bifidobacterium.REFERENCE 1 (bases 1 to 1956) AUTHORS Sela,D.A., Chapman,J., Adeuya,A., Kim,J.H., Chen,F., Whitehead,T.R., Lapidus,A., Rokhsar,D.S., Lebrilla,C.B., German,J.B., Price,N.P., Richardson,P.M. and Mills,D.A. TITLE The genome sequence of Bifidobacterium longum subsp. infantis reveals adaptations for milk utilization within the infant microbiome JOURNAL Proc. Natl. Acad. Sci. U.S.A. 105 (48), 18964-18969 (2008) PUBMED 19033196REFERENCE 2 (bases 1 to 1956) CONSRTM NCBI Genome Project TITLE Direct Submission JOURNAL Submitted (21-NOV-2008) National Center for Biotechnology Information, NIH, Bethesda, MD 20894, USAREFERENCE 3 (bases 1 to 1956) AUTHORS Lucas,S., Copeland,A., Lapidus,A., Barry,K., Detter,J.C., Glavina del Rio,T., Dalin,E., Tice,H., Goltsman,E., Pitluck,S., Schmutz,J., Larimer,F., Land,M., Hauser,L., Kyrpides,N., Mikhailova,N., Sela,D.A., Chapman,J., Adeuya,A., Kim,J.H., Chen,F., Whitehead,T.R., Rokhsar,D.S., Lebrilla,C.B., German,J.B., Price,N.P., Mills,D.A. and Richardson,P.M. CONSRTM US DOE Joint Genome Institute TITLE Direct Submission JOURNAL Submitted (28-MAY-2008) US DOE Joint Genome Institute, 2800 Mitchell Drive B100, Walnut Creek, CA 94598-1698, USACOMMENT PROVISIONAL REFSEQ: This record has not yet been subject to final NCBI review. The reference sequence was derived from CP001095. URL -- http://www.jgi.doe.gov JGI Project ID: 40002686 Source DNA available from David Mills ([email protected]) Bacteria available from ATCC: ATCC 15697 Contacts: David Mills ([email protected]) David Bruce ([email protected]) Quality assurance done by JGI-Stanford Annotation done by JGI-ORNL and JGI-PGF Finishing done by JGI-PGF Finished microbial genomes have been curated to close all gaps with greater than 98% coverage of at least two independent clones. Each base pair has a minimum q (quality) value of 30 and the total error rate is less than one per 50000. The JGI and collaborators endorse the principles for the distribution and use of large scale sequencing data adopted by the larger genome sequencing community and urge users of this data to follow them. it is our intention to publish the work of this project in a timely fashion and we welcome collaborative interaction on the project and analysis. (http://www.genome.gov/page.cfm?pageID=10506376). COMPLETENESS: full length.FEATURES Location/Qualifiers source 1..1956 /organism="Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM 20088" /mol_type="genomic DNA" /strain="ATCC 15697" /sub_species="infantis" /culture_collection="ATCC:15697" /db_xref="taxon:391904" gene 1..1956 /locus_tag="Blon_2355" /db_xref="GeneID:7054955" CDS 1..1956 /locus_tag="Blon_2355" /note="PFAM: glycoside hydrolase, family 20; KEGG: blo:BL0056 possible beta-hexosaminidase A" /codon_start=1 /transl_table=11 /product="glycoside hydrolase family protein" /protein_id="YP_002323791.1" /db_xref="GI:213693205" /db_xref="InterPro:IPR001540" /db_xref="GeneID:7054955" /translation="MVQEPTLEWHVIPEPTNVEPLVGTCSLPLSGTVVEQRGADDAEA VFARQLVDDIKRVCGGRWQVASGEVQREVTLRTSPSLDDWSYVLEVSPDGVVITGSGF EGVRDGVQTLRQIIRQIGLTIPCMVIRDRPAFSTRGYYLDVTRGRVPSMAWLKSWVDR LCFYKYNQFQLYIEHTFQFNGLSEVWRGADPLTSSDILELDSYCAARGIELVPSVSTF GHHYTALRTRQLRDLGEFPEDADRPFSLIERMTHHTLNITDERSYEFSTSLIDELMPL FRSRKFNICADETFDLGKGRSKQESAKRGVGAMYADFVERLCRHVDDRGHDVMVWADV ALEHPEIIDTLPKNITWLNWQYEPNVDDGTTAALADAGATQMVCPAVWCWNALIPRID DAWNNITRMARHGRAHDVSGMLVTDWGDFGHVNDPRMSVPGMIFGAQQSWNPDAELSE VDMLSRISTIEYGDHTGSVVGALRGASAKGGFSWSDLVTYLELDDGRGGCNTEIVRVM GCLEAYRNDLPQSGQARLADARVSMLRTLRDSILAGRELNGKLDDAAKDITQLLRVAG DPSSAAVWSLAIDGQRLLNRVGLALLAAHGVVRQDEAGIDAAKLADELECWTEQYSRL WHEVSRQSELARIQHVVWRAADVLRSI"ORIGIN 1 atggtgcagg aaccaacatt ggaatggcat gtcataccgg agccgacgaa tgtcgagccg 61 ctggtgggaa catgctcgtt gccgttgtcg ggaacggttg tggagcaacg aggtgcggat 121 gatgcggagg ccgtgtttgc gcgtcagctt gtcgacgaca ttaagcgcgt gtgcggaggc 181 cgctggcagg tggcctccgg agaggttcag cgggaggtga ctttgcggac cagtccttcg 241 ctcgatgact ggtcgtacgt gcttgaggtc tcgccggacg gcgttgtgat cactggttcg 301 gggttcgaag gcgttcgcga tggcgtgcag acattgcgtc agattattcg ccagattggt 361 ttgacgatac cgtgcatggt catcagggat cggccggcgt tctcgacccg cggttactat 421 ctggacgtga ctcgtggccg tgtgccctct atggcttggc tgaaatcgtg ggtggatcgc 481 ctgtgcttct acaagtacaa ccaattccag ttgtacatcg agcatacgtt ccagttcaat 541 ggtcttagcg aagtgtggcg tggcgccgat ccgttgactt cgtccgacat tctcgagctt 601 gattcctatt gcgcggcgcg tggcatagag ctcgtgccct ccgtgtcgac gttcggacat 661 cattacaccg cgctgcggac gcggcaacta cgtgatctgg gagagtttcc ggaggacgcg 721 gatcgtcctt tcagcctgat cgagcgaatg acgcaccata cgctcaacat caccgatgag 781 cggtcctatg agttttcgac atcattgatc gatgagctga tgccgttgtt ccgttcgcgg 841 aagttcaata tctgcgccga tgagacgttt gatctcggca aggggaggtc gaagcaggaa 901 tcggcgaaac gtggcgttgg cgcgatgtat gccgatttcg tcgagcgact gtgccgccat 961 gttgatgatc gtgggcatga tgtcatggtg tgggccgatg tcgcgctcga gcaccctgag 1021 atcatcgata cgcttcccaa gaacatcacc tggctgaatt ggcagtatga gcccaacgtg 1081 gatgatggca caacggcagc tctcgccgat gccggcgcga cgcagatggt gtgcccggcg 1141 gtgtggtgct ggaatgcgct gattccgcgg atcgacgatg cgtggaataa catcaccagg 1201 atggcgcgcc atggccgcgc ccatgatgtt tcggggatgc tggtcactga ttggggggat 1261 ttcggacacg tcaacgatcc ccgcatgtcg gttccgggca tgatcttcgg tgcgcagcaa 1321 tcctggaatc cggatgccga gctcagcgaa gtcgatatgc tgtcgcgcat atccaccatc 1381 gaatacggcg accatactgg tagcgtggtc ggtgcgctca ggggcgcttc tgccaaaggc 1441 ggattctcgt ggagcgatct cgtcacctat ctggaactgg acgacggccg tggcggatgc 1501 aatacggaga tcgtgcgggt catgggctgt ctggaagcgt atcggaatga tttgccgcag 1561 tccggtcagg caaggttggc ggatgctcgc gtttcgatgc tgcggacgtt gcgtgactcc 1621 attctcgcgg gccgggaatt gaacggcaag cttgacgatg cagccaagga tatcacccag 1681 ctgctccgcg tggccggtga tccctcctcc gctgcggtct ggtcgttggc catcgacggt 1741 cagcgtctgc tgaaccgtgt cgggttggcg ttgttggccg cgcatggcgt ggtgcggcag 1801 gatgaggccg gaatcgatgc ggcgaagctg gccgatgaac tggaatgctg gaccgaacag 1861 tattcgaggc tctggcatga ggtcagtcgg cagtcggaac tggcccgcat ccaacacgtg 1921 gtatggcgcg cggcggacgt gctgcgttcc atttag
d) Usando Bioedit alineamos las secuencias encontrada usando la base de datos de NCBI (Importando el archivo Fasta de la secuencia del Gen completo), con la que obtuvimos secuenciando con los primers.
Viendo el alineamiento notamos que no es exacto para cada base por lo que no podemos asegurar que el gen este perfectamente secuenciado.
Pregunta 2
a) En la siguiente tabla se muestran los valores RPKM calculados segn la siguiente formula:
Donde se toma el nmero total de secuencias como la suma de todas las secuencias que alinean en el genoma completo de 58 genes. Con lo que se obtiene la siguiente tabla:
Genoma
RPKM medio rico
RPKM pH3.0
RPKM sal 0.5 M
RPKM Redox -300mV
Gen1
1024,60
339,65
423,99
3892,25
Gen2
3232,79
3016,88
3174,89
3177,28
Gen3
1328,83
1898,65
1271,03
18142,39
Gen4
951,49
1467,03
778,33
14641,01
Gen5
460,45
1593,80
925,15
12883,60
Gen6
160,30
1222,37
1301,01
3467,74
Gen7
925,28
737,77
1161,22
8407,49
Gen8
3188,26
1396,67
1525,45
8360,17
Gen9
8329,26
1929,68
2008,95
1911,88
Gen10
965,37
347,18
457,70
3965,38
Gen11
1496,17
710,50
749,85
6796,32
Gen12
2183,18
1051,39
1452,25
642,26
Gen13
3722,84
1911,63
2708,29
1260,37
Gen14
2344,52
930,13
1381,42
472,84
Gen15
1734,43
6319,77
9969,17
468,61
Gen16
9329,66
5046,36
5008,70
1521,87
Gen17
21924,89
82755,41
133694,92
6412,46
Gen18
16944,22
91720,78
142307,82
6329,62
Gen19
878,79
5186,00
7094,86
5565,26
Gen20
61554,77
41614,86
30201,55
63398,65
Gen21
61174,78
17823,52
12512,87
20931,98
Gen22
41304,08
8670,38
4554,72
19238,74
Gen23
34767,30
6848,76
9057,16
17732,60
Gen24
43556,93
14962,64
16038,03
17410,62
Gen25
1977,32
2070,93
1919,81
8084,35
Gen26
824,12
1406,16
662,31
10531,46
Gen27
737,59
1434,23
849,38
14603,96
Gen28
1146,91
1921,27
1153,27
18140,73
Gen29
1242,62
2622,67
710,14
99926,90
Gen30
1756,45
905,74
452,39
28438,43
Gen31
966,32
517,65
199,25
37081,73
Gen32
446,30
1828,93
221,34
82758,57
Gen33
769,68
2409,76
466,15
81700,68
Gen34
7241,89
3635,27
3909,51
1954,95
Gen35
3239,76
825,68
1225,21
722,61
Gen36
47071,91
16301,41
12674,67
31794,19
Gen37
28826,98
33971,87
19745,09
7548,98
Gen38
23578,66
34706,19
16604,73
6511,98
Gen39
17787,09
19473,71
14620,75
3691,76
Gen40
31532,59
21576,76
17660,57
5594,83
Gen41
42425,76
41418,57
37828,40
7407,91
Gen42
36881,08
37239,68
32540,36
6405,41
Gen43
4011,23
8731,98
10803,56
1075,16
Gen44
11693,16
24942,49
37037,93
3552,65
Gen45
10457,53
27498,58
40201,54
4720,88
Gen46
13127,67
46490,01
41070,61
5527,39
Gen47
11341,09
24562,88
36244,20
3642,01
Gen48
10026,53
27514,19
40314,10
4417,02
Gen49
6101,78
41461,86
24111,38
3570,16
Gen50
2228,01
4018,16
3207,82
1860,17
Gen51
2050,28
4807,82
4269,11
2315,97
Gen52
3156,26
3439,36
3448,99
3436,61
Gen53
1177,56
1627,93
2901,70
2919,88
Gen54
1939,88
2560,70
3786,66
3131,95
Gen55
1935,37
726,72
680,49
1252,03
Gen56
4578,59
1595,46
2029,48
5677,82
Gen57
4119,45
1307,68
2139,59
6757,81
Gen58
34693,33
26050,59
24659,10
56221,17
b) Tomando intervalos de a 1000 obtenemos los siguientes cuatro histogramas para cada condicin y sus respectivos valores RPKM:
c) Luego hacemos el Heat map de los RPKM para cada medio, donde la escala de rojos representa los valores ms pequeos y la de verdes los ms grandes:
Genoma
RPKM medio rico
RPKM pH3.0
RPKM sal 0.5 M
RPKM Redox -300mV
Gen1
1024,60
339,65
423,99
3892,25
Gen2
3232,79
3016,88
3174,89
3177,28
Gen3
1328,83
1898,65
1271,03
18142,39
Gen4
951,49
1467,03
778,33
14641,01
Gen5
460,45
1593,80
925,15
12883,60
Gen6
160,30
1222,37
1301,01
3467,74
Gen7
925,28
737,77
1161,22
8407,49
Gen8
3188,26
1396,67
1525,45
8360,17
Gen9
8329,26
1929,68
2008,95
1911,88
Gen10
965,37
347,18
457,70
3965,38
Gen11
1496,17
710,50
749,85
6796,32
Gen12
2183,18
1051,39
1452,25
642,26
Gen13
3722,84
1911,63
2708,29
1260,37
Gen14
2344,52
930,13
1381,42
472,84
Gen15
1734,43
6319,77
9969,17
468,61
Gen16
9329,66
5046,36
5008,70
1521,87
Gen17
21924,89
82755,41
133694,92
6412,46
Gen18
16944,22
91720,78
142307,82
6329,62
Gen19
878,79
5186,00
7094,86
5565,26
Gen20
61554,77
41614,86
30201,55
63398,65
Gen21
61174,78
17823,52
12512,87
20931,98
Gen22
41304,08
8670,38
4554,72
19238,74
Gen23
34767,30
6848,76
9057,16
17732,60
Gen24
43556,93
14962,64
16038,03
17410,62
Gen25
1977,32
2070,93
1919,81
8084,35
Gen26
824,12
1406,16
662,31
10531,46
Gen27
737,59
1434,23
849,38
14603,96
Gen28
1146,91
1921,27
1153,27
18140,73
Gen29
1242,62
2622,67
710,14
99926,90
Gen30
1756,45
905,74
452,39
28438,43
Gen31
966,32
517,65
199,25
37081,73
Gen32
446,30
1828,93
221,34
82758,57
Gen33
769,68
2409,76
466,15
81700,68
Gen34
7241,89
3635,27
3909,51
1954,95
Gen35
3239,76
825,68
1225,21
722,61
Gen36
47071,91
16301,41
12674,67
31794,19
Gen37
28826,98
33971,87
19745,09
7548,98
Gen38
23578,66
34706,19
16604,73
6511,98
Gen39
17787,09
19473,71
14620,75
3691,76
Gen40
31532,59
21576,76
17660,57
5594,83
Gen41
42425,76
41418,57
37828,40
7407,91
Gen42
36881,08
37239,68
32540,36
6405,41
Gen43
4011,23
8731,98
10803,56
1075,16
Gen44
11693,16
24942,49
37037,93
3552,65
Gen45
10457,53
27498,58
40201,54
4720,88
Gen46
13127,67
46490,01
41070,61
5527,39
Gen47
11341,09
24562,88
36244,20
3642,01
Gen48
10026,53
27514,19
40314,10
4417,02
Gen49
6101,78
41461,86
24111,38
3570,16
Gen50
2228,01
4018,16
3207,82
1860,17
Gen51
2050,28
4807,82
4269,11
2315,97
Gen52
3156,26
3439,36
3448,99
3436,61
Gen53
1177,56
1627,93
2901,70
2919,88
Gen54
1939,88
2560,70
3786,66
3131,95
Gen55
1935,37
726,72
680,49
1252,03
Gen56
4578,59
1595,46
2029,48
5677,82
Gen57
4119,45
1307,68
2139,59
6757,81
Gen58
34693,33
26050,59
24659,10
56221,17
d) Gracias al heat map es fcil ver cuales genes son candidatos a ser genes constitutivos, ya que veremos los valores de sus respectivos RPKM en cada medio y estos debieran estar en una misma tonalidad de color. Con esto vemos que hay solo2 genes constitutivos y son el gen 2 y el 52:
Gen2
3232,79
3016,88
3174,89
3177,28
Gen52
3156,26
3439,36
3448,99
3436,61
Luego para saber que genes estn fuertemente inducidos o reprimidos (ms de 4 veces la condicin basal), o sin cambio, programamos una macros en Excel y obtenemos la siguiente tabla.:
Genoma
RPKM pH3.0
RPKM sal 0.5 M
RPKM Redox -300mV
Gen1
Reprimido
Reprimido
Inducido
Gen2
Constitutivo
Constitutivo
Constitutivo
Gen3
Inducido
Sin cambio
Fuertemente Inducido
Gen4
Inducido
Reprimido
Fuertemente Inducido
Gen5
Inducido
Inducido
Fuertemente Inducido
Gen6
Fuertemente Inducido
Fuertemente Inducido
Fuertemente Inducido
Gen7
Reprimido
Inducido
Fuertemente Inducido
Gen8
Reprimido
Reprimido
Inducido
Gen9
Reprimido
Reprimido
Reprimido
Gen10
Reprimido
Reprimido
Inducido
Gen11
Reprimido
Reprimido
Fuertemente Inducido
Gen12
Reprimido
Reprimido
Reprimido
Gen13
Reprimido
Reprimido
Reprimido
Gen14
Reprimido
Reprimido
Reprimido
Gen15
Inducido
Fuertemente Inducido
Reprimido
Gen16
Reprimido
Reprimido
Reprimido
Gen17
Inducido
Fuertemente Inducido
Reprimido
Gen18
Fuertemente Inducido
Fuertemente Inducido
Reprimido
Gen19
Fuertemente Inducido
Fuertemente Inducido
Fuertemente Inducido
Gen20
Reprimido
Reprimido
Sin cambio
Gen21
Reprimido
Reprimido
Reprimido
Gen22
Reprimido
Reprimido
Reprimido
Gen23
Reprimido
Reprimido
Reprimido
Gen24
Reprimido
Reprimido
Reprimido
Gen25
Sin cambio
Sin cambio
Inducido
Gen26
Inducido
Reprimido
Fuertemente Inducido
Gen27
Inducido
Inducido
Fuertemente Inducido
Gen28
Inducido
Sin cambio
Fuertemente Inducido
Gen29
Inducido
Reprimido
Fuertemente Inducido
Gen30
Reprimido
Reprimido
Fuertemente Inducido
Gen31
Reprimido
Reprimido
Fuertemente Inducido
Gen32
Inducido
Reprimido
Fuertemente Inducido
Gen33
Inducido
Reprimido
Fuertemente Inducido
Gen34
Reprimido
Reprimido
Reprimido
Gen35
Reprimido
Reprimido
Reprimido
Gen36
Reprimido
Reprimido
Reprimido
Gen37
Inducido
Reprimido
Reprimido
Gen38
Inducido
Reprimido
Reprimido
Gen39
Sin cambio
Reprimido
Reprimido
Gen40
Reprimido
Reprimido
Reprimido
Gen41
Sin cambio
Reprimido
Reprimido
Gen42
Sin cambio
Reprimido
Reprimido
Gen43
Inducido
Inducido
Reprimido
Gen44
Inducido
Inducido
Reprimido
Gen45
Inducido
Inducido
Reprimido
Gen46
Inducido
Inducido
Reprimido
Gen47
Inducido
Inducido
Reprimido
Gen48
Inducido
Inducido
Reprimido
Gen49
Fuertemente Inducido
Inducido
Reprimido
Gen50
Inducido
Inducido
Reprimido
Gen51
Inducido
Inducido
Inducido
Gen52
Constitutivo
Constitutivo
Constitutivo
Gen53
Inducido
Inducido
Inducido
Gen54
Inducido
Inducido
Inducido
Gen55
Reprimido
Reprimido
Reprimido
Gen56
Reprimido
Reprimido
Inducido
Gen57
Reprimido
Reprimido
Inducido
Gen58
Reprimido
Reprimido
Inducido
Pregunta 3
Figura 1: rbol filogentico.
A partir de la informacin entregada por el rbol podemos ver que s existe una relacin entre la distancia filogentica y la tincin gram del set de bacterias entregado. Esto se ve claramente ya que el rbol filogentico agrupa en nodos diferentes, dejando a las bacterias gram negativas en el grupo de arriba, mientras que a las gram positivas en el grupo del medio (hay un outlier) como se puede ver en la figura 2. Dems est decir que que las bacterias en un mismo grupo estn ms cercanas respecto a las bacterias en los otros grupos.
Figura 2: rbol filogentico indicando la separacin en grupos de las bacterias gram positivas y gram negativas.
Finalmente, se adjunta los clculos de la matriz de distancias, que corrobora la informacin entregada por el rbol.
Ralstonia_ 0.0000 0.2810 0.2832 0.3293 0.3879 0.3328 0.3107 0.2238
0.3013 0.2245 0.3081 0.2999 0.2109 0.2217 0.3420 0.3112 0.2548
0.2912 0.2347 0.2018 0.3123 0.2832
Clostridiu 0.2810 0.0000 0.2655 0.2938 0.3226 0.2183 0.1990 0.2732
0.2017 0.2804 0.2098 0.1909 0.2642 0.2864 0.2357 0.3028 0.2591
0.2606 0.2954 0.2460 0.2577 0.2655
Prochloroc 0.2832 0.2655 0.0000 0.3000 0.3542 0.2667 0.2572 0.2821
0.2530 0.2793 0.2595 0.2427 0.2701 0.2727 0.2808 0.2741 0.2820
0.3043 0.2955 0.2598 0.2887 0.0000
Bifidobact 0.3293 0.2938 0.3000 0.0000 0.3613 0.3207 0.3084 0.3068
0.3017 0.3147 0.2898 0.2633 0.2969 0.3262 0.3138 0.3418 0.3266
0.3346 0.3313 0.3089 0.1775 0.3000
Bacteroide 0.3879 0.3226 0.3542 0.3613 0.0000 0.3731 0.3605 0.3696
0.3889 0.3944 0.4034 0.3801 0.3815 0.3568 0.3962 0.3862 0.3684
0.3586 0.3853 0.3526 0.3568 0.3542
Lactococcu 0.3328 0.2183 0.2667 0.3207 0.3731 0.0000 0.1172 0.3007
0.1803 0.3137 0.1960 0.1817 0.2898 0.2945 0.1661 0.3078 0.2826
0.2917 0.3356 0.2634 0.2796 0.2667
Streptococ 0.3107 0.1990 0.2572 0.3084 0.3605 0.1172 0.0000 0.2897
0.1605 0.2961 0.1857 0.1707 0.3091 0.3081 0.1748 0.3157 0.2745
0.2989 0.3351 0.2773 0.2739 0.2572
Salmonella 0.2238 0.2732 0.2821 0.3068 0.3696 0.3007 0.2897 0.0000
0.2864 0.0358 0.2920 0.2953 0.1883 0.0995 0.3135 0.2976 0.2812
0.3067 0.1431 0.1572 0.2837 0.2821
Listeria_m 0.3013 0.2017 0.2530 0.3017 0.3889 0.1803 0.1605 0.2864
0.0000 0.2918 0.1041 0.0915 0.2837 0.2884 0.1539 0.2994 0.2964
0.2870 0.3167 0.2560 0.2662 0.2530
Enterobact 0.2245 0.2804 0.2793 0.3147 0.3944 0.3137 0.2961 0.0358
0.2918 0.0000 0.2871 0.2976 0.2038 0.0974 0.3064 0.2955 0.2790
0.3017 0.1395 0.1725 0.2819 0.2793
Staphyloco 0.3081 0.2098 0.2595 0.2898 0.4034 0.1960 0.1857 0.2920
0.1041 0.2871 0.0000 0.0861 0.3059 0.2913 0.1598 0.2914 0.2811
0.2897 0.3214 0.2609 0.2548 0.2595
Bacillus_s 0.2999 0.1909 0.2427 0.2633 0.3801 0.1817 0.1707 0.2953
0.0915 0.2976 0.0861 0.0000 0.2801 0.2949 0.1499 0.3134 0.2753
0.2889 0.3165 0.2492 0.2342 0.2427
Acidithiob 0.2109 0.2642 0.2701 0.2969 0.3815 0.2898 0.3091 0.1883
0.2837 0.2038 0.3059 0.2801 0.0000 0.2076 0.3176 0.3003 0.2740
0.2797 0.2196 0.1795 0.2717 0.2701
Vibrio_vul 0.2217 0.2864 0.2727 0.3262 0.3568 0.2945 0.3081 0.0995
0.2884 0.0974 0.2913 0.2949 0.2076 0.0000 0.3100 0.3191 0.2695
0.2968 0.1615 0.1579 0.2812 0.2727
Lactobacil 0.3420 0.2357 0.2808 0.3138 0.3962 0.1661 0.1748 0.3135
0.1539 0.3064 0.1598 0.1499 0.3176 0.3100 0.0000 0.3293 0.2972
0.3193 0.3517 0.2878 0.2677 0.2808
Campylobac 0.3112 0.3028 0.2741 0.3418 0.3862 0.3078 0.3157 0.2976
0.2994 0.2955 0.2914 0.3134 0.3003 0.3191 0.3293 0.0000 0.2917
0.1566 0.3257 0.2765 0.3112 0.2741
Bdellovibr 0.2548 0.2591 0.2820 0.3266 0.3684 0.2826 0.2745 0.2812
0.2964 0.2790 0.2811 0.2753 0.2740 0.2695 0.2972 0.2917 0.0000
0.2962 0.3019 0.2697 0.2935 0.2820
Helicobact 0.2912 0.2606 0.3043 0.3346 0.3586 0.2917 0.2989 0.3067
0.2870 0.3017 0.2897 0.2889 0.2797 0.2968 0.3193 0.1566 0.2962
0.0000 0.3105 0.2714 0.3046 0.3043
Pasteurell 0.2347 0.2954 0.2955 0.3313 0.3853 0.3356 0.3351 0.1431
0.3167 0.1395 0.3214 0.3165 0.2196 0.1615 0.3517 0.3257 0.3019
0.3105 0.0000 0.2119 0.3109 0.2955
Pseudomona 0.2018 0.2460 0.2598 0.3089 0.3526 0.2634 0.2773 0.1572
0.2560 0.1725 0.2609 0.2492 0.1795 0.1579 0.2878 0.2765 0.2697
0.2714 0.2119 0.0000 0.2798 0.2598
Streptomyc 0.3123 0.2577 0.2887 0.1775 0.3568 0.2796 0.2739 0.2837
0.2662 0.2819 0.2548 0.2342 0.2717 0.2812 0.2677 0.3112 0.2935
0.3046 0.3109 0.2798 0.0000 0.2887
Prochloro2 0.2832 0.2655 0.0000 0.3000 0.3542 0.2667 0.2572 0.2821
0.2530 0.2793 0.2595 0.2427 0.2701 0.2727 0.2808 0.2741 0.2820
0.3043 0.2955 0.2598 0.2887 0.0000
Medio Rico
Frecuencia50015002500350045005500650075008500950010500115001250013500145001550016500175001850019500205002150022500235002450025500265002750028500295003050031500325003350034500355003650037500385003950040500415004250043500445004550046500475004850049500505005150052500535005450055500565005750058500595006050061500More3149431111121110001100010100001001002010001101001000000000000011
Rango
Frecuencia
RPKM pH3.0
Frecuencia50015002500350045005500650075008500950010500115001250013500145001550016500175001850019500205002150022500235002450025500265002750028500295003050031500325003350034500355003650037500385003950040500415004250043500445004550046500475004850049500505005150052500535005450055500565005750058500595006050061500625006350064500655006650067500685006950070500715007250073500745007550076500775007850079500805008150082500835008450085500865008750088500895009050091500More21410423110200000110110010021110000011010002100010000000000000000000000000000000000001000000001
Rango
Frecuencia
RPKM sal 0.5 M
Frecuencia500150025003500450055006500750085009500105001150012500135001450015500165001750018500195002050021500225002350024500255002650027500285002950030500315003250033500345003550036500375003850039500405004150042500435004450045500465004750048500495005050051500525005350054500555005650057500585005950060500615006250063500645006550066500675006850069500705007150072500735007450075500765007750078500795008050081500825008350084500855008650087500885008950090500915009250093500945009550096500975009850099500100500101500102500103500104500105500106500107500108500109500110500111500112500113500114500115500116500117500118500119500120500121500122500123500124500125500126500127500128500129500130500131500132500133500134500135500136500137500138500139500140500141500142500More6145532010111020111101000110000100100111021000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001000000010
Rango
Frecuencia
RPKM Redox -300mV
Frecuencia500150025003500450055006500750085009500105001150012500135001450015500165001750018500195002050021500225002350024500255002650027500285002950030500315003250033500345003550036500375003850039500405004150042500435004450045500465004750048500495005050051500525005350054500555005650057500585005950060500615006250063500645006550066500675006850069500705007150072500735007450075500765007750078500795008050081500825008350084500855008650087500885008950090500915009250093500945009550096500975009850099500More25557174400101020131010000001000100001000000000000000000100000010000000000000000001100000000000000001
Rango
Frecuencia