Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i...
Transcript of Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i...
![Page 1: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/1.jpg)
Biologisk information
Med fokus på DNA
Af: Rasmus Wenersson
[[email protected] - http://www.cbs.dtu.dk/~raz/]
![Page 2: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/2.jpg)
Oversigt
Data & Databaser
Metoder
•Taxonomi
•DNA
•Protein
•Protein struktur
•Alignment
•Pairwise + Multiple
•BLAST (søgning)
•DNA / Protein
•PSI-Blast
•LOGO’er og matricer
•Fylogenetiske træer
•PyMOL (3D visualisering)
Opsamlende øvelse
![Page 3: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/3.jpg)
Læringsmål / learning objectives
• Læringsmål
– Hvad er biologisk information
– Informations flow
– Teknikken bag DNA sekventering
– Fil formater for biologisk data
– Søgning i GenBank databasen
![Page 4: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/4.jpg)
Gruppearbejde: Flow af biologisk information
• Løses i grupper på 2-3.
• Brug ~15 minutter på
opgaven.
• Diskutér i grupperne.
• Opgaven gennemgås i
fælleskab.
![Page 5: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/5.jpg)
DNA
• DNA indeholder
cellens opskrift på
proteiner og enzymer.
• Ved celledeling får
hver dattercelle en
komplet kopi af DNA.
![Page 6: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/6.jpg)
DNA alfabetet
• Informationenindeholdt i DNAstrengen kan skrives ien fire-bogstav kode:A, T, G, C.
• DNA kan sekventeresog resultatet kangemmes i en fil på encomputer.
• ATGGCCCTGTGGAT
![Page 7: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/7.jpg)
DNA skrives 5’ 3’
5’ AGCC 3’
3’ TCGG 5’
5’ ATGGCCAGGTAA 3’
DNA backbone: http://en.wikipedia.org/wiki/DNA(Deoxy)ribose: http://en.wikipedia.org/
Ribose
1
23
4
5
Deoxyribose
1
23
4
5
5’
3’
5’
3’
![Page 8: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/8.jpg)
PCR
Melting96º , 30 sec
Annealing~55º, 30 sec
Extension72º , 30 sec
35cycles
Animation: http://depts.washington.edu/~genetics/courses/genet371b-aut99/PCR_contents.html
![Page 9: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/9.jpg)
PCR
Animation: http://www.people.virginia.edu/~rjh9u/pcranim.htmlPCR graph: http://pathmicro.med.sc.edu/pcr/realtime-home.htm
![Page 10: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/10.jpg)
Gel-elektroforese
• DNA fragmenternesepareres via gel-elektroforese.– Typisk 1% argarose
– Farves med EtBr (lyserunder UV).
– DNA ”ladder” brugesindikation af kendtestørrelser.
Gel billede: http://www.pharmaceutical-technology.com/projects/roche/images/roche3.jpg
PCR opsætning: http://arbl.cvmbs.colostate.edu/hbooks/genetics/biotech/gels/agardna.html
+
-
![Page 11: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/11.jpg)
DNA sekventering
Figurer: http://www.idtdna.com/support/technical/TechnicalBulletinPDF/DNA_Sequencing.pdf
}
Terminator
Røntgen sekventeringsgel
![Page 12: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/12.jpg)
Automatiseret sekventering
• Det store gennembrud for
DNA sekventering skete
gennem automatisering.
• Fluorescerende mærkning
• Laser-baseret aflæsning
• Kapilær istedet for gel
• Computer baseret analyse
samling af sekvensen.
Figurer: http://www.idtdna.com/support/technical/TechnicalBulletinPDF/DNA_Sequencing.pdf
![Page 13: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/13.jpg)
Øvelse: ”base-calling”
• Handout: Plot af
”trace-file”.
• Arbejd sammen i
grupper på 2-3.
• Opgave: Find det
optimale interval.
![Page 14: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/14.jpg)
Biologisk data på elektronisk form
• GenBank databasen
• Formater
– FASTA
– GenBank
![Page 15: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/15.jpg)
NCBI GenBank
• GenBank er standard
databasen for DNA
sekvenser.
• Drives af NCBI: National
Center for Biotechnology
Information.
• Har eksisteret siden
1982.
• Databasen er offentlig:
Ingen restriktioner på
brug af data.
![Page 16: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/16.jpg)
FASTA
>alpha-D
ATGCTGACCGACTCTGACAAGAAGCTGGTCCTGCAGGTGTGGGAGAAGGTGATCCGCCAC
CCAGACTGTGGAGCCGAGGCCCTGGAGAGGTGCGGGCTGAGCTTGGGGAAACCATGGGCA
AGGGGGGCGACTGGGTGGGAGCCCTACAGGGCTGCTGGGGGTTGTTCGGCTGGGGGTCAG
CACTGACCATCCCGCTCCCGCAGCTGTTCACCACCTACCCCCAGACCAAGACCTACTTCC
CCCACTTCGACTTGCACCATGGCTCCGACCAGGTCCGCAACCACGGCAAGAAGGTGTTGG
CCGCCTTGGGCAACGCTGTCAAGAGCCTGGGCAACCTCAGCCAAGCCCTGTCTGACCTCA
GCGACCTGCATGCCTACAACCTGCGTGTCGACCCTGTCAACTTCAAGGCAGGCGGGGGAC
GGGGGTCAGGGGCCGGGGAGTTGGGGGCCAGGGACCTGGTTGGGGATCCGGGGCCATGCC
GGCGGTACTGAGCCCTGTTTTGCCTTGCAGCTGCTGGCGCAGTGCTTCCACGTGGTGCTG
GCCACACACCTGGGCAACGACTACACCCCGGAGGCACATGCTGCCTTCGACAAGTTCCTG
TCGGCTGTGTGCACCGTGCTGGCCGAGAAGTACAGATAA
>alpha-A
ATGGTGCTGTCTGCCAACGACAAGAGCAACGTGAAGGCCGTCTTCGGCAAAATCGGCGGC
CAGGCCGGTGACTTGGGTGGTGAAGCCCTGGAGAGGTATGTGGTCATCCGTCATTACCCC
ATCTCTTGTCTGTCTGTGACTCCATCCCATCTGCCCCCATACTCTCCCCATCCATAACTG
TCCCTGTTCTATGTGGCCCTGGCTCTGTCTCATCTGTCCCCAACTGTCCCTGATTGCCTC
TGTCCCCCAGGTTGTTCATCACCTACCCCCAGACCAAGACCTACTTCCCCCACTTCGACC
TGTCACATGGCTCCGCTCAGATCAAGGGGCACGGCAAGAAGGTGGCGGAGGCACTGGTTG
AGGCTGCCAACCACATCGATGACATCGCTGGTGCCCTCTCCAAGCTGAGCGACCTCCACG
CCCAAAAGCTCCGTGTGGACCCCGTCAACTTCAAAGTGAGCATCTGGGAAGGGGTGACCA
GTCTGGCTCCCCTCCTGCACACACCTCTGGCTACCCCCTCACCTCACCCCCTTGCTCACC
ATCTCCTTTTGCCTTTCAGCTGCTGGGTCACTGCTTCCTGGTGGTCGTGGCCGTCCACTT
CCCCTCTCTCCTGACCCCGGAGGTCCATGCTTCCCTGGACAAGTTCGTGTGTGCCGTGGG
CACCGTCCTTACTGCCAAGTACCGTTAA
(Udleveret som handout)
![Page 17: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/17.jpg)
GenBank format
• Stammer fra NCBI’s
GenBank Database
• Indeholder både DNA
sekvens og
annotering af
”features” - herunder
gener.
(Udleveret som handout)
![Page 18: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/18.jpg)
GenBank format - HEADER
LOCUS CMGLOAD 1185 bp DNA linear VRT 18-APR-2005
DEFINITION Cairina moschata (duck) gene for alpha-D globin.
ACCESSION X01831
VERSION X01831.1 GI:62724KEYWORDS alpha-globin; globin.
SOURCE Cairina moschata (Muscovy duck)
ORGANISM Cairina moschata
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Anseriformes; Anatidae; Cairina.
REFERENCE 1 (bases 1 to 1185)
AUTHORS Erbil,C. and Niessing,J.
TITLE The primary structure of the duck alpha D-globin gene: an unusual
5' splice junction sequence JOURNAL EMBO J. 2 (8), 1339-1343 (1983)
PUBMED 10872328
COMMENT Data kindly reviewed (13-NOV-1985) by J. Niessing.
![Page 19: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/19.jpg)
GenBank format - ORIGIN blok
ORIGIN
1 ctgcgtggcc tcagcccctc cacccctcca cgctgataag ataaggccag ggcgggagcg
61 cagggtgcta taagagctcg gccccgcggg tgtctccacc acagaaaccc gtcagttgcc
121 agcctgccac gccgctgccg ccatgctgac cgccgaggac aagaagctca tcgtgcaggt 181 gtgggagaag gtggctggcc accaggagga attcggaagt gaagctctgc agaggtgtgg
241 gctgggccca gggggcactc acagggtggg cagcagggag caggagccct gcagcgggtg
301 tgggctggga cccagagcgc cacggggtgc gggctgagat gggcaaagca gcagggcacc
361 aaaactgact ggcctcgctc cggcaggatg ttcctcgcct acccccagac caagacctac 421 ttcccccact tcgacctgca tcccggctct gaacaggtcc gtggccatgg caagaaagtg
481 gcggctgccc tgggcaatgc cgtgaagagc ctggacaacc tcagccaggc cctgtctgag
541 ctcagcaacc tgcatgccta caacctgcgt gttgaccctg tcaacttcaa ggcaagcggg
601 gactagggtc cttgggtctg ggggtctgag ggtgtggggt gcagggtctg ggggtccagg
661 ggtctgagtt tcctggggtc tggcagtcct gggggctgag ggccagggtc ctgtggtctt 721 gggtaccagg gtcctggggg ccagcagcca gacagcaggg gctgggattg catctgggat
781 gtgggccaga ggctgggatt gtgtttggaa tgggagctgg gcaggggcta gggccagggt
841 gggggactca gggcctcagg gggactcggg gggggactga gggagactca gggccatctg
901 tccggagcag gggtactaag ccctggtttg ccttgcagct gctggcacag tgcttccagg
961 tggtgctggc cgcacacctg ggcaaagact acagccccga gatgcatgct gcctttgaca 1021 agttcttgtc cgccgtggct gccgtgctgg ctgaaaagta cagatgagcc actgcctgca
1081 cccttgcacc ttcaataaag acaccattac cacagctctg tgtctgtgtg tgctgggact
1141 gggcatcggg ggtcccaggg agggctgggt tgcttccaca catcc
//
![Page 20: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/20.jpg)
FEATURES Location/Qualifiers source 1..1185 /organism="Cairina moschata" /mol_type="genomic DNA" /db_xref="taxon:8855" CAAT_signal 20..24 TATA_signal 69..73 precursor_RNA 101..1114 /note="primary transcript" exon 101..234 /number=1 CDS join(143..234,387..591,939..1067) /codon_start=1 /product="alpha D-globin" /protein_id="CAA25966.2" /db_xref="GI:4455876" /db_xref="GOA:P02003" /db_xref="InterPro:IPR000971" /db_xref="InterPro:IPR002338" /db_xref="InterPro:IPR002340" /db_xref="InterPro:IPR009050" /db_xref="UniProt/Swiss-Prot:P02003" /translation="MLTAEDKKLIVQVWEKVAGHQEEFGSEALQRMFLAYPQTKTYFP HFDLHPGSEQVRGHGKKVAAALGNAVKSLDNLSQALSELSNLHAYNLRVDPVNFKLLA QCFQVVLAAHLGKDYSPEMHAAFDKFLSAVAAVLAEKYR" repeat_region 227..246 /note="direct repeat 1" intron 235..386 /number=1 repeat_region 289..309 /note="direct repeat 1" exon 387..591 /number=2 intron 592..939 /number=2 exon 940..1114 /number=3 polyA_signal 1095..1100 polyA_signal 1114
GenBank format - FEATURE blok
![Page 21: Af: Rasmus Wenersson - CBS€¦ · komplet kopi af DNA. DNA alfabetet • Informationen indeholdt i DNA strengen kan skrives i en fire-bogstav kode: A, T, G, C. • DNA kan sekventeres](https://reader035.fdocuments.net/reader035/viewer/2022081621/611e71ee4a1b355825527ea5/html5/thumbnails/21.jpg)
Computer-øvelse: GenBank, data og søgning
• Arbejd sammen i
grupper af 2-3.
• Der et link’et til
øvelsesvejledningen
direkte fra
kursusprogrammet.