Allan Lima [email protected]. Revisão sobre BDs Biológicos Integração de Dados para DBs...
-
Upload
isabelly-cotto -
Category
Documents
-
view
217 -
download
1
Transcript of Allan Lima [email protected]. Revisão sobre BDs Biológicos Integração de Dados para DBs...
![Page 1: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/1.jpg)
Allan [email protected]
![Page 2: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/2.jpg)
Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos
◦ Aplicação de Ontologias The Gene Ontology
Desafios para a próxima geração de BDs Biológicos
![Page 3: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/3.jpg)
◦ Permitem a previsão de indivíduos com tendência a doenças Imunoterapia Evitar condições ambientais que possam
estimular uma doença Substituição de genes problemáticos (“curativo
genético”) Novas oportunidades de negócios na
◦ Medicina ◦ Agronomia◦ Zootecnia◦ Etc...
Porém, para que isto seja possível
temos que armazenar as informações
genéticas em bases de dados
![Page 4: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/4.jpg)
Então surge o conceito Bancos de Dados Biológicos◦ Guardam seqüências de ácidos nucléicos e
aminoácidos e suas respectivas anotações◦ Fornecem algoritmos para recuperação e análise
destes dados
![Page 5: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/5.jpg)
Laboratório de Genética Aplicada na UFRPE◦ Mapeamento de DNA Mitocondrial
litopenaeus vannamei já publicado no NCBI http://www.ncbi.nlm.nih.gov/Taxonomy/
Browser/wwwtax.cgi?id=6689 Hyporhamphus (unifasciatus e roberti)
e Hemirhamphus (brasiliensis e balao) Auxiliar no estudo de ecologia,
conservação ou distribuição geográfica Em processo de mapeamento
![Page 6: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/6.jpg)
The Gene Ontology
![Page 7: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/7.jpg)
Problema: Bancos de dados de biologia
molecular possuem um grande e variado montante de tipos de
dados
Mas por que?Ainda não há um padrão que as implementações
pretendem seguir
![Page 8: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/8.jpg)
Arquivos com uma dada estrutura própria◦ GenBank, ACeDB
Bancos de dados implementados via SGBD◦ Relacional, OO, OR.
Arquivos com dados em formato apropriado para execução de determinadas aplicações◦ FASTA e BLAST
Como padronizar e integrar os projetos?
![Page 9: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/9.jpg)
É um esforço colaborativo para endereçar a necessidade de
descrições dos genes em diferentes bases de dados
![Page 10: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/10.jpg)
BD RelacionalXML Flat
Files
The Gene Ontology
Search Engine
![Page 11: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/11.jpg)
Iniciado em 1998 com apenas 3 projetos◦ FlyBase (Drosophila)◦ Saccharomyces Genome Database (SGD) ◦ Mouse Genome Database (MGD)
Estado atual◦ Conjunto de ontologias que diversos projetos já
utilizam Representação dos dados biológicos e dos seus
significados (anotações) Ferramentas de busca e análise
◦ Ferramenta de edição de ontologias
![Page 12: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/12.jpg)
Padroniza◦ Processos biológicos
Estruturas anatômicas Retículo Endoplasmático Rugoso
Produtos de um gene Ribossomo
◦ Componentes celulares Série de eventos efetuados por um conjunto de
funções moleculares Transporte de glicose
![Page 13: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/13.jpg)
Padroniza (Continuação) Funções Moleculares
Atividade que ocorrem no nível molecular Catálise
Relacionamentos is_a
Simples relacionamento entre subclasses Cromossomo Nuclear is_a Cromossomo
part_of Núcleo part_of Célula O Núcleo sempre é parte de uma célula, mas nem toda
célula possui um núcleo
![Page 14: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/14.jpg)
![Page 15: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/15.jpg)
Os aquivos de definem as ontologias são distribuídos livremente◦ Modelos SQL (MySQL)◦ Definição para o formato dos FlatFiles◦ Esquemas DTD para validar aquivos XML
Há ainda um conjunto de arquivos de mapeamento para algumas bases
Go Downloads
![Page 16: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/16.jpg)
![Page 17: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/17.jpg)
termdb◦ ontologias, definições e mapeamentos para outros
bancos assocdb
◦ adiciona suporte para os produtos dos genes seqdb
◦ adiciona suporte para seqüências de proteínas seqdblite
◦ versão simplificada do bd
![Page 18: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/18.jpg)
Busca um termo da ontologia e mostra todos os produtos de gene anotados para este
Procura por produto de gene e mostra suas associações
Realiza indentificações de seqüências com o algoritmo BLAST
![Page 19: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/19.jpg)
Pontos negativos◦ Padrões podem inibir a criatividade◦ Nem sempre a adaptação é perfeita◦ Ferramenta de modelagem de ontologia bugada!?◦ Modelo obsoleto das ontologias (DTD)
Pontos positivos◦ TGO ataca o problema de padronização no
armazenamento em diversos sentidos◦ Possui uma vasta documentação
Exemplos, Definições, Tutoriais, Wiki, etc.◦ Conta com várias bases de dados◦ Comunidade de pesquisadores◦ Links para Ferramentas
![Page 20: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/20.jpg)
Compactação dos dados◦ Genoma humano ~ 3 gigabytes
Ontologias de integração Metadados para as anotações Inferência do significado das cadeias de
DNA Verssionamento
![Page 21: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/21.jpg)
![Page 22: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/22.jpg)
Seibel, L. F. B.; Lemos, M.; Lifschitz, S. Bancos de Dados de Genoma. Departamento de Informática. Pontifícia Universidade Católica do Rio de Janeiro
Laboratório de Genética e Expressão. Disponível em: http://www.lge.ibi.unicamp.br/. Último acesso: 25.07.2007
PIR: Protein Information Resource. Disponível em: http://www-nbrf.georgetown.edu/. Último acesso: 25.07.2007
GO: Gene Ontology. Disponível em: http://www.geneontology.org/. Último acesso: 25.07.2007
NCBI: National Center for Biotechnology Information. Disponível em: http://www.ncbi.nlm.nih.gov/. Último acesso: 25.07.2007
GenBank Overview. Disponível em: http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html. Último acesso: 25.07.2007
IF694 - Bancos de Dados Distribuídos e Móveis. Disponível em: http://www.cin.ufpe.br/~if694/. Último acesso: 25.07.2007
The Gene Ontology Project. Disponível em: http://www.cin.ufpe.br/~if694/. Último acesso: 25.07.2007
![Page 23: Allan Lima adsl@cin.ufpe.br. Revisão sobre BDs Biológicos Integração de Dados para DBs Biológicos ◦ Aplicação de Ontologias The Gene Ontology](https://reader034.fdocuments.net/reader034/viewer/2022051704/5706383f1a28abb8238f0a36/html5/thumbnails/23.jpg)
Allan [email protected]