Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação
description
Transcript of Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação
1
Comparação entre diferentes tecnologias em banco de dados para
manipulação rápida e ubíqua de dados biológicos
Kátia de Paiva LopesOrientador: Sandro Renato Dias
Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera
2
Objetivo
Apresentar uma comparação entre duas diferentes ferramentas para manipulação de dados biológicos, com intuito de facilitar o trabalho dos profissionais de Bioinformática, que por ser uma área multidisciplinar, acolhe profissionais de diferentes formações.
3
IntroduçãoBanco de dados (RANMEZ, SHAMKAT, 2006)
repositório computacionalacesso Recuperação
Bancos de dados biológicos DNA, sequências de aminoácidos, nucleotídeos, proteínas
4
IntroduçãoPDB (Protein Data Bank):
armazena dados biológicos, flat files
Data Mining "o cruzamento de vários bancos de dados e a
descoberta de conexões impossíveis de se descobrir por outro método.” (EIRAS, 2009).
5
IntroduçãoSistemas de Gerenciamento de Banco de
Dados (SGBD’s)
OracleMySQLDB2MS SQLServer
6
Materiais e métodosNesse trabalho, para objeto de comparação,
foram utilizadas duas diferentes ferramentas:
SGBD MySQL (www.mysql.com)gratuito, diferentes sistemas operacionais, amplamente conhecido e utilizado.
Fusion Tables (BATERMAN, 2009).Google (fusiontables.googlelabs.com)Simplificação das operações de acesso aos
dados, Cloud Computing (Computação nas nuvens)
7
Materiais e MétodosO mesmo banco de dados foi criado
utilizando as ferramentas Mysql e Fusion Tables, a partir das tabelas de Dias & Nagem (2009).
Foi criada a mesma estrutura em ambos, e, para geração dos gráficos com o uso do SGBD MySQL foi criada uma aplicação com uso da linguagem PHP.
8Fig. 2 – Tela inicial da aplicação em PHP.
Fig. 1 – Parte do código da aplicação em PHP.
9
Fig. 3 – Tela inicial do Fusion Tables.
10
Em seguida, foram gerados os gráficos a partir da mesma consulta nas duas aplicações:
Fig. 4 – Arquivos PDB por método de resolução da proteína, desconsiderando os métodos: Solution NMR e X-Ray Difraction.
11
Fig. 5 – Número de arquivos PDB por valor de resolução da estrutura. Valores considerados, definidos entre 0.0 e 3.0 (ilegíveis na imagem).
Fig. 6 – Arquivos PDB por identificação do método de resolução da estrutura da proteína.
12
Fig. 7 – Visualização das tabelas
13
Resultados e Discussões
VantagensFacilidade de manipulação dos dados.Depois que o arquivo é copiado para o servidor não há necessidade de estar conectado ao banco para a importação das tabelas.Uso de Cloud Computing.Gráficos gerados automaticamente.Descarta o uso de SQL.Ubiquidade (Acessível via internet).
Fusion Tables
14
Resultados e Discussões
DesvantagensLimitação de 100 MB por planilha e 250 MB por usuário.Não funciona bem no browser Internet Explorer 8.0, mas atende as funcionalidades quando executado em modo de compatibilidade.Limitado quanto à realização de cálculos.Não há interação com outros aplicativos
Fusion Tables
15
Resultados e DiscussãoMySQL
VantagensFunciona em diferentes sistemas operacionais.Robustez para trabalhar com grande quantidade de dados.Realiza cálculos complexos.Interage com outros aplicativos.
16
Resultados e DiscussãoMySQL
DesvantagensNão faz uso de Cloud Computing.Não apresenta uma interface gráfica para manipulação dos dados.Exige conhecimentos em SQL.
17
Resultados e DiscussãoMySQL x Fusion Tables, do ponto de vista da
usabilidade:
Características MySQL Fusion TablesUso de Cloud Computing Não SimAcesso aos dados SQL GráficaCálculos complexos Sim LimitadoGeração de gráficos automaticamente
Sim Não
Interage com aplicativos Sim NãoImportação de dados .txt, .sql .xls, .csv
18
ConclusãoFusion Tables é uma boa opção para armazenamento de
dados biológicos, porque: não exige conhecimentos em alguma linguagem específica, manipulação dos dados é feita através da interface gráfica, faz uso de Cloud Computing, interpreta os dados e gera gráficos automaticamente.
MySQL, embora apresente robustez para trabalhar com grande quantidade de dados, requer o uso de SQL, e para gerar gráficos, por exemplo, é necessário que seja utilizada uma aplicação, exigindo assim: configuração de servidor web, conhecimentos sobre parametrização de gráficos, conhecimentos em Linguagem de Programação caso haja
necessidade de criação de uma aplicação.
19
ReferênciasBATERMAN, A., WOOD,M. Cloud Computing. Oxford Journals.
2009,1.
DIAS, S. R. ; Nagem, R. A. P. Residue-residue interaction database: use in the modification of proteins. In: International Network of Protein Engineering Centers, 2009, Ubatuba/SP. International Network of Protein Engineering Centers Meeting Abstract Book, 2009.
L. Eiras. O amigo do Estado. Revista Fonte - Prodemge, 142, 2009.
RANMEZ, E., SHAMKANT B.N. Introdução a Banco de Dados – Sistemas de Banco de Dados . São Paulo, 2006. 28 slides: color. Acompanha texto.
20
Agradecimentos
Faculdade Fabrai - Anhanguera