Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

1

Comparação entre diferentes tecnologias em banco de dados para

manipulação rápida e ubíqua de dados biológicos

Kátia de Paiva LopesOrientador: Sandro Renato Dias

Departamento de Sistemas de Informação Faculdade Fabrai-Anhanguera

2

Objetivo

Apresentar uma comparação entre duas diferentes ferramentas para manipulação de dados biológicos, com intuito de facilitar o trabalho dos profissionais de Bioinformática, que por ser uma área multidisciplinar, acolhe profissionais de diferentes formações.

3

IntroduçãoBanco de dados (RANMEZ, SHAMKAT, 2006)

repositório computacionalacesso Recuperação

Bancos de dados biológicos DNA, sequências de aminoácidos, nucleotídeos, proteínas

4

IntroduçãoPDB (Protein Data Bank):

armazena dados biológicos, flat files

Data Mining "o cruzamento de vários bancos de dados e a

descoberta de conexões impossíveis de se descobrir por outro método.” (EIRAS, 2009).

5

IntroduçãoSistemas de Gerenciamento de Banco de

Dados (SGBD’s)

OracleMySQLDB2MS SQLServer

6

Materiais e métodosNesse trabalho, para objeto de comparação,

foram utilizadas duas diferentes ferramentas:

SGBD MySQL (www.mysql.com)gratuito, diferentes sistemas operacionais, amplamente conhecido e utilizado.

Fusion Tables (BATERMAN, 2009).Google (fusiontables.googlelabs.com)Simplificação das operações de acesso aos

dados, Cloud Computing (Computação nas nuvens)

7

Materiais e MétodosO mesmo banco de dados foi criado

utilizando as ferramentas Mysql e Fusion Tables, a partir das tabelas de Dias & Nagem (2009).

Foi criada a mesma estrutura em ambos, e, para geração dos gráficos com o uso do SGBD MySQL foi criada uma aplicação com uso da linguagem PHP.

8Fig. 2 – Tela inicial da aplicação em PHP.

Fig. 1 – Parte do código da aplicação em PHP.

9

Fig. 3 – Tela inicial do Fusion Tables.

10

Em seguida, foram gerados os gráficos a partir da mesma consulta nas duas aplicações:

Fig. 4 – Arquivos PDB por método de resolução da proteína, desconsiderando os métodos: Solution NMR e X-Ray Difraction.

11

Fig. 5 – Número de arquivos PDB por valor de resolução da estrutura. Valores considerados, definidos entre 0.0 e 3.0 (ilegíveis na imagem).

Fig. 6 – Arquivos PDB por identificação do método de resolução da estrutura da proteína.

12

Fig. 7 – Visualização das tabelas

13

Resultados e Discussões

VantagensFacilidade de manipulação dos dados.Depois que o arquivo é copiado para o servidor não há necessidade de estar conectado ao banco para a importação das tabelas.Uso de Cloud Computing.Gráficos gerados automaticamente.Descarta o uso de SQL.Ubiquidade (Acessível via internet).

Fusion Tables

14

Resultados e Discussões

DesvantagensLimitação de 100 MB por planilha e 250 MB por usuário.Não funciona bem no browser Internet Explorer 8.0, mas atende as funcionalidades quando executado em modo de compatibilidade.Limitado quanto à realização de cálculos.Não há interação com outros aplicativos

Fusion Tables

15

Resultados e DiscussãoMySQL

VantagensFunciona em diferentes sistemas operacionais.Robustez para trabalhar com grande quantidade de dados.Realiza cálculos complexos.Interage com outros aplicativos.

16

Resultados e DiscussãoMySQL

DesvantagensNão faz uso de Cloud Computing.Não apresenta uma interface gráfica para manipulação dos dados.Exige conhecimentos em SQL.

17

Resultados e DiscussãoMySQL x Fusion Tables, do ponto de vista da

usabilidade:

Características MySQL Fusion TablesUso de Cloud Computing Não SimAcesso aos dados SQL GráficaCálculos complexos Sim LimitadoGeração de gráficos automaticamente

Sim Não

Interage com aplicativos Sim NãoImportação de dados .txt, .sql .xls, .csv

18

ConclusãoFusion Tables é uma boa opção para armazenamento de

dados biológicos, porque: não exige conhecimentos em alguma linguagem específica, manipulação dos dados é feita através da interface gráfica, faz uso de Cloud Computing, interpreta os dados e gera gráficos automaticamente.

MySQL, embora apresente robustez para trabalhar com grande quantidade de dados, requer o uso de SQL, e para gerar gráficos, por exemplo, é necessário que seja utilizada uma aplicação, exigindo assim: configuração de servidor web, conhecimentos sobre parametrização de gráficos, conhecimentos em Linguagem de Programação caso haja

necessidade de criação de uma aplicação.

19

ReferênciasBATERMAN, A., WOOD,M. Cloud Computing. Oxford Journals.

2009,1.

DIAS, S. R. ; Nagem, R. A. P. Residue-residue interaction database: use in the modification of proteins. In: International Network of Protein Engineering Centers, 2009, Ubatuba/SP. International Network of Protein Engineering Centers Meeting Abstract Book, 2009.

L. Eiras. O amigo do Estado. Revista Fonte - Prodemge, 142, 2009.

RANMEZ, E., SHAMKANT B.N. Introdução a Banco de Dados – Sistemas de Banco de Dados . São Paulo, 2006. 28 slides: color. Acompanha texto.

20

Agradecimentos

Faculdade Fabrai - Anhanguera

Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação

Documents

Transcript of Kátia de Paiva Lopes Orientador: Sandro Renato Dias Departamento de Sistemas de Informação