Farmacognosia Reversa – automatizando a utilização de ROCS e OMEGA.

UNIVERSIDADE FEDERAL DA BAHIAFACULDADE DE FARMÁCIA

Fábio Duarte Vilas Boas

Farmacognosia Reversa – automatizando a utilização de ROCS e

OMEGA.

SALVADOR2009

http://images.google.com.br/imgres?imgurl=http://www.cpgg.ufba.br/receitas/exemplos-marcas/logo-ufba.gif&imgrefurl=http://www.cpgg.ufba.br/receitas/receitas-poster-marcas.htm&h=488&w=354&sz=36&tbnid=j1F9Wmx0nQ8J:&tbnh=127&tbnw=92&hl=pt-BR&start=1&prev=/images?q=ufba&svnum=10&hl=pt-BR&lr=&sa=G%00%E5%A1%B9%EF%92%81%E1%B4%BB%E4%A1%BF%E2%B2%AF%E5%B6%82%E8%97%84%E6%8C%A7%00%00%EA%AE%A5

Fábio Duarte Vilas Boas

Farmacognosia Reversa – automatizando a utilização de ROCS e

OMEGA.

SALVADOR2009

Artigo científico apresentado à Universidade Federal da Bahia como Trabalho de Conclusão do Curso de Farmácia tendo como orientador o Prof. Dr. Marcelo Santos Castilho.

FARMACOGNOSIA REVERSA – REFATORANDO PARADIGMAS NA

OBTENÇÃO DE ALVOS TERAPÊUTICOS.

Fábio Duarte Vilas Boas1, Marcelo Santos Castilho2

Resumo: A farmacognosia reversa visa encontrar alvos biológicos de compostos naturais pela triagem virtual ou real e identificar os recursos naturais que contêm as moléculas ativas. Tendo em vista os elevados custos no desenvolvimento de drogas as ferramentas informatizadas são cada vez mais utilizadas para reduzir custos e aumentar produtividade no desenvolvimento de novos medicamentos. Este trabalho teve como objetivo o desenvolvimento um programa de computador com tecnologia baseada na WEB, que forneça mecanismos para a execução dos sistemas proprietários ROCS e OMEGA que nativamente funcionam via linha de comando, acarretando em maior produtividade.

Palavras-chave: Farmacognosia. ROCS. OMEGA.

INTRODUÇÃO

A farmacognosia é o ramo mais antigo das ciências farmacêuticas e tem como alvo de

estudo os princípios ativos naturais, sejam animais ou vegetais. É uma ciência multidisciplinar

que contempla o estudo das propriedades físicas, químicas, bioquímicas e biológicas dos

fármacos ou dos fármacos potenciais de origem natural assim como busca novos fármacos a

partir de fontes naturais (SOCIEDADE BRASILEIRA DE FARMACOGNOSIA). A

farmacognosia reversa visa encontrar alvos biológicos de compostos naturais pela triagem

virtual ou real e identificar os recursos naturais que contêm as moléculas ativas (DO et al.,

2007).

Na área farmacêutica, as plantas e os extrativos vegetais foram e continuam sendo de

grande relevância, tendo em vista a utilização das substâncias ativas como protótipos para o

desenvolvimento de fármacos e como fontes de matérias-prima farmacêuticas, tanto para a

obtenção de fármacos (que são as substâncias ativas isoladas), como para a obtenção de

adjuvantes (produtos utilizados na produção de medicamentos), ou ainda, de medicamentos

elaborados exclusivamente a base de extratos vegetais: os medicamentos fitoterápicos

(SCHENKEL et al., 2001).

1 Graduando do curso de Farmácia da Universidade Federal da Bahia.

2 Graduado em Farmácia pela Universidade Federal da Bahia (2005), Professor substituto da Faculdade de Farmácia da Universidade Federal da Bahia. Especialista em Assistência Farmacêutica pela Universidade Federal da Bahia (2007).

A pesquisa e o desenvolvimento de medicamentos é um processo que se inicia com a

pesquisa básica de um novo composto, passando em seguida para os ensaios pré-clínicos, os

ensaios clínicos e finalizando com o registro do medicamento (SANTOS, 2009). No

desenvolvimento da pesquisa básica podemos utilizar a Farmacognosia que utiliza uma série

de técnicas laboratoriais para produzir extratos vegetais com atividade biológica, desde a

avaliação macro e microscópica da droga vegetal à produção de concentrados que preservem

os princípios ativos. As amostras obtidas servem como instrumento de pesquisa da

Farmacologia no intuito de compreender os efeitos in vivo. No processo de descoberta de

novas moléculas com propriedades farmacoterapêuticas otimizadas e que possam ser

consideradas candidatas a protótipos de novos fármacos pode-se fazer uso de tecnologia

computacional avançada para aperfeiçoar as relações estrutura atividade, racionalizando a

busca de novos alvos terapêuticos.

O Brasil possui a maior biodiversidade do planeta, neste contexto a utilização de

produtos naturais para o desenvolvimento de novos fármacos se faz muito importante, esses

são uma fonte extraordinária de moléculas ativas com alto potencial terapêutico. “Estima-se

que 40% dos medicamentos disponíveis na terapêutica atual foram desenvolvidos de fontes

naturais: 25% de plantas, 13% de microrganismos e 3% de animais” (CRAGG, 1997 apud

CALIXTO, 2003, p. 37). No caso das drogas anticancerígenas e dos antibióticos, por

exemplo, esse percentual atinge cerca de 73% para moléculas não sintéticas, sendo que 47%

são produtos naturais ou diretamente derivado. (NEWMAN; CRAGG, 2007).

Figura 1 – Todas novas entidades químicas por fonte entre 01/81 – 06/2006. N: produto natural; ND: derivado de produto natural; S: totalmente sintético; S*: produzido via síntese, porem com farmacófaro sendo ou encontrado em N;NM: imitação de N; V: vacina.

Fonte: NEWMAN; CRAGG, 2007

Segundo Rocha e colaboradores (2003) com poucas exceções de grupos isolados, não

existe ainda no país grandes investimentos em pesquisa e desenvolvimento (P&D) de novos

medicamentos. As empresas multinacionais investem em P&D de novos princípios ativos

principalmente nas matrizes. No Brasil, estes investimentos estão crescendo apesar de ainda

serem muito pequenos em relação às necessidades.

Além disto, a pesquisa e desenvolvimento de novos princípios ativos requerem alta

tecnologia e investimentos vultuosos a longo prazo. O desenvolvimento de uma nova droga é

um processo de alto risco, pois somente uma pequena minoria das moléculas candidatas a

medicamentos (1 em cada 20.000 moléculas) consegue chegar a ser utilizada na clínica

terapêutica ( ROCHA; VIEIRA; NEVES, 2003).

De acordo com DiMasi; Hansen; Grabowski, 2003 dados sobre os parâmetros do

processo de desenvolvimento de drogas sugerem que custos com P&D tem aumentado

substancialmente. Relatórios sobre os componentes específicos do processo de P & D, tais

como os sujeitos em ensaios clínicos também sugerem um aumento do custo real da inovação

farmacêutica.

Alguns estudos apontam para a questão dos custos relacionados a cada fase de teste

de novas drogas e segundo DiMasi; Hansen; Grabowski (2003) sugeriram que a variabilidade

dos custos dos medicamentos tende a aumentar com o desenvolvimento da

fase ou a quantidade de tempo que uma droga passa no teste. Custos de drogas bem sucedida

(ou seja, aqueles que conseguem a aprovação reguladora) também tendem a

ser maior e mais variável do que as drogas que falham nos testes.

A partir de um inquérito feito por DiMasi; Hansen; Grabowski (2003), tendo como

base dados de dez empresas farmacêuticas cujos dados serviram para estimar a média de custo

pré-desenvolvimento de fármacos utilizando uma associação entre custos de compostos que

foram descartados durante o teste e custos de compostos que obteve aprovação para

comercialização mostrou que a média estimada de custo é de 403 milhões de dólares por

nova droga e que até o ponto de pré-aprovação para comercialização da nova droga os custos

chegam até 802 milhões.

Tendo-se os elevados custos no desenvolvimento de drogas as ferramentas

informatizadas são cada vez mais utilizadas para reduzir custos e aumentar produtividade no

desenvolvimento de novos medicamentos.

Muitas técnicas de projeto computacional de drogas são utilizadas em várias fases do

projeto de design de drogas. No início de um projeto, técnicas de quimioinformática são

usados para selecionar os compostos de fontes disponíveis a serem analisadas. Uma vez que

alguns compostos ativos são marginalmente encontrados, técnicas de ampla pesquisa

similares são usadas para encontrar mais compostos que devem ser analisados (YOUNG,

2009).

De acordo com Young, 2009 técnicas computacionais oferecem outras opções para a

compreensão de sistemas químicos, que produzem a informação que é difícil, se não quase

impossível, de obter em análise laboratorial. As simulações por computador são menos

onerosas do que em qualquer laboratório teste.

Devido a esta relação custo-eficiência, grandes bancos de dados

de compostos são freqüentemente testadas em software. Muitos destes compostos não são

testados em laboratório. De fato, muitos compostos são concebidos

e testados em software, mas nunca sintetizam todos, devido aos maus resultados

in silico (cálculos de computador). Da mesma forma, a utilização de técnicas computacionais

para escolher os compostos para o teste resulta em um enriquecimento, o que significa

que uma percentagem mais elevada dos compostos que são testados estão ativos.

No mundo de hoje da síntese em massa e de rastreio, a velha prática de olhar para todas as

estruturas químicas em uma única folha de papel é impossível.

Projetos de design de drogas, muitas vezes implicam em dispor de dados sobre dezenas de

milhares de compostos, e às vezes centenas de milhares. O software de computador é

o meio ideal para classificar, analisar e encontrar correlações em todos esses

dados (YOUNG, 2009).

O estudo teórico e computacional das bases moleculares envolvidas no processo de

reconhecimento receptor-ligante constitui hoje uma etapa crucial para o planejamento de

fármacos terapeuticamente úteis (LNCC, [200-]). Segundo Hawkins e colaboradores (2007)

nos últimos anos a triagem virtual (VS) tem um papel importante na descoberta de novas

drogas. As metodologias com base na estrutura de compostos subdividem-se em duas classes

principais: as baseadas em proteínas e as coordenadas através da estrutura dos ligantes.

A técnica de docking proteína-ligante tem como objetivo predizer o modo de ligação

de um ligante em relação a um receptor, assim como predizer a afinidade molecular receptor-

ligante. As indústrias farmacêuticas possuem um grande interesse no desenvolvimento de

novos métodos e algoritmos de docking com maior capacidade de predição (WARREN,

2006). Pode ser dividido em duas partes: posicionamento correto do confômero e seu ligante

no contexto de uma ligação com seu reconhecimento de sucesso e uma tabela de score,

caracterizado por um ranking de probabilidade de ligação. A abordagem desta técnica resulta

muitas vezes em performance inconsistente, com origem múltipla como: i) amostragem

insuficiente de ligantes, ii) rigidez da proteína, iii) deficiência no calculo da pontuação do

score (HAWKINS et al, 2007).

No docking o ligante é extraído do complexo e a atenção esta focada exclusivamente

no volume do sitio ativo revelado pela remoção do ligante. Na triagem virtual baseada na

estrutura do ligante a proteína é descartada e o foco é a identificação de compostos que

melhor se adaptam ao volume e a disposição dos grupos funcionais do ligante (HAWKINS et

al, 2007).

O método Rapid Overlay of Chemical Structures (ROCS) alinha as moléculas com

base na sua forma e / ou similaridade química. É frequentemente utilizado em ensaios virtuais

3D de ligantes conhecidos, gerando através de uma única conformação uma lista de hits,

prevalecendo àquela com energia mínima (CALIXTO, 2003). Diante do exposto a confecção

de um ambiente com objetivo de convergência de tecnologias, de fácil acesso, escalável,

direcionado a um ambiente colaborativo, se apresenta como o aproveitamento das

oportunidades que surgem na interface da tecnologia da informação (TI) / farmácia. Toda

interface de programação do aplicativo (API) foi padronizada para o ambiente WEB,

facilitando, assim, o acesso dos utilizadores independente da estação de trabalho que o mesmo

esteja.

O presente trabalho tem como objetivo desenvolver um programa de computador

com tecnologia baseada na WEB, que forneça mecanismos de abstração para a execução

dos sistemas proprietários ROCS e OMEGA que nativamente funcionam via linha de

comando, acarretando em maior produtividade, poder de analise e facilidade de acesso

para seus usuários.

METODOLOGIA

Desenvolvimento de software

Foi confeccionado um framework Open-Source dotado interface gráfica (GUI) baseado

na Web. O projeto foi registrado na incubadora de projetos SourceForge, é licenciado

sob GNU General Public License version 3.0 (GPLv3), e inicialmente codificado para

suportar as operações via terminal dos softwares ROCS e OMEGA .

Tecnologias Utilizadas

Linguagem de programação PHP, banco de dados Mysql, Javascript/Ajax, Xhtml e CSS.

Banco de dados

Binding MOAD é um banco de dados (BD) de proteínas, disponível em

<http://www.bindingmoad.org>, que contem dados das estruturas cristalinas das mesmas e

seus respectivos ligantes. Este BD foi escolhido em virtude de ser uma das maiores coleções

de proteínas com estrutura cristalina claramente identificada e, sobretudo, com ligantes

biologicamente relevantes através de determinações experimentais, através de dados extraídos

da literatura.

Disponível em formato de arquivo CVS, ou seja, dados agrupados por um delimitador,

no caso vírgula, esta estrutura não poderia ser utilizada para o desenvolvimento do projeto,

pois seria impossível extrair informações úteis e forma concisa a baixo custo computacional,

portanto todo arquivo passou por um tratamento, tendo seu conteúdo portado para uma matriz

de dados, sendo os índices ordenados pela família das moléculas. Para cada proteína contida

neste BD, seus ligantes eram descritos como válidos ou inválidos. A filtragem de dados é

importante na utilização de técnicas de triagem virtual, embora seu objetivo primário não seja

a identificação de moléculas com atividade biológica desejada, ela é aplicada no intuído de

enriquecer a biblioteca de moléculas, eliminando compostos que são incompatíveis. Todos

ligantes inválidos foram excluídos. Após todo tratamento o BD foi portado para um banco o

dados relacional Mysql 5.0, como ilustrado na figura 1.

Figura 2- Diagrama de relacionamento para as estruturas cristalinas portado para o banco de dados relacional.

RESULTADOS E DISCUSSÃO

O desempenho com a utilização de uma interface WEB na utilização de ROCS e

OMEGA aumenta a produtividade dos seus utilizadores. Sistemas computacionais que

possuem interface de execução via linha de comando apresentam desvantagens em termos de

produtividade tomando como base processos repetitivos de análise, como é o caso da

utilização de ROCS e OMEGA. A base de dados utilizada em ChemCode possui 6,210

diferentes ligantes, portanto uma triagem virtual feita na mesma de forma unitária acarreta

uma grande dispêndio de tempo, devido a grande quantidade de dados a serem digitados e

organizados no sistema de arquivos do computador.

O uso de ChemCode limita o tempo de triagem virtual de compostos, à nível

computacional, ao poder de execução de ROCS (8 a 10 compostos por segundo) e OMEGA

(1 a 2 moléculas/segundo), pois a digitação de comandos inexiste, prevalecendo a seleção de

famílias de proteínas ou de proteínas isoladamente, sendo todo processamento feito em lote

utilizando técnicas avançadas de matriz de dados. A Figura 3 representa o módulo de

ChemCode para analises de compostos, o utilizador deve fazer o Upload de seu composto no

formato pdb, mol2 ou smile, descrever seu experimento (Campo Descrição) , selecionar

famílias de proteínas e tipos de experimento com seus parâmetros.

Figura 3 – Chemcode 0.1.1. Nova análise para um composto. Upload de composto em formato pdb,mol,smyle. Seleção de famílias de proteínas para analise.

Apenas usuários cadastrados podem acessar Chemcode, na seção Usuários do Sistema

pode-se cadastrar novos logins para acesso ao mesmo. Após o login no sistema podemos ter

opções de configurar novos parâmetros ou fazer novas analises de compostos. Parâmetros são

utilizados por OMEGA e ROCS no intuito de obter melhores resultados nos processos de

triagem virtual de compostos, alguns deles, para OMEGA, são a quantidade máxima de

confômeros que podem ser gerados (Figura 3), tempo limite de execução dentre outros.

PHARMACOGNOSY REVERSE - REFACTOR PARADIGMS IN OBTAINING

THERAPEUTIC TARGETS.

Summary: The reverse pharmacognosy aims to find biological targets of natural compounds by

virtual or actual screening and identify natural resources that contain the active molecules.

Given the high costs in drug development as computerized tools are increasingly used to

reduce costs and increase productivity in the development of new drugs. This study aimed to

develop a computer program with Web-based technology, which provides mechanisms for the

implementation of proprietary systems ROCS and OMEGA natively run from the command

line, resulting in greater productivity.

Keywords: Pharmacognosy. ROCS. OMEGA.

REFERÊNCIAS

BONDI, B. A. Characteristics of scalability and their impact on performance. Proceedings of the 2nd international workshop on Software and performance. Ontario, p. 195-203, 2000.

CACERES, A. R. et al. Aplicação de Virtual Screening para descoberta de novos potenciais inibidores de EPSPS de Mycobacterium tuberculosis. Rio Grande do Sul, IV Mostra de Pesquisa da Pós-Graduação PUCRS, 2009. Disponível em: <http://tinyurl.com/yh94mxn>. Acesso em: 13 nov. 2009.

CALIXTO, J. B. Biodiversidade como fonte de medicamentos. Ciência e Cultura. São Paulo, v. 55, n. 3, p. 37-39, jul-set. 2003.

CRAGG, M. G.; NEWMAN J. D.; SNADER M. K. Natural Products in Drug Discovery and Development. Journal of Natural Products. Maryland, v. 60, n. 1, p. 52-60, 2007.

DIMASI, A. J., HANSEN, W. R., GRABOWSKI, G. H. The price of innovation: new estimates of drug development costs. Journal of Health Economics. [S.l.], v. 22, p. 151-185, 2003.

DO, Q. T. et al. Reverse pharmacognosy: identifying biological properties for plants by means of their molecule constituents: application to meranzin. Planta Medicinal. [S.l.], v. 73, n. 12, p. 1235-1240, 2007.

LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA. Biologia Computacional. Brasil, [200-]. Disponível em: <http://arquivosweb.lncc.br/pdfs/Biologia Computacional.pdf>. Acesso em: 18 nov. 2009

NEWMAN J. D; CRAGG, M. G. Natural Products as Sources of New Drugs over the Last 25 Years. Journal of Natural Products. [S.l.], v. 70, n. 3, p. 461-477, 2007.

ROCHA K. B.; VIEIRA, N. C.; NEVES, F. A. R. A Formação em Farmácia - Perspectivas e necessidades da área de medicamentos. Formação de Recursos Humanos para Ciência, Tecnologia e Inovação. [S.l.], fev. 2003.

RUSH III, S. T. et al. A Shape-Based 3-D Scaffold Hopping Method and Its Application to a Bacterial Protein-Protein Interaction. Journal of Medicinal Chemistry. Cambridge, v. 48, n. 5, p. 1489-1495, 2005.

SANTOS, G. R. P. A pesquisa e o desenvolvimento de medicamentos. Portal Farmacêutico Virtual. [S.l.], 2009. Disponível em:

<http://www.portaleducacao.com.br/farmacia/principal/conteudo.asp?id=1096> . Acesso em: 14 nov. 2009.

SCHENKEL, E. P. et al. O espaço das plantas medicinais e suas formas derivadas na medicina científica. Caderno de Farmácia. [S.l.], v. 1, p. 65-72, 1985.

SCHNEIDER, G.; BOHM, H. Virtual screening and fast automated docking methods. Drug Discovery Today. [S.l.], v. 7, n. 1, p. 64-70, jan. 2002.

TAWA, J. G.; BABER, C. J.; HUMBLET, C. Computation of 3D queries for ROCS based virtual screens. Journal of Computer-Aided Molecular Design. Cambridge, set. 2009.

SHERIDAN, R. P.; MCGAUGHEY, G.B.; CORNELL, W.D. Multiple protein structures and multiple ligands: effects on the apparent goodness of virtual screening results. Journal of Computer-Aided Molecular Design. [S.l.], v. 22, p. 257-265, fev. 2008.

SOCIEDADE BRASILEIRA DE FARMACOGNOSIA. Curitiba, PR. Disponível em: <http://www.sbfgnosia.org.br>. Acesso em: 18 nov. 2009. UNIVERSIDADE FEDERAL DE CAMPINA GRANDE. Investimento em pesquisa e desenvolvimento não cresce no país. Campina Grande, 2008. Disponível em: < http://www.ufcg.edu.br/prt_ufcg/assessoria_imprensa/mostra_noticia.php?codigo=1947>. Acesso em: 18 nov. 2009.

WANG, R.; FANG, X.; LU, Y.; WANG, S. The PDBbind Database: Collection of Binding Affinities for Protein−Ligand Complexes with Known Three-Dimensional Structures. Journal of Medicinal Chemistry. [S.l.], v. 47, p. 2977-2980, 2004.

YOUNG, C. D. Computational Drug Design: [S.l.], p. 1-5, 2009.

ANEXO A - Diagrama entidade relacionamento do sistema ChemCode 0.1.1.

ANEXO B - Script para migração da base de dados em CSV original da Binding MOAD para

Mysql. Feito em PHP utilizando técnicas de array.

Farmacognosia Reversa – automatizando a utilização de ROCS e OMEGA.

Documents

Transcript of Farmacognosia Reversa – automatizando a utilização de ROCS e OMEGA.