Farmacognosia Reversa – automatizando a utilização de ROCS e OMEGA.
description
Transcript of Farmacognosia Reversa – automatizando a utilização de ROCS e OMEGA.
UNIVERSIDADE FEDERAL DA BAHIAFACULDADE DE FARMÁCIA
Fábio Duarte Vilas Boas
Farmacognosia Reversa – automatizando a utilização de ROCS e
OMEGA.
SALVADOR2009
Fábio Duarte Vilas Boas
Farmacognosia Reversa – automatizando a utilização de ROCS e
OMEGA.
SALVADOR2009
Artigo científico apresentado à Universidade Federal da Bahia como Trabalho de Conclusão do Curso de Farmácia tendo como orientador o Prof. Dr. Marcelo Santos Castilho.
FARMACOGNOSIA REVERSA – REFATORANDO PARADIGMAS NA
OBTENÇÃO DE ALVOS TERAPÊUTICOS.
Fábio Duarte Vilas Boas1, Marcelo Santos Castilho2
Resumo: A farmacognosia reversa visa encontrar alvos biológicos de compostos naturais pela triagem virtual ou real e identificar os recursos naturais que contêm as moléculas ativas. Tendo em vista os elevados custos no desenvolvimento de drogas as ferramentas informatizadas são cada vez mais utilizadas para reduzir custos e aumentar produtividade no desenvolvimento de novos medicamentos. Este trabalho teve como objetivo o desenvolvimento um programa de computador com tecnologia baseada na WEB, que forneça mecanismos para a execução dos sistemas proprietários ROCS e OMEGA que nativamente funcionam via linha de comando, acarretando em maior produtividade.
Palavras-chave: Farmacognosia. ROCS. OMEGA.
INTRODUÇÃO
A farmacognosia é o ramo mais antigo das ciências farmacêuticas e tem como alvo de
estudo os princípios ativos naturais, sejam animais ou vegetais. É uma ciência multidisciplinar
que contempla o estudo das propriedades físicas, químicas, bioquímicas e biológicas dos
fármacos ou dos fármacos potenciais de origem natural assim como busca novos fármacos a
partir de fontes naturais (SOCIEDADE BRASILEIRA DE FARMACOGNOSIA). A
farmacognosia reversa visa encontrar alvos biológicos de compostos naturais pela triagem
virtual ou real e identificar os recursos naturais que contêm as moléculas ativas (DO et al.,
2007).
Na área farmacêutica, as plantas e os extrativos vegetais foram e continuam sendo de
grande relevância, tendo em vista a utilização das substâncias ativas como protótipos para o
desenvolvimento de fármacos e como fontes de matérias-prima farmacêuticas, tanto para a
obtenção de fármacos (que são as substâncias ativas isoladas), como para a obtenção de
adjuvantes (produtos utilizados na produção de medicamentos), ou ainda, de medicamentos
elaborados exclusivamente a base de extratos vegetais: os medicamentos fitoterápicos
(SCHENKEL et al., 2001).
1 Graduando do curso de Farmácia da Universidade Federal da Bahia.
2 Graduado em Farmácia pela Universidade Federal da Bahia (2005), Professor substituto da Faculdade de Farmácia da Universidade Federal da Bahia. Especialista em Assistência Farmacêutica pela Universidade Federal da Bahia (2007).
A pesquisa e o desenvolvimento de medicamentos é um processo que se inicia com a
pesquisa básica de um novo composto, passando em seguida para os ensaios pré-clínicos, os
ensaios clínicos e finalizando com o registro do medicamento (SANTOS, 2009). No
desenvolvimento da pesquisa básica podemos utilizar a Farmacognosia que utiliza uma série
de técnicas laboratoriais para produzir extratos vegetais com atividade biológica, desde a
avaliação macro e microscópica da droga vegetal à produção de concentrados que preservem
os princípios ativos. As amostras obtidas servem como instrumento de pesquisa da
Farmacologia no intuito de compreender os efeitos in vivo. No processo de descoberta de
novas moléculas com propriedades farmacoterapêuticas otimizadas e que possam ser
consideradas candidatas a protótipos de novos fármacos pode-se fazer uso de tecnologia
computacional avançada para aperfeiçoar as relações estrutura atividade, racionalizando a
busca de novos alvos terapêuticos.
O Brasil possui a maior biodiversidade do planeta, neste contexto a utilização de
produtos naturais para o desenvolvimento de novos fármacos se faz muito importante, esses
são uma fonte extraordinária de moléculas ativas com alto potencial terapêutico. “Estima-se
que 40% dos medicamentos disponíveis na terapêutica atual foram desenvolvidos de fontes
naturais: 25% de plantas, 13% de microrganismos e 3% de animais” (CRAGG, 1997 apud
CALIXTO, 2003, p. 37). No caso das drogas anticancerígenas e dos antibióticos, por
exemplo, esse percentual atinge cerca de 73% para moléculas não sintéticas, sendo que 47%
são produtos naturais ou diretamente derivado. (NEWMAN; CRAGG, 2007).
Figura 1 – Todas novas entidades químicas por fonte entre 01/81 – 06/2006. N: produto natural; ND: derivado de produto natural; S: totalmente sintético; S*: produzido via síntese, porem com farmacófaro sendo ou encontrado em N;NM: imitação de N; V: vacina.
Fonte: NEWMAN; CRAGG, 2007
Segundo Rocha e colaboradores (2003) com poucas exceções de grupos isolados, não
existe ainda no país grandes investimentos em pesquisa e desenvolvimento (P&D) de novos
medicamentos. As empresas multinacionais investem em P&D de novos princípios ativos
principalmente nas matrizes. No Brasil, estes investimentos estão crescendo apesar de ainda
serem muito pequenos em relação às necessidades.
Além disto, a pesquisa e desenvolvimento de novos princípios ativos requerem alta
tecnologia e investimentos vultuosos a longo prazo. O desenvolvimento de uma nova droga é
um processo de alto risco, pois somente uma pequena minoria das moléculas candidatas a
medicamentos (1 em cada 20.000 moléculas) consegue chegar a ser utilizada na clínica
terapêutica ( ROCHA; VIEIRA; NEVES, 2003).
De acordo com DiMasi; Hansen; Grabowski, 2003 dados sobre os parâmetros do
processo de desenvolvimento de drogas sugerem que custos com P&D tem aumentado
substancialmente. Relatórios sobre os componentes específicos do processo de P & D, tais
como os sujeitos em ensaios clínicos também sugerem um aumento do custo real da inovação
farmacêutica.
Alguns estudos apontam para a questão dos custos relacionados a cada fase de teste
de novas drogas e segundo DiMasi; Hansen; Grabowski (2003) sugeriram que a variabilidade
dos custos dos medicamentos tende a aumentar com o desenvolvimento da
fase ou a quantidade de tempo que uma droga passa no teste. Custos de drogas bem sucedida
(ou seja, aqueles que conseguem a aprovação reguladora) também tendem a
ser maior e mais variável do que as drogas que falham nos testes.
A partir de um inquérito feito por DiMasi; Hansen; Grabowski (2003), tendo como
base dados de dez empresas farmacêuticas cujos dados serviram para estimar a média de custo
pré-desenvolvimento de fármacos utilizando uma associação entre custos de compostos que
foram descartados durante o teste e custos de compostos que obteve aprovação para
comercialização mostrou que a média estimada de custo é de 403 milhões de dólares por
nova droga e que até o ponto de pré-aprovação para comercialização da nova droga os custos
chegam até 802 milhões.
Tendo-se os elevados custos no desenvolvimento de drogas as ferramentas
informatizadas são cada vez mais utilizadas para reduzir custos e aumentar produtividade no
desenvolvimento de novos medicamentos.
Muitas técnicas de projeto computacional de drogas são utilizadas em várias fases do
projeto de design de drogas. No início de um projeto, técnicas de quimioinformática são
usados para selecionar os compostos de fontes disponíveis a serem analisadas. Uma vez que
alguns compostos ativos são marginalmente encontrados, técnicas de ampla pesquisa
similares são usadas para encontrar mais compostos que devem ser analisados (YOUNG,
2009).
De acordo com Young, 2009 técnicas computacionais oferecem outras opções para a
compreensão de sistemas químicos, que produzem a informação que é difícil, se não quase
impossível, de obter em análise laboratorial. As simulações por computador são menos
onerosas do que em qualquer laboratório teste.
Devido a esta relação custo-eficiência, grandes bancos de dados
de compostos são freqüentemente testadas em software. Muitos destes compostos não são
testados em laboratório. De fato, muitos compostos são concebidos
e testados em software, mas nunca sintetizam todos, devido aos maus resultados
in silico (cálculos de computador). Da mesma forma, a utilização de técnicas computacionais
para escolher os compostos para o teste resulta em um enriquecimento, o que significa
que uma percentagem mais elevada dos compostos que são testados estão ativos.
No mundo de hoje da síntese em massa e de rastreio, a velha prática de olhar para todas as
estruturas químicas em uma única folha de papel é impossível.
Projetos de design de drogas, muitas vezes implicam em dispor de dados sobre dezenas de
milhares de compostos, e às vezes centenas de milhares. O software de computador é
o meio ideal para classificar, analisar e encontrar correlações em todos esses
dados (YOUNG, 2009).
O estudo teórico e computacional das bases moleculares envolvidas no processo de
reconhecimento receptor-ligante constitui hoje uma etapa crucial para o planejamento de
fármacos terapeuticamente úteis (LNCC, [200-]). Segundo Hawkins e colaboradores (2007)
nos últimos anos a triagem virtual (VS) tem um papel importante na descoberta de novas
drogas. As metodologias com base na estrutura de compostos subdividem-se em duas classes
principais: as baseadas em proteínas e as coordenadas através da estrutura dos ligantes.
A técnica de docking proteína-ligante tem como objetivo predizer o modo de ligação
de um ligante em relação a um receptor, assim como predizer a afinidade molecular receptor-
ligante. As indústrias farmacêuticas possuem um grande interesse no desenvolvimento de
novos métodos e algoritmos de docking com maior capacidade de predição (WARREN,
2006). Pode ser dividido em duas partes: posicionamento correto do confômero e seu ligante
no contexto de uma ligação com seu reconhecimento de sucesso e uma tabela de score,
caracterizado por um ranking de probabilidade de ligação. A abordagem desta técnica resulta
muitas vezes em performance inconsistente, com origem múltipla como: i) amostragem
insuficiente de ligantes, ii) rigidez da proteína, iii) deficiência no calculo da pontuação do
score (HAWKINS et al, 2007).
No docking o ligante é extraído do complexo e a atenção esta focada exclusivamente
no volume do sitio ativo revelado pela remoção do ligante. Na triagem virtual baseada na
estrutura do ligante a proteína é descartada e o foco é a identificação de compostos que
melhor se adaptam ao volume e a disposição dos grupos funcionais do ligante (HAWKINS et
al, 2007).
O método Rapid Overlay of Chemical Structures (ROCS) alinha as moléculas com
base na sua forma e / ou similaridade química. É frequentemente utilizado em ensaios virtuais
3D de ligantes conhecidos, gerando através de uma única conformação uma lista de hits,
prevalecendo àquela com energia mínima (CALIXTO, 2003). Diante do exposto a confecção
de um ambiente com objetivo de convergência de tecnologias, de fácil acesso, escalável,
direcionado a um ambiente colaborativo, se apresenta como o aproveitamento das
oportunidades que surgem na interface da tecnologia da informação (TI) / farmácia. Toda
interface de programação do aplicativo (API) foi padronizada para o ambiente WEB,
facilitando, assim, o acesso dos utilizadores independente da estação de trabalho que o mesmo
esteja.
O presente trabalho tem como objetivo desenvolver um programa de computador
com tecnologia baseada na WEB, que forneça mecanismos de abstração para a execução
dos sistemas proprietários ROCS e OMEGA que nativamente funcionam via linha de
comando, acarretando em maior produtividade, poder de analise e facilidade de acesso
para seus usuários.
METODOLOGIA
Desenvolvimento de software
Foi confeccionado um framework Open-Source dotado interface gráfica (GUI) baseado
na Web. O projeto foi registrado na incubadora de projetos SourceForge, é licenciado
sob GNU General Public License version 3.0 (GPLv3), e inicialmente codificado para
suportar as operações via terminal dos softwares ROCS e OMEGA .
Tecnologias Utilizadas
Linguagem de programação PHP, banco de dados Mysql, Javascript/Ajax, Xhtml e CSS.
Banco de dados
Binding MOAD é um banco de dados (BD) de proteínas, disponível em
<http://www.bindingmoad.org>, que contem dados das estruturas cristalinas das mesmas e
seus respectivos ligantes. Este BD foi escolhido em virtude de ser uma das maiores coleções
de proteínas com estrutura cristalina claramente identificada e, sobretudo, com ligantes
biologicamente relevantes através de determinações experimentais, através de dados extraídos
da literatura.
Disponível em formato de arquivo CVS, ou seja, dados agrupados por um delimitador,
no caso vírgula, esta estrutura não poderia ser utilizada para o desenvolvimento do projeto,
pois seria impossível extrair informações úteis e forma concisa a baixo custo computacional,
portanto todo arquivo passou por um tratamento, tendo seu conteúdo portado para uma matriz
de dados, sendo os índices ordenados pela família das moléculas. Para cada proteína contida
neste BD, seus ligantes eram descritos como válidos ou inválidos. A filtragem de dados é
importante na utilização de técnicas de triagem virtual, embora seu objetivo primário não seja
a identificação de moléculas com atividade biológica desejada, ela é aplicada no intuído de
enriquecer a biblioteca de moléculas, eliminando compostos que são incompatíveis. Todos
ligantes inválidos foram excluídos. Após todo tratamento o BD foi portado para um banco o
dados relacional Mysql 5.0, como ilustrado na figura 1.
Figura 2- Diagrama de relacionamento para as estruturas cristalinas portado para o banco de dados relacional.
RESULTADOS E DISCUSSÃO
O desempenho com a utilização de uma interface WEB na utilização de ROCS e
OMEGA aumenta a produtividade dos seus utilizadores. Sistemas computacionais que
possuem interface de execução via linha de comando apresentam desvantagens em termos de
produtividade tomando como base processos repetitivos de análise, como é o caso da
utilização de ROCS e OMEGA. A base de dados utilizada em ChemCode possui 6,210
diferentes ligantes, portanto uma triagem virtual feita na mesma de forma unitária acarreta
uma grande dispêndio de tempo, devido a grande quantidade de dados a serem digitados e
organizados no sistema de arquivos do computador.
O uso de ChemCode limita o tempo de triagem virtual de compostos, à nível
computacional, ao poder de execução de ROCS (8 a 10 compostos por segundo) e OMEGA
(1 a 2 moléculas/segundo), pois a digitação de comandos inexiste, prevalecendo a seleção de
famílias de proteínas ou de proteínas isoladamente, sendo todo processamento feito em lote
utilizando técnicas avançadas de matriz de dados. A Figura 3 representa o módulo de
ChemCode para analises de compostos, o utilizador deve fazer o Upload de seu composto no
formato pdb, mol2 ou smile, descrever seu experimento (Campo Descrição) , selecionar
famílias de proteínas e tipos de experimento com seus parâmetros.
Figura 3 – Chemcode 0.1.1. Nova análise para um composto. Upload de composto em formato pdb,mol,smyle. Seleção de famílias de proteínas para analise.
Apenas usuários cadastrados podem acessar Chemcode, na seção Usuários do Sistema
pode-se cadastrar novos logins para acesso ao mesmo. Após o login no sistema podemos ter
opções de configurar novos parâmetros ou fazer novas analises de compostos. Parâmetros são
utilizados por OMEGA e ROCS no intuito de obter melhores resultados nos processos de
triagem virtual de compostos, alguns deles, para OMEGA, são a quantidade máxima de
confômeros que podem ser gerados (Figura 3), tempo limite de execução dentre outros.
PHARMACOGNOSY REVERSE - REFACTOR PARADIGMS IN OBTAINING
THERAPEUTIC TARGETS.
Summary: The reverse pharmacognosy aims to find biological targets of natural compounds by
virtual or actual screening and identify natural resources that contain the active molecules.
Given the high costs in drug development as computerized tools are increasingly used to
reduce costs and increase productivity in the development of new drugs. This study aimed to
develop a computer program with Web-based technology, which provides mechanisms for the
implementation of proprietary systems ROCS and OMEGA natively run from the command
line, resulting in greater productivity.
Keywords: Pharmacognosy. ROCS. OMEGA.
REFERÊNCIAS
BONDI, B. A. Characteristics of scalability and their impact on performance. Proceedings of the 2nd international workshop on Software and performance. Ontario, p. 195-203, 2000.
CACERES, A. R. et al. Aplicação de Virtual Screening para descoberta de novos potenciais inibidores de EPSPS de Mycobacterium tuberculosis. Rio Grande do Sul, IV Mostra de Pesquisa da Pós-Graduação PUCRS, 2009. Disponível em: <http://tinyurl.com/yh94mxn>. Acesso em: 13 nov. 2009.
CALIXTO, J. B. Biodiversidade como fonte de medicamentos. Ciência e Cultura. São Paulo, v. 55, n. 3, p. 37-39, jul-set. 2003.
CRAGG, M. G.; NEWMAN J. D.; SNADER M. K. Natural Products in Drug Discovery and Development. Journal of Natural Products. Maryland, v. 60, n. 1, p. 52-60, 2007.
DIMASI, A. J., HANSEN, W. R., GRABOWSKI, G. H. The price of innovation: new estimates of drug development costs. Journal of Health Economics. [S.l.], v. 22, p. 151-185, 2003.
DO, Q. T. et al. Reverse pharmacognosy: identifying biological properties for plants by means of their molecule constituents: application to meranzin. Planta Medicinal. [S.l.], v. 73, n. 12, p. 1235-1240, 2007.
LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA. Biologia Computacional. Brasil, [200-]. Disponível em: <http://arquivosweb.lncc.br/pdfs/Biologia Computacional.pdf>. Acesso em: 18 nov. 2009
NEWMAN J. D; CRAGG, M. G. Natural Products as Sources of New Drugs over the Last 25 Years. Journal of Natural Products. [S.l.], v. 70, n. 3, p. 461-477, 2007.
ROCHA K. B.; VIEIRA, N. C.; NEVES, F. A. R. A Formação em Farmácia - Perspectivas e necessidades da área de medicamentos. Formação de Recursos Humanos para Ciência, Tecnologia e Inovação. [S.l.], fev. 2003.
RUSH III, S. T. et al. A Shape-Based 3-D Scaffold Hopping Method and Its Application to a Bacterial Protein-Protein Interaction. Journal of Medicinal Chemistry. Cambridge, v. 48, n. 5, p. 1489-1495, 2005.
SANTOS, G. R. P. A pesquisa e o desenvolvimento de medicamentos. Portal Farmacêutico Virtual. [S.l.], 2009. Disponível em:
<http://www.portaleducacao.com.br/farmacia/principal/conteudo.asp?id=1096> . Acesso em: 14 nov. 2009.
SCHENKEL, E. P. et al. O espaço das plantas medicinais e suas formas derivadas na medicina científica. Caderno de Farmácia. [S.l.], v. 1, p. 65-72, 1985.
SCHNEIDER, G.; BOHM, H. Virtual screening and fast automated docking methods. Drug Discovery Today. [S.l.], v. 7, n. 1, p. 64-70, jan. 2002.
TAWA, J. G.; BABER, C. J.; HUMBLET, C. Computation of 3D queries for ROCS based virtual screens. Journal of Computer-Aided Molecular Design. Cambridge, set. 2009.
SHERIDAN, R. P.; MCGAUGHEY, G.B.; CORNELL, W.D. Multiple protein structures and multiple ligands: effects on the apparent goodness of virtual screening results. Journal of Computer-Aided Molecular Design. [S.l.], v. 22, p. 257-265, fev. 2008.
SOCIEDADE BRASILEIRA DE FARMACOGNOSIA. Curitiba, PR. Disponível em: <http://www.sbfgnosia.org.br>. Acesso em: 18 nov. 2009. UNIVERSIDADE FEDERAL DE CAMPINA GRANDE. Investimento em pesquisa e desenvolvimento não cresce no país. Campina Grande, 2008. Disponível em: < http://www.ufcg.edu.br/prt_ufcg/assessoria_imprensa/mostra_noticia.php?codigo=1947>. Acesso em: 18 nov. 2009.
WANG, R.; FANG, X.; LU, Y.; WANG, S. The PDBbind Database: Collection of Binding Affinities for Protein−Ligand Complexes with Known Three-Dimensional Structures. Journal of Medicinal Chemistry. [S.l.], v. 47, p. 2977-2980, 2004.
YOUNG, C. D. Computational Drug Design: [S.l.], p. 1-5, 2009.
ANEXO A - Diagrama entidade relacionamento do sistema ChemCode 0.1.1.
ANEXO B - Script para migração da base de dados em CSV original da Binding MOAD para
Mysql. Feito em PHP utilizando técnicas de array.