Post on 20-Oct-2018
DEZ ANOS DE GENOMA HUMANO
Autora: Maria de Lurdes Donadon Leal1
Orientadora: Maria Claudia Colla Ruvolo Takasusuki2
RESUMO
Os fatos que desencadearam o trabalho de sequenciamento automatizado dos
genomas; as técnicas fundamentais ao sucesso deste projeto; além dos
procedimentos adotados após a disponibilização das sequências em banco de
dados: são tópicos deste artigo com intuito de adotá-los em sala de aula de ensino
médio. São conteúdos recentes envolvidos em termos de definições precisas, tais
como as distinções entre DNA e cDNA; ou entre RNA, dsRNA, siRNA, miRNA e
RNAi; entre outras. Apesar da aparente complexidade dos temas relacionados, a
atualização desses conteúdos, através do estudo criterioso das publicações
científicas recentes, é a chave para transmiti-los com aproveitamento máximo. Os
momentos históricos marcados por grandes mudanças conceituais exigem, da
relação ensino-aprendizagem, o esforço no sentido da apropriação dos conceitos
inéditos. No entanto, momentos de crise do antigo, geralmente, significam a
consagração de novos fundamentos; expectativas de cura; ou diferentes métodos de
diagnósticos clínicos. Por este motivo é preciso encarar estas mudanças com muita
leitura e, quando a estrutura escolar permitir, alguma observação laboratorial. Urge
também retomar o hábito de elaborar, a partir dessa fundamentação teórica
emergente, atividades de fixação mais apropriadas, em sala de aula, que unam as
clássicas práticas pedagógicas em biologia àquelas que ainda poderão ser bem-
sucedidas.
Palavras-chave: Genoma Humano; Expressão dos Genes; Genômica; Ensino-
Aprendizagem.
1 Especialista em Biologia Celular; graduada em Ciências Biológicas; professora do Colégio Estadual Dr. Gastão
Vidigal Ensino Fundamental, Médio e Profissionalizante, Maringá. 2Doutora em Genética e Evolução pela Universidade Federal de São Carlos; Professora Associada da
Universidade Estadual de Maringá.
INTRODUÇÃO
As recentes descobertas da biologia, em especial, da genética, têm exigido,
em sala de aula, novas abordagens, sobretudo porque as tecnologias envolvidas
nestas descobertas tornam-nas obscuras em muitos aspectos. O esclarecimento
desses aspectos depende da sintonia entre a prática pedagógica e a fundamentação
teórica sempre atualizadas. Isto significa, basicamente, que é necessário
desenvolver novos meios de relacionar, em aula, os conhecimentos biológicos e
genéticos com outras áreas, tão diversas quanto as tecnologias da informação e da
manipulação automatizada em laboratórios, além da ética e as implicações sociais
de tais tecnologias. Alguns dos conteúdos, relevantes para a compreensão das
investigações realizadas pelos geneticistas, são comentados neste artigo, com
ênfase nos processos históricos que levaram aos domínios desses conteúdos; e
também nos meios de manipulação mais comuns nos laboratórios modernos. Não
pode deixar de ser observado que muitos desses métodos ainda são questionados,
tanto no referente à importância para a terapia gênica; quanto no que diz respeito
aos perigos ao ambiente e à vida como um todo.
No entanto, há que se comemorar o fato de a maioria desses meios de
manipulação gênica constituir-se em promessa de cura para muitas doenças; ou de
auxilio a outras, através de testes; que também são usados em resoluções de
problemas judiciais. O fato de existirem pontos positivos ainda não bem explicitados
faz destas investigações em biotecnologia atrativas, uma vez que, como tudo indica,
há muito ainda a ser desvendado no amplo universo do código genético.
O futuro do genoma precisa de uma sociedade informada sobre os
acontecimentos moleculares, nos níveis do dogma central da biologia; pois tais
acontecimentos, no século XXI, já fazem parte das definições de verbas públicas,
sendo, portanto, alvos de muitas especulações.
Sendo assim, os estudantes têm o direito de ter consciência dos pormenores
destes acontecimentos, de preferência através de explicações claras e ilustradas,
para que nenhum procedimento passe sem ser compreendido, experimentado e
avaliado. Este é, portanto, o objetivo maior deste artigo, que apresenta alguns
experimentos desenvolvidos por pesquisadores renomados em genética e biologia,
que ainda vêm resultando em transformações e revoluções nos modos de abordar
os organismos e as suas características hereditárias.
O futuro das atividades e das intervenções pedagógicas está aberto, tal
como estão abertas as ferramentas de visualização e navegação em modelos, nas
três dimensões, de proteínas e enzimas; ou nos mapas físicos ou genéticos. A
atenção redobrada para as escolhas de imagens animadas, de processos
bioquímicos das células, tecidos e organismos, vídeos estes disponíveis em grande
número na internet, em sites educativos ou de laboratórios, têm a capacidade de
ilustrar com extremo realismo alguns acontecimentos descritivos em sala de aula. No
entanto, nosso estudo é em primeiro lugar destinado às formas simples de abordar a
linguagem genética; formas simples, porém, elementares como o bê-a-bá do
genoma. O universo da linguagem da vida é escrito com poucas unidades (A,T,C,G),
que se combinam, às vezes criando trincas de códons; outras vezes desencadeando
repetições em lugares diferentes. Em alguns pontos os genes são invadidos por
transposons e T-DNA; em alguns outros, por mutações e substituições inesperadas,
quando se comparam genes mutantes com o gene normal, revelando, assim, no
complexo código genético, o seu aspecto vulnerável. A mera substituição de um par
de bases e toda a transcrição é prejudicada. Neste universo de tamanha sutileza de
combinações de signos, que se expressam reguladas no espaço e no tempo;
reguladas, muitas vezes, por fatores ambientais; as atividades em sala de aula
requerem aquele jeito prático de transmitir o conteúdo científico, que geralmente
manipula e descreve aquilo que os olhos não veem.
ORIGENS DO PROJETO GENOMA HUMANO
A genética clássica vinha se desenvolvendo lentamente desde Gregor
Mendel, em 1866; passando pela teoria cromossômica da hereditariedade, de
Sutton-Boveri, em 1902; até a comprovação de que o DNA é o princípio
transformador das células, realizada por Oswald Avery, em 1944. Mas, desde que
foram descobertos todos os elementos que compõem os ácidos nucléicos, o foco
saiu da mera busca de suas partes e passou a ser o DNA todo, uma vez que os
pesquisadores sabiam que ali estava o código das instruções hereditárias, levando-
os a tornar prioridade a determinação de sua estrutura. O método mais usado para
estudar a estrutura atômica de uma molécula era o da difração de raios X; e os
principais envolvidos nesta pesquisa eram Maurice Wilkins e Rosalind Franklin,
ambos do laboratório de biofísica do King‟s College, Londres. Eles estavam cada
vez mais convencidos de que o DNA possuía uma estrutura regular e, em 1951,
Wilkins apostava numa estrutura em forma de hélice, mas acreditava que existiam
três cadeias em hélices, chegando a esta conclusão “com base nas medições que
realizara da densidade das fibras de DNA” (WATSON, 2005, p. 59). Em novembro
deste mesmo ano, Franklin apresentou em seminário as medidas que fizera das
repetições cristalográficas e do conteúdo aquoso do DNA cristalino, que se revelava,
portanto, ser muito rico em água. Estas novas informações inspiraram Francis Crick
e James Watson na criação de um primeiro modelo de DNA, contendo três cadeias
de hélices no centro da molécula, modelo este que foi reprovado por Rosalind
Franklin, por ela acreditar que o esqueleto em forma de hélices precisaria ser
localizado no lado de fora da molécula, “para poder acomodar todas as moléculas de
água que ela observara nos cristais” (WATSON, 2005, p. 61). Neste período, Erwin
Chargaff havia realizado uma descoberta importante, a de que ocorriam, no DNA,
quantidades iguais do par adenina e timina; o mesmo ocorrendo com o par de bases
citosina e guanina.
Este fato levou Crick e Watson a concluírem que estes pares de bases
atraíam-se entre si. De posse agora das descobertas de Chargaff, James Watson
procurou desvendar como as bases ligam-se entre si por hidrogênio. Assim, ele
concluiu, levando em consideração a regularidade na difração dos raios X, que os
átomos de hidrogênio ficam no centro da estrutura, formando os pares de bases,
adenina ligada a timina (A=T) e citosina ligada a guanina (C≡G). Isso resolvido,
Watson e Crick, em 28 de fevereiro de 1953, apresentaram ao mundo o modelo da
dupla-hélice e explicaram a síntese de DNA dessa forma: “A molécula se „desdobra‟
para formar duas fitas separadas. Cada fita serve então de modelo para a síntese de
uma nova fita – e uma dupla-hélice se torna duas” (WATSON, 2005, p. 65). Para
confirmar definitivamente esta hipótese, Arthur Kornberg descobriu a enzima que
une os componentes do DNA e estabelece as ligações químicas do seu esqueleto, a
enzima DNA polimerase, responsável pela replicação do DNA, formando uma cópia
complementar.
Mas, a grande questão que atraía os pesquisadores ao DNA ainda
continuava sem resposta: Como é que os fatores de Mendel afetam o formato das
ervilhas? Claro que estas respostas vinham sendo formuladas desde 1902, com
Garrod; mas em 1941, na Universidade de Stanford, George Beadle e Edward
Tatum, ao fazerem um estudo sobre as mutações induzidas em bolor rosado do pão,
perceberam que cada mutação ocorrida nos fungos estudados tornava inoperante
uma enzima específica, impedindo o mofo de se desenvolver. Esses experimentos
ficaram conhecidos na época como teoria “um gene – uma enzima”, hoje ampliada
para “um gene – um polipeptídeo” (WATSON, 2005, pp. 77-78). Enquanto isso,
Linus Pauling e Harney Itano, sugeriram que os genes pudessem fornecer
informações sobre as proteínas; e chegaram a esta conclusão depois de verificarem
que a anemia falciforme, ou siclemia, doença que deixa as hemácias com o formato
de foice, era causada por uma mutação no gene da hemoglobina, alguma
substituição no nucleotídeo que afetaria a composição química desta proteína. Esta
mutação foi confirmada em 1956: Vernon Ingran descobriu que um único aminoácido
era o responsável pela mutação verificada na hemoglobina por Pauling e Itano, na
qual o ácido glutâmico, encontrado na posição 6 da cadeia protéica normal, é
substituído pela valina na hemoglobina falciforme (WATSON, 2005, p.80). Era a
prova de que as mutações gênicas no DNA podiam ser associadas às diferenças
nas sequências de aminoácidos das proteínas; ou seja, através da proteína, o DNA
exerce controle sobre as células e sobre a vida.
O próximo passo seria descobrir como as informações codificadas no DNA
(no encadeamento de nucleotídeos) convertem-se em proteína (um encadeamento
de aminoácidos). Quando, em 1959, descobriu-se a enzima RNA polimerase, que
catalisa a produção da cadeia de RNA, com uma só fita, a partir de moldes de DNA,
que tem duas fitas; foi também confirmado que “DNA-RNA-proteina” constitui, como
antes havia dito Crick, o “dogma central” da genética (WATSON, 2005, p. 83).
Quando Paul Zamecnik e Mahlon Hoagland identificaram o ribossomo, contendo
duas cadeias de RNA ribossômico, como o local onde ocorre a síntese protéica,
confirmou-se que o os aminoácidos eram transportados até ali por moléculas de
RNA, depois chamados RNA transportadores. A dupla de pesquisadores descobriu
ainda que o RNA transportador possui um anticódon, uma sequência específica de
bases que se ligam a um segmento correspondente do molde de RNA, alinhando
assim os aminoácidos para a síntese protéica. Foi somente com estas descobertas,
do RNA transportador e do RNA ribossômico, que os pesquisadores ficaram
sabendo que existem várias formas de RNA, pois até então pensava-se que todo
RNA atuasse como um molde do DNA. Quando em 1960 uma terceira forma de RNA
foi revelada, soube-se que este era o verdadeiro molde da síntese protéica: o RNA
mensageiro.
Os pesquisadores queriam saber agora como o código consegue especificar
qual dos vinte aminoácidos é incorporado a um determinado ponto de uma cadeia
protéica, se este código possui apenas quatro letras em seu alfabeto genético: A, T,
C e G. Estudos apontavam para um código de trincas, totalizando 64 códons
(4x4x4); nos quais a combinação resultava em redundância, pois o código só exigia
vinte aminoácidos, levando a conclusão de que muitos deles eram codificados por
mais de um tripleto. A demonstração de que o código é baseado em tripletos
aconteceu antes do estabelecimento dos códons; foi em 1961, na Universidade de
Cambridge, quando Brenner e Crick, usando mutágenos químicos, constataram que
a inserção ou supressão de um único par de bases no nucleotídeo resulta numa
mutação, denominada frameshift (com deslocamento estrutural), pois todo o código
que aparece depois do ponto de mutação fica embaralhado.
Com estas questões respondidas, foi possível buscar descobrir quais
aminoácidos correspondem a seus respectivos trechos de DNA, sabendo agora que
esses trechos são formados por tripletos.
Ainda em 1961, a primeira das “palavras de três letras” foi descoberta por
Marshall Nirenberg, no National Institutes of Health [NIH] dos Estados Unidos;
juntamente com seu colaborador alemão, Heinrich Matthaei; utilizando “RNA
preparado de acordo com procedimentos criados seis anos antes na New York
University pela bioquímica francesa Marianne Grunberg-Manago”, que havia
descoberto “uma enzima específica de RNA capaz de produzir fieiras como AAAAAA
ou GGGGGG”. Nirenberg e Matthaei, utilizando também a tal enzima para fabricar o
RNA sintetizado in vitro, produziram uma sequência de UUUUUU, ou poli-U; e
depois adicionaram-no a um sistema acelular, para verificarem se a síntese protéica
acontecia. Resultado: “os ribossomos começaram a produzir uma proteína simples
formada por uma fieira de um único aminoácido, fenilalanina. Ou seja, eles haviam
descoberto que a poli-U codifica a polifenilalanina”. Assim, o primeiro códon
descoberto foi aquele pelo qual o código genético especifica a fenilalanina, o UUU;
e, até 1966, todos os códons tinham sido estabelecidos, através do esforço de vários
cientistas, sobretudo de Gobind Khorana, da Universidade de Wisconsin (WATSON,
2005, pp.87-88).
Ampliaram-se, assim, os conhecimentos sobre a síntese de proteínas. O
segmento pertinente do DNA, da célula relacionada à proteína visada, abre-se e
ocorre a transcrição de uma das fitas, com a ajuda da enzima RNA polimerase. Após
o seu processamento, o RNA mensageiro sai do núcleo e vai ao citoplasma, até o
ribossomo, composto também de RNA e proteínas, local onde será gerada a nova
molécula de proteína, a partir de RNA mensageiro, pelo processo da tradução. Na
tradução, um aminoácido chega até o local da síntese anexado a uma das
extremidades do RNA transportador, que tem, na outra extremidade, um tripleto
específico, ou anticódon, (por exemplo, um CAA) que reconhece o tripleto oposto
correspondente no RNA mensageiro (neste caso, um GUU; e o aminoácido
transportado seria a valina). Logo em seguida, um outro RNA transportador chega
com outro aminoácido para ocupar o tripleto seguinte do RNA mensageiro; sendo
que este novo aminoácido é ligado bioquimicamente ao anterior. Este processo é
repetido tantas vezes quantas forem necessárias, até que a proteína esteja
totalmente sintetizada.
Como, em ciência, as perguntas sempre se renovam, o que os
pesquisadores queriam saber, agora, era por quê a maioria dos genes são “ligados”
apenas em determinados momentos e em determinadas células, para produzir
determinado tipo de proteína. O desenvolvimento de qualquer célula complexa é “um
enorme exercício de ligar e desligar genes: à medida que novos tecidos vão
surgindo, conjuntos inteiros de genes precisam ser ligados e desligados” (WATSON,
2005, p. 93). Muitos pesquisadores empenharam-se em estudar o ligar e o desligar
dos genes, entre eles, François Jacob e Jacques Monod, no Instituto Pasteur, de
Paris; Walter Gilbert e Benno Müller-Hill, na Harvard. Foi Mark Ptashne, contudo,
quem isolou e caracterizou a molécula repressora que liga e desliga os genes do
bacteriófago; e descobriu que a repressora é uma proteína capaz de se ligar a um
sítio do DNA, próximo do ponto em que tem início a transcrição do gene responsável
pela proteína que ela reprime, impedindo a RNA polimerase de produzir o RNA
mensageiro a partir do gene.
No final da década de 1960, os cientistas envolvidos nas investigações que
resultaram na descrição clara da síntese de proteínas sentiram que um grande ciclo
havia sido completado, e precisavam partir para outros campos de pesquisa. Por
outro lado, sentiam que apenas um pequeno passo fora dado, e que precisavam
avançar para um estudo, bem mais esperado por pesquisadores maravilhados com
o código genético, o estudo da manipulação dos genes.
O segundo ano da década de 1970 marcou o nascimento de uma das mais
revolucionárias tecnologias para multiplicar segmentos selecionados de DNA: o DNA
recombinante. Esta tecnologia, que seria posteriormente popularizada em filmes e
novelas como “clonagem”, teve sua origem em 1972, através do trabalho conjunto,
ainda que em laboratórios separados, de Herbert Boyer, em San Francisco, e de
Stanley Cohen, em Palo Alto. No entanto, o DNA recombinante não existiria sem
três grandes descobertas da biologia molecular realizadas na década de 1960: a
descoberta das enzimas de restrição, pelo bioquímico suíço Werner Arber; a
identificação da enzima ligase, feita ao mesmo tempo por Martin Gellert, no National
Institutes of Health e Robert Lehman, em Stanford; e ainda a descoberta do
plasmídeo, advinda dos estudos sobre a resistência antibiótica das bactérias, mas
que inspirou pessoas como Cohen a querer transformar a E. coli importando
plasmídeo de fora da célula.
Enquanto estudava o processo pelo qual alguns DNA virais são destruídos
depois de inseridos em células bacterianas, Arber percebeu que a presença de uma
enzima de restrição, numa célula bacteriana hospedeira, impedia o crescimento viral
porque ela podia clivar, ou cortar, o DNA estranho; ao passo que uma segunda
enzima de restrição protegia o DNA da bactéria, permitindo o ataque da primeira
enzima tão-somente às sequências de bases pertencentes ao DNA do vírus.
Em 1967, Gellert e Lehman mostraram que, com a enzima ligase, é possível
ligar ou colar as extremidades de moléculas de DNA. Esta descoberta inspirou
Kornberg, nas pesquisas com DNA polimerase, a induzir a união das duas
extremidades do DNA viral com a enzima ligase. Em primeiro lugar, Kornberg, com a
enzima que ele ajudou a descobrir, a DNA polimerase, replicou o DNA do vírus
original; em seguida, colou suas duas pontas e verificou que, a réplica, feita em tubo
de ensaio, passou a se multiplicar como acontece com o vírus natural, que se
multiplica na E. coli. Isto é, o DNA viral artificial era, pela primeira vez na história das
cópias de DNA, uma molécula biologicamente ativa.
Ainda na década de 1960, descobriu-se que muitas bactérias desenvolviam
resistência a antibióticos de maneira diferente da usual: pela importação de um
pedaço extracromossômico de DNA, que seria chamado de plasmídeo. Plasmídeos
são pequenos circuitos circulares de DNA que, naturalmente, incluem, junto ao
genoma da bactéria, os genes que conferem resistência a antibióticos. Os
plasmídeos podem ser replicados e transmitidos durante a divisão celular.
Novembro de 1972, em Honolulu, numa conferência sobre plasmídeos,
Herbert Boyer, professor da Universidade da Califórnia; e Stanley Cohen, o grande
pioneiro dos plasmídeos, encontrara-se; e reencontrara-se, depois da conferência,
“numa delicatéssem perto de Wikiki”, onde “começaram a idealizar o nascimento da
tecnologia do DNA recombinante, anotando suas ideias em guardanapos”
(WATSON, 2005, p. 105). Dois fatos são marcantes: o de Boyer ser um especialista
em enzimas de restrição; e o de Cohen já, em 1971, ter idealizado um método para
induzir células bacterianas da E. coli a importarem plasmídeos de fora da célula. Em
1972, Cohen e Boyer trabalhavam em conjunto para reunir, com genialidade e
minúcia molecular, todos estes ingredientes descobertos na década de 1970: as
enzimas de restrição e ligase, usados para modificar o plasmídeo, cortando-o; e
colando um outro pedaço de DNA, contendo algum gene de interesse humano no
seu interior; com o objetivo de introduzir este plasmídeo recombinante no interior da
bactéria; provocando assim a sua multiplicação, através da divisão da bactéria
hospedeira. Mas Cohen e Boyer ainda precisavam saber se estes protocolos podiam
ser seguidos em outras situações. Em experiências subsequentes, eles visaram criar
um plasmídeo recombinante usando o DNA de um organismo diferente da bactéria,
foi então que eles realizaram a clonagem do DNA do sapo.
O PROJETO GENOMA HUMANO
A técnica de sequenciamento desenvolvida por Fred Sanger em meados dos
anos de 1970 em Cambridge, Inglaterra, foi primeiro potencializada em 1983 por
Lloyd Smith e Mike Hankapiller, automatizada e transformada na máquina de
sequenciamento Smith-Hankapiller, e depois, em 1998, pela PRISM 3700, máquina,
da Applied Biosystems Inc., criada em conjunto com Hankapiller. Esta
potencialização do método de Fred Sanger para seqüenciar DNA, resultando na
mecanização do processo, precisou acontecer para que o Projeto Genoma Humano
fosse viável, pois ela ofereceu possibilidade de sequenciar até meio milhão de pares
de bases por dia, sem a intervenção humana. Encaminhando o projeto com
segurança para sua execução rápida, desde os seus detalhamentos iniciais,
ocorridos em 1987, até ele ficar “essencialmente completo” em abril de 2003
(WATSON, 2005, p. 213). A genialidade do método de Sanger estava no fato de ele
produzir uma cópia do DNA, usando a enzima DNA polimerase, a partir de pares de
bases ligeiramente alterados, isto é, ao invés de usar apenas as chamadas bases
desoxi (A, T, C e G), Sanger acrescentava algumas bases didesoxi, (ddA, ddT, ddG,
ddC) que são incorporados sem dificuldade na cadeia do DNA, pela DNA
polimerase, mas que depois disso, impedem esta enzima de acrescentar qualquer
outra base à cadeia.
A técnica para determinar a sequência de bases nitrogenadas do DNA
começa por fazer a síntese de cadeias complementares, do segmento a ser
sequenciado, em um meio contendo também pequenas quantidades, misturadas aos
nucleotídeos normais, de cada um dos tipos de di-desoxirribonucleotídeos, sendo
estes os responsáveis por fazer a DNA polimerase interromper a síntese, quando
são introduzidos, de modo aleatório, em diferentes pontos das cadeias
complementares. Quando a reação é interrompida, após algum tempo, o meio é
alcalinizado, quebrando as pontes de hidrogênio, separando as cadeias-molde das
suas complementares sintetizadas, que são de diversos tamanhos, algumas do
tamanho original, outras menores e, assim, diminuindo até o tamanho de uma única
base copiada com didesoxi. Neste ponto, o meio é formado por uma grande
quantidade de cadeias de comprimentos variáveis, todas copiadas do molde de
DNA. O passo seguinte, portanto, é classificar, desde as minicadeias até as cadeias
maiores, de acordo com o comprimento de cada uma, com o objetivo de inferir a
sequência.
Esta é possível usando a técnica da eletroforese: colocam-se todos os
fragmentos do DNA numa placa, contendo gel especial; submete-se a placa a um
campo elétrico; a atração desta força a migração das moléculas pelo gel, com
velocidade determinada pelo tamanho, cadeias curtas avançando mais depressa
que as longas. Após um intervalo de tempo, a menor minicadeia terá avançado a
maior distância; e a maior cadeia percorrerá distância menor: todas as cadeias
alinhadas e marcadas, com uma base didesoxi na extremidade final. É esta
extremidade, a última base copiada com didesoxi marcada, que permite fazer a
leitura da sequência da nova fita de DNA: conta-se a última base marcada de cada
fita copiada, desde a menor até a maior, sendo uma subsequente à outra,
reconstituindo, assim, a sequência de bases nitrogenadas na fita complementar
sintetizada (WATSON, 2005, p. 121 a 123).
A técnica de Smith e Hankapiller tornou o processo de Sanger quatro vezes
mais eficiente, realizando, com um código de quatro cores fluorescentes, uma única
reação, na síntese; e uma única banda de gel, eletroforese; a qual passa por
rastreamento de raio laser, após a corrida das cadeias no fundo do gel. Sob a
influência do laser, cada um dos quatro di-desoxirribonucleotídeos é localizado pela
cor específica da luz emitida pelo fluorocromo associado a ele: os fluorocromos
associados à timina, à adenina, à citosina e à guanina; emitem, respectivamente, as
luzes vermelha, verde, azul e amarela. Estas cores fluorescentes são, portanto,
etiquetas para identificação das quatro bases nitrogenadas, que podem, assim, ser
processados no computador. Nos dias atuais, o gel foi superado por “sistemas
capilares de grande vazão – finíssimos tubos nos quais os fragmentos de DNA são
separados em alta velocidade de acordo com o seu tamanho” (Watson, 2005, p.
196).
Apesar de a técnica de sequenciamento ter evoluído muito e acelerado o
processo, algo ainda podia ser melhorado: a técnica para gerar grandes quantidades
do segmento, ou gene, a ser sequenciado. Até então, o método para amplificar
determinada região do DNA era o de Cohen-Boyer, desenvolvido para clonagem
molecular: recorta-se o segmento de DNA; insere-o no plasmídeo; insere-se o
plasmídeo modificado na célula bacteriana; esta replica-se, duplicando o pedaço de
DNA; ao se formar uma população bacteriana, purifica-se o segmento de DNA
desejado. Era um procedimento lento e trabalhoso, mas que foi resolvido com a
descoberta, em 1983, da reação em cadeia da polimerase, por Kary Mullis. Como foi
mostrado acima, a técnica de sequenciamento começa pela síntese de cadeias
complementares, logo, a reação em cadeia veio potencializar esse começo.
A reação em cadeia da polimerase é promovida pelo processo a seguir.
Primeiro, são sintetizados dois primers, que são sequências pequenas, com até 20
bases nitrogenadas em fita única, correspondentes às margens delimitadas de inicio
e fim de segmento alvo do DNA, o gene que deve ser amplificado. Adicionam-se os
dois primers ao meio contendo uma amostra de tecido, ou seja, do genoma inteiro,
que é aquecido a 950C, provocando a separação da dupla-hélice, resultando em um
meio com muitas fitas únicas ao lado dos primers. Com uma leve redução da
temperatura, um primer sintetizado liga suas vinte bases às vinte bases
complementares anteriores ao início da região-alvo, enquanto o outro primer liga-se
às bases posteriores ao fim do gene-alvo, no molde de DNA. Neste ponto, os únicos
dois pedaços com dupla face no molde de DNA são estes em que se localizam os
primers. Quando a enzima DNA polimerase é acrescentada ao meio, ela vai
procurar, obrigatoriamente, estas regiões de dupla face para iniciar a cópia
complementar do molde de DNA, que é copiada até o ponto de parada, marcada
pelo primer de finalização. Este processo é repetido: aumenta-se a temperatura,
separando as fitas; reduz-se a temperatura, formando duplas fitas de primers;
adiciona-se DNA polimerase, fazendo a duplicação da região-alvo. Assim, depois de
repetir o processo muitas vezes, aquele meio, que começou com uma mistura
simples de primers, DNA polimerase, bases livres e molde de DNA; torna-se uma
solução concentrada da região-alvo. A reação em cadeia acelerou o processo de
sequenciamento: em menos de duas horas, após 25 ciclos, o “DNA-alvo terá sido
amplificado 225 vezes (cerca de 34 milhões de vezes)” (WATSON, 2005, p. 193).
Também este processo, desenvolvido por Mullis, da reação em cadeia da
polimerase foi automatizado, surgiram laboratórios genômicos com linhas de
produção controladas, sendo que o laboratório do Instituto Whitehead do MIT
Massachsetts Institute of Technology (MIT) teve, pela inventividade de Eric Lander,
responsabilidade pelo processo no qual robôs substituíram os técnicos humanos,
levando a um aumento da produtividade no final do projeto.
Pode-se dizer que o Projeto Genoma Humano começou pela insistência de
alguns pesquisadores, os quais perceberam o quanto o sequenciamento poderia ser
útil para identificar mutações de importância médica, levando-os a se reunirem, a
partir de 1985, para decidirem como seria o processo. Em 1987, eles formaram uma
comissão de quinze membros, entre eles, James Watson, Sidney Brenner e David
Botstein, sob a égide da Academia Nacional de Ciências e sob a direção de Bruce
Albers, da Universidade da Califórnia, San Francisco. O objetivo inicial do comitê era
o aprimoramento das tecnologias de sequenciamento: antes do genoma humano, a
recomendação era sequenciar genomas de organismos simples, como a Escherichia
coli, o lêvedo (fermento biológico Saccharomyces cerevisiae), o C. elegans (verme
nematóide) e a mosca-das-frutas (Drosophila melanogaster). O comitê determinou
ainda que o processo para sequenciar os genomas respeitaria duas fases: um
mapeamento genético, para determinar as posições relativas dos genes, criando
marcos gênicos para servir de parâmetros nos cromossomos, esclarecendo a sua
estrutura básica do genoma; e um mapeamento físico, para identificar as posições
absolutas dos marcos gênicos, aquelas que determinam a posição de cada trecho
distinto da sequência no cromossomo, servindo, assim, como âncora fixa. Este
processo foi seguido pelo Consórcio Público Mundial, formado por grandes
laboratórios como: MIT (campeão do sequenciamentos); o Centro Sanger, em
Cambridge, Reino Unido, o Centro de sequenciamento da Universidade de
Washington; a Faculdade de Medicina Baylor, o laboratório do Departamento de
Energia dos Estados Unidos; e o Genéthon, o Instituto de Pesquisa Genômica da
Associação Francesa de Distrofia Muscular. No entanto, este processo não foi
seguido pela iniciativa privada que também estava envolvida no sequenciamento do
genoma, sobretudo após as decisões controvertidas de Craig Venter, que, primeiro,
contrariou o consórcio público quando, no TIGR (Instituto de Pesquisas Genômicas
– The Institute for Genomic Research), decidiu sequenciar apenas os genes sem
íntrons advindos do cDNA. E, segundo, quando Venter trabalhava, a convite de
Hunkapiller, na ABI, corporação que fundou a empresa-irmã Celera Genomics
especialmente para ele testar o mais novo modelo da empresa, o PRISM 3700.
Venter, na ABI, decidiu sequenciar todo o genoma humano por um método que
excluía o mapeamento inicial, o método Whole Shotgun (que significa “atirando a
torto e a direito para acertar o genoma inteiro”). Os pesquisadores do consórcio
público não pouparam críticas a Venter, sobretudo por ele ter se aproveitado da
utilização do cDNA, não só para descobrir genes em grande escala, mas também
para praticar a patente especulativa do novo gene antes da descoberta de suas
funções. Por princípio, não interessava ao consórcio público deixar de sequenciar as
regiões do DNA apelidadas de “DNA-lixo”, uma vez que se sabia da possibilidade de
muitas informações relevantes sobre as mutações advindas da seleção natural
estarem inscritas nestas regiões, mantendo sob controle as diferenças entre as
espécies, que são similares somente nas áreas funcionais, ou seja, nos genes
(WATSON, 2005, p. 217). A despeito das boas intenções científicas, Venter, quando
na TIGR, de olho nos lucros dos royalties pelo monopólio de alvos potenciais de
medicamentos que nem sequer haviam sido inventados, levou em frente seu esperto
projeto de sequenciar apenas DNA complementares.
Apesar de todos os desentendimentos, o consórcio público, de um lado, e a
iniciativa privada, de outro, conseguiram levar o projeto de sequenciamento do
genoma humano num ritmo espantoso, completando-o “essencialmente” no mês de
abril de 2003, com 95% das sequências obtidas (pois existem, na prática, regiões de
DNA não sequenciáveis) e com “taxa de erro inferior a 1 em cada 10 mil bases”
(WATSON, 2005, pp. 212-213).
O FUTURO DO GENOMA
Dez anos depois de completado, o sequenciamento do genoma humano, em
si, já não é nenhum grande feito, digno das capas de publicações científicas. Estas,
agora, privilegiam não a simples descrição genômica, mas sim as descobertas sobre
as funções específicas dos genes e os modos de interferir no fluxo do dogma central
da biologia: DNA, RNA, proteína. Fechou-se um ciclo, iniciado na segunda metade
do século XX, com chave de ouro, deixando disponível uma grande quantidade de
informações que o século XXI começou a explorar, visando, sobretudo as análises e
os estudos funcionais dos genes. O conhecimento de sequências de nucleotídeos
de genomas inteiros e o desenvolvimento de biotecnologias, como os arranjos de
hibridização, os chips gênicos e o gene repórter, permitem, hoje, o estudo
simultâneo da expressão de todos os genes de um organismo. O avanço da
tecnologia aplicada às ciências biológicas foi fundamental para o sucesso do
sequenciamento dos genomas (ULRICH, et al., p. 126), sendo que a própria
validação dos métodos aconteceu desde os primeiros genomas sequenciados em
microrganismos. Assim, este avanço, que determinou a expansão das análises em
larga escala, permitiu o incremento de outras abordagens, que cobrissem,
particularmente, os diferentes fenômenos e a alta interatividade entre os processos
biológicos que atuam no fluxo do dogma central. Entre as novas abordagens
“ômicas” surgiram: 1) “a genômica, visando a caracterização total do ácido
desoxirribonucléico” (DNA) dos organismos; 2) a transcriptômica, visando os ácidos
ribonucléicos (RNA); 3) e a proteômica, visando as proteínas (ULRICH, et al., p.
125).
A genômica é, portanto, a subdisciplina da genética dedicada ao
mapeamento, sequenciamento e análise funcional e comparativa de genomas,
sendo ela subdividida em: 1) genômica estrutural, estudo da estrutura do genoma; 2)
a genômica funcional, estudo do funcionamento do genoma; 3) e genômica
comparativa, o estudo da evolução do genoma. Na prática, a genômica funcional
engloba análises do conjunto completo de RNA transcritos de um genoma
(transcriptoma) e o conjunto completo das proteínas codificadas pelo genoma
(proteoma).
A mais avançada destas três disciplinas é a genômica estrutural, pois ela já
estabeleceu as sequências completas de muitos organismos, tornando a ação de
identificar e isolar genes relativamente simples, baseando somente nas informações
sobre sua localização, permitindo a clonagem de qualquer gene com efeito
fenotípico conhecido.
Mapas de alta resolução têm sido construídos, por meio da genômica
funcional, permitindo localizar os genes nos cromossomos e integrar os mapas
genético, citológico e físico, com a finalidade de monitorar mudanças na expressão
total do genoma, tanto ao longo do seu desenvolvimento no tempo quanto em
resposta às mudanças no ambiente.
A genômica funcional, que se dedica a estudar a expressão total do genoma,
tem como aliada nas investigações o método de hibridizações dot blot, um processo
pelo qual sequências específicas de nucleotídeos de genes ou sondas são aplicadas
e ligadas a uma membrana, em arranjos de sonda (os dot blot), com ajuda de uma
filtração a vácuo. Esta membrana é colocada em solução de hibridização, sendo, os
híbridos, sondas complementares a segmentos de transcritos de cada ORF
(Matrizes abertas de leitura) ou PCR. Mais especificamente, uma solução de
hibridização contém RNA e cDNA marcados com um isótopo radioativo ou corante
fluorescente; e é feita a partir dos RNA transcritos que sintetizam os cDNA
radioativos. A medição das quantidades de RNA ou cDNA hibridizadas, com sonda
em dot blot, é feita pela varredura do blot com um sistema de auto-radiogramas que
apresenta as intensidades de sinais de hibridização, as quais podem ser
interpretadas a partir de análises de programas de computador. A evolução das
membranas de suporte levou ao desenvolvimento de placas de silicone, que
comportam mais de 10.000 sondas. Isso porque, hoje, a biotecnologia dispõe dos
chips gênicos, que podem conter milhares destas sondas de hibridização, em
microarranjos de oligonucleotídeos sobre suportes mínimos, próprios para a
quantificação por meio de scanners de resolução micrométrica. Estes novos
procedimentos estão diretamente ligados à capacidade de analisar a expressão de
genomas inteiros, beneficiando a compreensão do processo de desenvolvimento
humano e das causas de muitas doenças.
Sob o aspecto do funcionamento dos genomas, os pesquisadores visam, em
especial, estudar as regulações espacial e temporal de genes; os modos de regular
a expressão gênica; a atividade transcricional induzida por fatores ambientais e
biológicos; e os controles moleculares da transcrição.
Os genes presentes em genomas de eucariontes multicelulares estão
sujeitos a um controle no modo como são expressos, sendo que há uma dimensão
espacial desse controle e uma dimensão temporal. Na dimensão espacial, o controle
determina, por exemplo, a alguns genes a expressão em células nervosas, a outros
em células sanguíneas e a outros ainda em células reprodutivas. Assim, em
eucariontes multicelulares, muitos genes diferentes têm expressão histoespecífica,
ou seja, que “estimulam a transcrição em apenas alguns tecidos” (SNUSTAD e
SIMMONS, 2008, p. 633). Um bom exemplo dessa regulação espacial são os genes
que codificam as tubulinas α e β na planta Arabidopsis thaliana, para a qual são
necessários tipos ligeiramente diferentes de microtúbulos (e de seus respectivos
genes codificantes) para diferentes partes dela. Na dimensão temporal, genes
diferentes são expressos em momentos diferentes, alguns em resposta a sinais
biológicos, como os hormônios, e outros em resposta a estímulos ambientais. Pode-
se observar a especificidade temporal durante o desenvolvimento do zigoto em
organismos multicelulares. A formação de tecidos e órgãos é dirigida por um grupo
de genes expressos em sequência ordenada, à medida que o organismo se forma.
O melhor exemplo para a regulação temporal vem da expressão gênica da
hemoglobina, proteína responsável por transportar oxigênio no sangue de animais
vertebrados. A hemoglobina é um tetrâmero de polipeptídeos denominados globinas:
duas cadeias de globina α e duas de globina β unem-se frouxamente às moléculas
de um composto chamado hemo, promotores da ligação com oxigênio molecular.
“Os genes de globina α ocupam uma região com 28 kb no cromossomo 16 e os
genes de globina β ocupam uma região de 45 kb no cromossomo 11” (SNUSTAD e
SIMMONS, 2008, p. 625-626). Durante o desenvolvimento, os grupos de genes α e
β são expressos em épocas diferentes: de um lado nos grupos, os genes são
expressos apenas no embrião; no meio, apenas no feto; e do outro lado, os genes
são expressos só após o nascimento. O resultado dessa ativação temporal de genes
é a produção de tipos ligeiramente diferentes de hemoglobinas em cada fase do
desenvolvimento humano: “O embrião, o feto e a criança têm necessidades
diferentes de oxigênio, sistemas circulatórios diferentes e ambientes físicos
diferentes. A mudança temporal na expressão do gene de globina é aparentemente
uma adaptação a esta gama de condições alteradas” (SNUSTAD e SIMMONS,
2008, p. 626).
A utilização das informações genômicas disponíveis tornou-se rotina entre
os pesquisadores, quase sempre visando desenvolver para humanos algum tipo de
terapia gênica de células somáticas, ou seja, não herdável; por contraste à terapia
gênica herdável, ou seja, de linhagem germinativa, terapia esta só realizada hoje em
camundongos e outros animais, mas não em humanos, pois implica em questões
morais e éticas ainda discutidas amplamente pela sociedade. Infelizmente, a maioria
das tentativas de tratar uma doença, por terapia gênica de células somáticas,
esbarra nas rápidas respostas do corpo contra os vetores que supostamente
levariam o gene restaurador, do tipo selvagem, ao paciente. Atualmente, são
tratáveis apenas algumas das 5.000 doenças humanas herdadas catalogadas; mas
o novo enfoque da terapia gênica promete tratamentos mais bem-sucedidos no
futuro, uma vez que ela promove a síntese do produto gênico ausente, o qual deverá
restaurar o fenótipo normal (SNUSTAD e SIMMONS, 2008, pp. 518-519).
Uma das alternativas possíveis para o uso das recentes tecnologias
genômicas é detectar, por testes diversos para identificar os genes mutantes que
causam doenças humanas herdadas, para que se possa fazer um diagnóstico
molecular das doenças e promover ações de prevenção ou cura. Os testes
moleculares para alelos mutantes, geralmente, começam pela aplicação do
segmento do DNA de interesse na reação em cadeia da polimerase, com o objetivo
multiplicar pequenas quantidades de DNA obtidas, por exemplo, de células fetais
(por amniocentese ou punção de vilosidades coriônticas); ou da célula única do pré-
embrião (produzida por fertilização in vitro). Alguns diagnósticos moleculares
requerem testes para determinar o número de repetições ampliadas de
trinucleotídeos, que são causa de mais 40 distúrbios humanos diferentes, entre eles,
muitas anomalias neurodegenerativas; outras mutações podem exigir testes
diferentes, por exemplo, “usando-se oligonucleotídeos aleloespecíficos como sondas
em transferências de Southern genômicas” (SNUSTAD e SIMMONS, 2008, p.518);
procedimento usado para detectar a mutação ΔF508 no gene CF, a causa mais
frequente de fibrose cística. O teste de deleção ΔF508 foi realizado de modo bem-
sucedido em células fetais obtidas por amniocentese ou punção de vilosidades
coriônticas; e também realizado, por fertilização in vitro, em embriões de oito células.
A fibrose cística (CF) é uma doença herdada como mutação autossômica
recessiva, a expectativa de vida da pessoa com CF é de cerca de 32 anos, mas com
qualidade de vida inadequada. Os sintomas da CF são o suor excessivamente
salino; e a obstrução, por um muco espesso, dos pulmões, pâncreas, fígado e do
trato digestivo; o que resulta em infecções crônicas e progressivas por
Pseudomonas aeruginosa, Staphylococcus aereus e bactérias correlatas; as quais
provocam a insuficiência respiratória e morte. Assim, as mutações no gene CF são
pleiotrópicas, isto é, elas causam vários efeitos distintos: funcionamento inadequado
do pâncreas, do fígado, dos ossos e do trato intestinal. Foram identificadas mais de
170 mutações CF diferentes, mas em 70% dos casos de alelos mutantes de CF
acontece uma única deleção de três bases no sítio ΔF508, que elimina a fenilalanina
da posição 508 do produto do gene CF.
O gene CF localiza-se no braço longo do cromossomo 7, ele é grande, mede
cerca de 250 kb, possui 24 éxons e seu RNA mensageiro tem cerca de 6,5 kb; ele
codifica uma proteína de 1480 aminoácidos, denominada regulador de condutância
transmembranar de fibrose cística (CFTR). A proteína CFTR tem, entre outras, a
função de regular o fluxo de sal e água para dentro e fora da célula, para isso, ela
instala-se, para formar canais iônicos, nas células que revestem o sistema
respiratório, além do pâncreas, do intestino, vias reprodutivas e glândulas
sudoríparas e salivares. No entanto, a CFTR mutante acumula sal nas células
epiteliais, formando o muco na sua superfície, provocando os cistos: daí o adjetivo
“cística”.
Com a identificação do gene CF e a caracterização de algumas das
mutações que causam a fibrose cística, pelas pesquisas de Francis Collins e Lap-
Chee Tsui e seus colaboradores, rapidamente identificou-se o seu produto, a CFTR.
A identificação do gene CF candidato foi baseada em comparações dos alelos
normal e mutante pelos heredogramas de várias famílias; depois, determinaram-se
os dois marcadores RFLP mais próximos do gene CF; a partir deles, foi iniciado o
processo de andar e saltar no cromossomo 7, em seu braço longo. O andar no
cromossomo inicia-se, portanto, com a seleção de um marcador gênico (RFLP ou
clone gênico) próximo do gene de interesse; este clone (ou RFLP) é empregado
“como sonda de hibridização para triar uma biblioteca de sequências superpostas”;
os clones superpostos identificados na triagem de bibliotecas recebem mapas de
restrição; “o fragmento de restrição mais distante da sonda original é usado para triar
uma segunda biblioteca genômica construída pelo emprego de uma enzima de
restrição diferente” (SNUSTAD e SIMMONS, 2008, p. 483). Repete-se o processo
várias vezes, em ambas as direções, e, caso o gene de interesse esteja ainda
distante das sondas de origem, salta-se sobre o cromossomo até encontrá-lo.
Nem sempre, porém, os enfoques que resultam em terapias gênicas dão
ênfase aos eventos restauradores da expressão de um gene; pelo contrário, os
enfoques da genética reversa visam a inibição da expressão de genes específicos,
fazendo uso de sequências conhecidas de nucleotídeos para criar seus
procedimentos. Em síntese, o enfoque genético clássico, usado, por exemplo, na
identificação do gene CF por Collins e Tsui vai: 1) identificar os organismos com
fenótipos anormais; 2) caracterizar os genes mutantes responsáveis por tais
fenótipos; 3) determinar os efeitos das mutações, pela comparação entre os
organismos mutante e tipo selvagem; 4) identificar os genes codificantes de
produtos (proteínas ou enzimas) envolvidos nos processos biológicos investigados.
No entanto, os novos enfoques de investigação minuciosa dos processos biológicos,
como o RNA anti-sentido, o T-DNA (DNA transferido), as inserções de transposons
(elementos móveis de transposição), a interferência do RNA (RNA-i) e as mutações
nocaute (inativação de gene), podem ser classificados em um enfoque coletivo
denominado genética reversa. Estes quatro enfoques servem para aqueles
momentos cotidianos em que “conhecemos a sequência de nucleotídeos de um
gene antes de conhecer sua função” (SNUSTAD e SIMMONS, 2008, p. 533); assim,
usam-se sequências conhecidas de nucleotídeos de gene objetivando criar
procedimentos para: 1) isolar mutações neutras nos genes; ou 2) desligar a sua
expressão. Estes procedimentos de genética reversa, mesmo sem o prévio
conhecimento do produto funcional do gene, permitem deduzir a função de um gene
específico, simplesmente observando uma perturbação ou interrupção em seu
funcionamento no organismo.
O primeiro procedimento de genética reversa é o RNA anti-sentido, usado
para bloquear ou reduzir o nível de expressão de determinado gene. Por definição, o
RNA anti-sentido é uma molécula complementar a uma molécula de RNA
mensageiro. Ao contrário do RNA mensageiro, que tem sentido, pois tem os códons
lidos na sua tradução em produto polipeptídico; o RNA complementar não contém
códons traduzíveis em proteínas e também não dispõe das sequências reguladoras
necessárias à tradução, por isso ele é dito RNA anti-sentido. Ainda que hoje este
procedimento tenha sido amplamente substituído pelos enfoques da mutagênese
insercional de transposons e T-DNA, ele ainda é considerado um sucesso comercial
na produção de produtos geneticamente modificados, como o tomate, um produto
GM aprovado para consumo humano em 1994, produzido usando-se RNA anti-
sentido para reduzir a expressão do gene endógeno que codifica a
poligalacturonase, “enzima que degrada as paredes celulares e amolece os tomates
à medida que ficam maduros” (SNUSTAD e SIMMONS, 2008, p. 534), redução esta
que mantém o tomate firme por mais tempo, durante o amadurecimento. Para
produzir o RNA anti-sentido de um gene dentro de uma célula é preciso: 1) clonar o
gene de interesse; 2) cortar o gene de interesse entre a sequência codificante e o
seu promotor, para separá-los; 3) ligar novamente o gene de interesse, mas, dessa
vez, colando a sequência codificante na orientação inversa em relação ao seu
promotor, formando, o gene anti-sentido; 4) introduzir o gene anti-sentido na célula
hospedeira ou no organismo; 5) na transcrição, o gene anti-sentido produz os RNA
sem sentido; 6) os RNA sem sentido irão hibridizar-se com os RNA mensageiros,
com sentido; 7) ambos, RNA anti-sentido e RNA, formam um RNA bifilamentar e
helicoidizam-se; 8) este RNA bifilamentar entra na via de interferência de RNA e,
assim, bloqueiam juntos os mRNA correspondentes.
Os procedimentos de inserções de transposons ou de T-DNA são
ferramentas, da genética reversa, que fornecem uma fonte de mutações nulas de
genes. Os transposons são elementos genéticos de transição que se movem de um
local a outro no genoma e pertubam o funcionamento do gene no qual ele se insere;
da mesma forma, o segmento T-DNA do plasmídeo Ti da Agobacterium tumefaciens,
quando é transferido para células vegetais e inserido nos cromossomos da planta,
ele também perturba o gene (desta última) no seu funcionamento. Seja ela feita com
T-DNA de plasmídeo Ti ou com um transposon, basicamente a mesma é a
mutagênese insercional, ou a indução de mutações nulas (mutações nocaute);
assim, pelo exemplo das inserções T-DNA empregadas para dissecar a função
gênica na planta Arabidopsis thaliana, é possível entender o emprego de ambos os
procedimentos.
Com cerca de 200.000 pares de nucleotídeos, o grande plasmídeo Ti possui
um segmento T-DNA (DNA transferido) com 23.000 pb de tamanho e pelo menos 13
genes conhecidos, entre eles: os genes “Tum”, responsáveis pela formação do
tumor nas plantas dicotiledôneas; e os genes “Nos”, envolvidos na biossíntese de
nopalina. O uso do T-DNA em genética reversa implica na deleção dos genes
causadores do tumor e a inclusão de um marcador selecionável para “identificar
células vegetais transformadas com plasmídeos Ti desarmados”; assim, os T-DNA
usados não causam os “tumores que em geral se formam na coroa (junção entre
raiz e caule) de plantas” (SNUSTAD e SIMMONS, 2008, pp. 529-530).
Os clássicos procedimentos de inserções de T-DNA observam estes pontos:
1) genes exógenos de interesse são inseridos no T-DNA do plasmídeo Ti
desarmado; 2) este T-DNA modificado é, então, transferido de A. tumefaciens para
células vegetais; 3) nestas células, o T-DNA integra-se “a essencialmente todos os
componentes do genoma”, disperso ao longo de todos os cromossomos da planta
(SNUSTAD e SIMMONS, 2008, p.534); 4) são formadas populações em pools de
100 a 1.000 plantas transformadas, tornando possível identificar as inserções de T-
DNA em todos os genes da espécie; 5) amostras de DNA são isoladas dos pools de
plantas; 6) é feita uma primeira triagem, usando-se a PCR, para verificar inserções
em genes específicos; 6-1) caso aconteça uma inserção em um gene de interesse,
preparam-se pools menores e uma nova triagem, para identificar a planta com a
inserção desejada. Hoje em dia o processo de triagem é muito fácil e muitos mapas
de genomas, como o da Arabidopsis thaliana, estão disponíveis, identificando
inserções e seus efeitos em linhagens transformadas da planta.
O terceiro enfoque da genética reversa é a interferência do RNA (RNAi),
enfoque derivado da descoberta, por Andrew Fire, Craig Mello e colaboradores, em
1998, de que o RNA de dupla fita, ou dsRNA (double strand ribonucleic acid), que
eles haviam injetado em C. elegans, exercia influência, ou desligava, a expressão de
genes contendo a mesma sequência de nucleotídeos. “Hoje sabemos que o RNA
bifilamentar (dsRNA) tem papéis importantes na prevenção de infecções virais, no
combate da expansão de populações de elementos genéticos de transposição e na
regulação da expressão gênica” (SNUSTAD e SIMMONS, 2008, p. 536).
Existem vários modos de ocorrer RNAi nos experimentos em laboratório, em
todos eles deve existir o dsRNA. Um desses meios é: 1) sintetiza-se in vitro um
dsRNA derivado de transcritos de clones; 2) este dsRNA é microinjetado no
organismo vivo; 3) aqui, o dsRNA entra na via da RNAi e é cortado, pela enzima
Dicer, em pequenas moléculas de RNA; 4) estas são incorporadas a partículas de
ribonucleoproteínas, desfazendo a dupla fita; 5) juntos, RNA unifilamentar e partícula
ribonucleoproteína formam o RISC, complexo de silenciamento induzido por RNA
(RNA-induced silencing complex); 6) o RISC tem como alvo uma sequência de RNA
mensageiro que seja complementar ao RNA de interferência; 7) o RISC começa a
parear com seu alvo, isto é, o RNA de interferência faz pareamento com as bases de
seus mRNA complementares; então, duas coisas podem acontecer; 7a) se o
pareamento entre bases dentro do RISC for perfeito, ou quase perfeito, o RISC, com
ajuda de proteína da família Argonauta, corta, cliva o mRNA, que é degradado; 7b)
se o pareamento com a sequência alvo é imperfeita, o mRNA não é clivado, mas
apenas inibido, ou seja, sua tradução é inibida. Os RNA que, associados ao RISC,
resultam na clivagem do mRNA, são chamados pequenos RNA de interferência, ou
siRNA (small interfering ribonucleic acid); os RNA que, associados ao RISC,
resultam em inibição da tradução do mRNA são chamados de microRNA de
interferência, ou miRNA. A preparação in vitro da transcrição de segmentos ou de
genes clonados inteiros reproduz, em parte, o processo encontrado em eucariontes,
que tem suas próprias fontes de pequenos RNA de interferência e de microRNA; em
tal preparação, “o DNA é transcrito em ambos os sentidos inserindo-o em
orientações opostas em um vetor de clonagem adequado ou inserindo cópias
invertidas do DNA posteriores a um único promotor” (SNUSTAD e SIMMONS, 2008,
pp. 640-641). Este transcrito, assim produzido, tem a estrutura de repetição invertida
necessária para a formação bifilamentar; tal como ocorre com os transcritos dos
genes codificantes de microRNA.
Os genes que codificam pequeno e microRNA são encontrados em muitos
tipos de eucariontes como C. elegans (com 100 genes mir) e Drosophila cerca de
250, e costumam ser indicados pelo símbolo mir; a sua função principal é alterar a
regulação de outros genes. Os genes mir contêm “pouco ou nenhum potencial de
codificação de proteínas”, e possuem uma estrutura tal que apresenta dois trechos
de nucleotídeos repetidos em orientações opostas, refletindo seus pares de bases
complementares, cada qual de um lado de um curto segmento intercalar de DNA.
Quando um gene mir é transcrito, a “estrutura invertida repetida gera um RNA que
pode dobrar-se sobre si mesmo para formar uma curta haste bifilamentar na base de
uma alça unifilamentar” (SNUSTAD e SIMMONS, 2008, p. 640). Ainda em nível de
transcrição, “uma enzima chamada Drosha reconhece esta região haste-alça e a
remove do transcrito primário do gene mir” (SNUSTAD e SIMMONS, 2008, p. 640).
Uma vez exportada para o citoplasma, a haste-alça é clivada pela enzima Dicer, que
“remove a alça e apara a haste para um tamanho de 22 nucleotídeos em cada um
de seus filamentos” (em C. elegans) (SNUSTAD e SIMMONS, 2008, p. 640). Aqui, o
dsRNA entra em RISC, torna-se miRNA unifilamentar, e vai buscar pareamento com
o mRNA alvo, produzido por outro gene, para silenciá-lo.
Em síntese, as grandes transformações ocorridas, em apenas meio século,
nos estudos da genética, algumas das quais abordadas neste artigo, são indicações
claras de que o conteúdo formal da disciplina de biologia, no ensino médio, precisa
passar por atualizações, com urgência. Porém este imperativo não deve significar
tomar posse, sem critérios, de toda e qualquer informação. Ao invés disso, urge, de
fato, promover um mapeamento desses novos conteúdos, para orientar a sua
inserção entre os conteúdos já abordados, ou mesmo para conformar os conteúdos
superados às novas descobertas científicas divulgadas. Esta ação de atualização
deverá beneficiar o planejamento das aulas, na escolha dos temas geradores; das
orientações de leitura; das utilizações de imagens esquemáticas e animações
ilustrativas; e das atividades de fixação e interação com os novos conteúdos, sobre
as quais falamos a seguir.
DOS LABORATÓRIOS ÀS SALAS DE AULA
Na prática em sala de aula, as recentes descobertas da biologia, realizadas
em modernos laboratórios informatizados, envolvendo o DNA, o RNA e as proteínas,
tanto no sentido do dogma central quanto no sentido da genética reversa, devem ser
disponibilizadas aos estudantes do ensino médio com critério pedagógico. Em seu
processo de aprendizagem, o estudante é convidado constantemente a receber
novas informações, as quais ele deve saber conectar com os conhecimentos já
dominados. No entanto, quando o conteúdo básico da disciplina sofre uma
transformação tão marcante, como vem ocorrendo com a ciência da vida, a biologia;
e com a ciência da linguagem da vida, a genética, então é preciso estabelecer novos
fundamentos para a completa alfabetização científica. Em muitos aspectos, ensino e
aprendizagem ficam vulneráveis em momentos históricos de renovações
conceituais, sobretudo porque, na linguagem pedagógica, a clareza didática
depende da precisão conceitual; e daí vem a necessidade, também, da constante
adequação da prática em sala de aula à fundamentação teórica dessa prática.
Parafraseando, se isso for possível, a expressão do gene mir, é preciso regular a
expressão dessas novas informações biotecnológicas em sala de aula, para que
cada conceito básico não deixe de ser demonstrado e cada ponto crítico não deixe
de ser debatido.
São muitas as situações polêmicas envolvendo os conhecimentos da
biotecnologia, e são pouco claras as respostas a respeito, por exemplo, do cultivo
seguro de plantas transgênicas; ou do uso eticamente correto dos exames de DNA
para indicar, no futuro, alguma possível doença hereditária; ou para tantas outras
questões ainda mais espantosas. Considerando que a plena aprendizagem do
estudante está diretamente ligada à sua capacidade de construir ativamente o seu
conhecimento, é fundamental que o ensino seja uma espécie de catalisador para a
atividade intelectual do estudante, no processamento da diversidade de informações
disponíveis em ciências biológicas. Isto significa, por um lado, buscar compreender
os meios de interação com os recursos e dados da biotecnologia, para inseri-los nos
objetivos didáticos a nas atividades práticas em sala de aula; e, por outro lado,
significa manter as atividades clássicas da biologia, pois, ainda que estas possam
ser muito beneficiadas com novas tecnologias da informação, tais não são pré-
requisitos para o ensino e aprendizagem de excelência.
Uma dessas atividades clássicas da biologia visa reforçar a temática do
mecanismo da síntese de proteínas e, para tanto, enfoca os pontos de
correspondência, ou não, na relação entre as moléculas do DNA, do RNA e da
proteína. A implementação desta atividade, a princípio, parece restrita a esta
temática, estabelecida para auxiliar o estudante na interpretação dos
acontecimentos em nível celular de organização da vida, reunidos, geralmente, no
volume 1 dos livros de biologia. No entanto, existem muitos elementos nesta
atividade que o qualificam para ser implementado em auxílio a uma temática
presente no volume 3 dos livros, a teoria moderna da evolução. Comecemos pela
implementação entre os exercícios voltados ao conteúdo da síntese da cadeia
polipeptídica.
Entendemos por atividades clássicas aquelas atividades frequentemente
implementadas e difundidas, tais como: a extração do DNA do bulbo da cebola, uma
atividade de laboratório; a simulação da síntese de proteínas com modelos de papel,
uma atividade plástica; a simulação da transmissão das características humanas,
atividade geralmente lúdica, em que os estudantes devem construir imagens de
rostos a partir de tipos faciais característicos, escolhidos entre modelos combináveis
de cabelo, olhos, sobrancelhas, etc. A seguinte atividade, realizada em sala de aula,
tem relação direta com a disseminação das ferramentas de biotecnologia. Um
material impresso é apresentado ao estudante, contendo: 1) uma sequência curta da
molécula molde de DNA, com um destaque especial para as bases que serão
transcritas; 2) paralelamente a esta, vem outra sequência, a do RNA transcrito, que
deve ser construída pelo estudante, baseando-se na sequência disponível no trecho
de DNA alinhado abaixo; 3) por fim, acima do RNA transcrito, mais uma sequência
deve ser preenchida pelo estudante, dessa vez trata-se da cadeia polipeptídica que
se forma em relação direta com os códons correspondentes do RNA mensageiro
abaixo.
A implementação completa desta atividade prevê a habilidade de interpretar
a ação dos códigos genéticos, tanto no sentido do DNA à proteína; quanto no
sentido da proteína ao DNA. Ao estudante com espírito investigativo, é fundamental
saber resolver questões do tipo: se conhecemos a sequência de aminoácidos de
uma proteína mutante pela adição de bases em seu RNAm; como, então, se deve
proceder para encontrar, no DNA, o gene codificante normal dessa proteína? Nossa
hipótese é a de que, antes de poder investigar as sofisticadas ferramentas da
biotecnologia, incluindo a clonagem e a transcriptase reversa, o estudante deve
entender o bê-a-bá do código genético, ou seja, deve exercitar: a leitura dos
aminoácidos nos códons do RNAm; a leitura desses códons, formando éxons entre
as sequências de íntrons, no RNA transcrito primário; e a leitura desse transcrito no
interior bifilamentar do gene que, por sua vez, ocupa seu lugar no DNA e no
cromossomo. Portanto, a atividade simples pode tornar-se mais complexa: isto que é
apresentado aqui em três tempos (DNA↔RNA↔proteína); pode ter quatro tempos,
inserindo-se o RNA transcrito primário, com íntrons, antes do RNA; ou pode ter cinco
ou mais tempos, se considerar a variabilidade de mRNA possível pela recomposição
alternativa (SNUSTAD e SIMMONS, 2008, p. 628) dos éxons, durante o
processamento dos transcritos (DNA ↔ préRNA ↔ mRNA ↔ mRNA2 ↔ mRNA3 ↔
proteínas–1,2,3); e, todas estas possibilidades, sem se considerar as aparições
inesperadas de mutações genéticas. Vê-se, de imediato, que esta atividade simples
pode se transformar em ferramenta didática poderosa; e se estudante puder divertir-
se com leituras diferenciadas deste ir e vir, da transcrição à tradução e vice-versa,
passando por suas sutis recomposições e edições de fitas de nucleotídeos e de
cadeias de aminoácidos, ele também poderá formar uma intuição do funcionamento
dessa impressionante linguagem da vida. Em laboratórios, contudo, boa parte das
análises das combinações entre as bases só pode ser realizada com ajuda de
sofisticados computadores.
A segunda atividade que analisamos é, ao contrário da anterior, totalmente
dependente da tecnologia da informação. Através do tema da exploração dos
bancos de dados detalhados, com mapas de diversos genomas, esta atividade visa
compreender os meios de explorar com sabedoria estes endereços eletrônicos, de
organizações universitárias, governamentais ou empresariais voltadas às pesquisas
biotecnológicas, cujos resultados ficam ou deveriam ficar disponíveis para toda a
comunidade científica interessada. O critério para a melhor escolha dos sites de
informação na internet é o da indicação de autoridade, ou seja: as chances de que
um grande pesquisador com obras relevantes publicadas indique um site confiável;
são muito maiores do que buscar essa indicação num site de pesquisa qualquer. O
livro de James Watson, “DNA - o segredo da vida”, por exemplo, deixa as marcas de
laboratórios e de premiados pesquisadores, ligados às últimas descobertas
revolucionárias da biologia, impressos em suas páginas: laboratório de biofísica do
King‟s College, em Londres onde trabalharam Rosalind Franklin e Maurice Wilkins;
laboratório Cavendish, na Universidade de Cambridge, onde trabalharam o próprio
Watson e seu colega Francis Crick; além do laboratório Cold Spring Harbor, entre
outros. Endereços voltados às pesquisas por internet, relacionadas ao
sequenciamento dos genomas, também são citados em livros especializados, como,
por exemplo, Snustad e Simmons (“Fundamentos da genética”) cita, entre outros, o
GenBank, mantido pelo National Center for Biotechonology Information (NCBI), que
pertence a National Library of Medicine (NLM), do National Institutes of Health (NIH).
Dois bons sites para pesquisas sobre T-DNA e transposons são: o do Arabidopsis
Biological Resource Center (ABRC), na Ohio State University
(www.arabidopsis.org/abrc); e o do Salk Institute em La Jolla, Califórnia
(signal.salk.edu/cgi-bin/tdnaexpress). Assim como o National Science Foundation
(NSF) e o Department of Energy (DOE), o NIH também é uma agência
governamental dos EUA, e foram criadas para financiar projetos de pesquisa, os
quais resultam em quantidades cada vez maiores de sequências disponíveis
diariamente. Existem bancos de dados, semelhantes ao GenBank, também na
Europa e no Japão: o European Molecular Biology Laboratory (EMBL) Data Library
existe na Alemanha desde 1980; e, no Japão, desde 1984 existe o DNA Data Bank
of Japan (DDBJ). Hoje, GenBank, EMBL e DDBJ uniram-se para formar o
International Nucleotide Sequence Database Collaboration, que permite a pesquisa
simultânea dos três bancos de dados. Um elemento importante, que pode muitas
vezes determinar a eficiência e a praticidade de um site de banco de dados, é
programa desenvolvido para pesquisas e triagens de dados disponíveis. Uma
ferramenta de pesquisa particularmente amigável é o sistema Entrez, do NCBI,
disponível grátis na internet (www.ncbi.nlm.nih.gov/entrez), e que permite acessar as
sequências de proteínas, além de periódicos de medicina e biologia, a partir de um
sistema global de cruzamento dos dados de todos os bancos colaboradores. Assim,
a partir do Entrez, é possível pesquisar os “dados de sequências de proteínas,
estruturas macromoleculares tridimensionais, cromossomos e genes causadores de
câncer, sequências expressas, polimorfismos de um só nucleotídeo, sequências
genômicas inteiras e muito mais” (SNUSTAD e SIMMONS, 2008, p. 473). Se alguém
quer informações de uma sequência previamente determinada, ele pode ir ao banco
de dados “Nucleotide” do Entrez e, assim, realizar uma pesquisa na ferramenta
“megaBLAST” e seguir os passos: 1) entre com uma sequência de nucleotídeos
indagada; 2) dez sequências mais similares aparecem; 3) Através de triagem, é
possível identificar as sequências distintas entre elas e também a que genes elas
pertencem.
Em suma, muitas atividades distintas poderiam ser criadas a partir dessas
breves atividades experimentais, como as pesquisas básicas no Entrez, em que é
possível pesquisar o GenBank, ou outro banco de dados. Exemplo: uma turma de
estudantes pode ser incumbida de investigar o gene da fibrose cística, no braço
longo do cromossomo 7 humano, e tentar identificar os seus 24 éxons; depois,
verificar como fica o seu transcrito, o mRNA; e, por fim, analisar a proteína CFTR
resultante, localizando nela os seus sítios de ligação ATP. A implementação da
primeira atividade revela-se importante para a experimentação proveitosa da
segunda; que surge, no contexto escolar, dependente da anterior, daquela atividade
de familiarização com os signos do código genético. É assim que surge a terceira
atividade, tão simples quanto a primeira e com finalidade idêntica: preparar o
estudante para tirar vantagens das novas ferramentas da biotecnologia.
O objetivo mais imediato da atividade comentada agora é o de apresentar,
ao estudante, as sutis transformações do RNA e suas implicações na regulação da
expressão dos genes. É certo que muito ainda será revelado sobre o RNA, ganha
força uma hipótese do “mundo do RNA”, que seria o material genético primordial,
sustentada no fato de ele poder ser produzido em condições abióticas; de poder se
multiplicar, produzindo versões ligeiramente diferentes entre si; e de poder controlar
reações químicas, como fazem as ribozimas. Para além de sua função na síntese de
cadeias polipeptídicas, os RNA bifilamentares são essenciais na regulação da
expressão gênica. Em benefício da curiosidade dos estudantes, os dsRNA
participam de uma série de acontecimentos, desde sua transcrição ou produção in
vitro, até a sua interferência na tradução do mRNA, que eles podem ser
considerados também bons elementos de atividades didáticas criativas. O estudante
poderá exclamar, observando as metamorfoses do RNA que trabalha na via do
RNAi: como é maravilhosa a vida; como tudo pode funcionar tão perfeitamente e
com o requinte de detalhes! A mensagem do gene mir é transcrita e editada, torna-
se dsRNA para que, posteriormente, possa assumir as formas de siRNA e miRNA, e
ser o RISC-maestro que comanda a expressão harmônica de todo o ser vivo! Não
custa nada colocar-se um pouco no lugar de um estudante com espírito
investigativo, aliás, este exercício imaginativo é fundamental na hora de decidir-se
por uma atividade ou outra.
Antes dessa atividade, porém, os conteúdos básicos, sobre os mecanismos
celulares biofísicos e bioquímicos; a transmissão de características hereditárias; e os
organismos geneticamente modificados; entre outros temas, todos devem, já, fazer
parte das conquistas dos estudantes na área de seus conhecimentos científicos.
Neste sentido, as intervenções com atividades de fixação deverão funcionar e
colaborar decisivamente para mobilizar o estudante, uma vez que, explicitamente,
provoca-o a desvendar, em meio aos movimentos abstratos de signos elementares
(A,T,C,G), o movimento maior da perpétua linguagem da vida.
CONCLUSÃO
A posse intelectual de novos modelos teóricos e explicativos, nos campos da
biofísica, bioquímica e da biologia molecular, amplia e diversifica as possibilidades
de transmitir, aos estudantes, o pensamento biológico da era da manipulação
genética. A delicadeza do tema, sobretudo quando aborda-se a linha germinativa da
terapia gênica, impõe uma transmissão de conceitos precisos, para que ela, de fato,
contribua na formação de sujeitos atuantes e críticos em relação aos conteúdos
apreendidos. O conhecimento dos processos naturais, da biologia e da genética, é
responsável pelo desenvolvimento das técnicas artificiais de manipulação genética.
Mas o inverso é também certo: o desenvolvimento das técnicas de manipulação
genética é o responsável pelo acelerado conhecimento dos processos biológicos no
âmbito dos genomas. Há, portanto, nesta relação de ida e volta, do in vivo ao in vitro
e vice-versa: de um lado, o conhecimento do funcionamento da natureza; e, do outro
lado, a técnica para a intervenção na natureza. Sendo assim, o principal conteúdo
prático a ser transmitido ao estudante são as técnicas de intervenção na estrutura do
material genético, uma vez que são as protagonistas, tanto no esforço de entender e
explicar a diversidade dos mecanismos biológicos; quanto no impulso em intervir,
usar e manipular estes mesmos mecanismos para desenvolver remédios, modificar
a estrutura de seres vivos ou criar testes de fragmentos de DNA.
O estudante melhorar na sua apropriação de conceitos científicos ao
apropriar-se deles a partir das técnicas pelas quais eles foram elaborados.
Naturalmente, ao conhecer todo o percurso de uma técnica, o estudante faz
relações, por exemplo, entre a eletroforese, técnica no mais das vezes trabalhada
em química; e os deslocamentos eletrofísicos das moléculas no gel, que fazem a
magia da leitura das sequências de bases pela técnica de Fred Sanger. Nos
desdobramentos, vemos florescer a linguagem colorida da genética, com os seus
corantes fluorescentes ao raio laser; e a linguagem em miniatura, o que equivale a
dizer, chip gênico, uma espécie de biblioteca do livro da vida. A história é tão rápida
que dá a impressão de que perdemos alguma coisa; e que só a atualização nos põe
de volta nos caminhos das novas práticas. Esta tarefa não é inalcançável, a
construção do pensamento biológico está em alta, as atividades em sala de aula
devem aproveitar-se disso. Ao estudante, é bem-vindo todo o conhecimento
adquirido, desde que o auxilie nas tomadas de decisão frente aos transgênicos ou
outras tecnologias; e o provenha de métodos e ferramentas para formação do
pensamento analítico e crítico sobre os fatos científicos. Se estas escolhas
metodológicas não fizerem dele um cientista; servirão, certamente, para desenvolver
as competências e habilidades necessárias à sua interação crítica com a
biotecnologia e com a sua vida cotidiana.
REFERÊNCIAS
AMABIS, J. M. MARTHO, G. R. Biologia. Vols. 1, 2 e 3; 2.ed. São Paulo: Editora
Moderna, 2004.
AZEVÊDO, E. S. DESAFIOS DA BIOÉTICA NO SÉCULO XXI. Gazeta Médica da
Bahia. Salvador, n.1, março, 2008. Disponível em:
http://www.gmbahia.ufba.br/index.php/gmbahia/article/view/237/0. Acesso: 27 dez.
2010.
FONSECA, C. A certeza que pariu a dúvida: paternidade e DNA. Estudos
Feministas. Florianópolis, n.2, janeiro, 2004. Disponível em:
http://www.scielo.br/pdf/ref/v12n2/23958.pdf. Acesso: 03 jan.2011.
MENCK, C. F. M. A nova grande promessa da inovação em fármacos: RNA
interferência saindo do laboratório para a clínica. Estudos Avançados, SciELO
Brasil, São Paulo, n.70, setembro, 2010. Disponível em:
http://www.scielo.br/pdf/ea/v24n70/a07v2470.pdf. Acesso: 19 mar. 2011.
PARANÁ, SECRETARIA DE ESTADO DA EDUCAÇÃO. Diretrizes Curriculares
Estaduais - Biologia. Curitiba, 2008.
PENA, S. D. J. Medicina genômica personalizada aqui e agora. Revista Médica de
Minas Gerais – RMMG, Belo Horizonte, n.3, agosto, 2010. Disponível em:
http://rmmg.medicina.ufmg.br/index.php/rmmg/article/viewFile/272/256. Acesso: 19
mar. 2011.
SNUSTAD, D. P. SIMMONS, M. J. Fundamentos de Genética. Tradução: Paulo A.
Motta. 4. ed. Rio de Janeiro: Guanabara Koogan, 2008.
ULRICH, A. H. (org.); et. al. Bases moleculares da biotecnologia. São Paulo:
Editora Roca, 2008.
WATSON, J. D. BERRY, A. DNA: O Segredo da Vida. Tradução: Carlos Afonso
Malferrari. São Paulo: Companhia das Letras, 2005.