terça-feira, 27 de julho de 2010

Sobre dados moleculares à luz da comparação entre análise particionada e de evidência total

ResearchBlogging.org

por Leandro Pereira Tosta

email: leandropereiratosta@gmail.com

Atualmente, as fontes de evidências disponíveis para se estabelecer hipóteses sobre a organização hierárquica entre os seres vivos são bastante diversificadas. Podem-se utilizar parâmetros morfológicos e moleculares que, quando bem aplicados, à luz de uma metodologia consistente, pode gerar bons resultados em termos de classificações filogenéticas. Na construção de árvores filogenéticas consistentes deve-se primar, inicialmente, por caracteres que promovam agrupamentos entre os táxons – no caso do presente trabalho, por dados moleculares, que constituirão uma matriz de dados (base na construção das árvores).

Tendo em vista dados de recentes dos trabalhos sobre filogenia de Arthropoda (Cunningham et al., 2010), para melhor compreensão das hipóteses, faremos uma análise dos resultados moleculares na forma particionada, para cada um dos marcadores que foram usados no trabalho original supracitado, e na forma simultânea, utilizando todos os resultados para a obtenção de uma hipótese única, a fim de se criar um modelo filogenético sólido.

Quando se deseja apresentar “quão válida” é uma hipótese, deve-se considerar uma visão racional sobre ela. Caso não haja um sentido racional, o pesquisador pode incorrer em uma opinião, no mínino, tendenciosa. O “sentido racional” pode ser estabelecido por meio de uma “lógica indutivista” caso haja à disposição “elementos confiáveis” e pertinentes à defesa da hipótese (entende-se “elementos confiáveis” como sendo dados empiricamente satisfatórios).

Popper já discutia os problemas da teoria do inducionismo para o falseamento de hipóteses (Popper defendia o deducionismo como método científico).Para exemplificar o caso, usemos o exemplo hipotético de um trabalho com aves. O pesquisador de campo verifica a presença de 10 patos dentre as aves observadas. Todos os patos apresentam coloração marrom. O pesquisador considera que todos os patos da região pesquisada são marrons. Na realidade, nada impede que outras aves que habitam a região, em outras épocas do ano, tenham coloração diferente. O simples fato da observação restringir-se a patos marrons não significa que todos os patos existentes sejam dessa cor! Isso faz com que nosso pesquisador apresente um resultado “viciado”. À luz dos dados filogenéticos, nosso caso pode ser apresentado da seguinte forma: têm-se uma amostra definida de nucleotídeos de uma determinada região do DNA de diversos grupos de animais. Se partirmos desse determinado conjunto de dados e usarmos tais resultados para inferência de filogenias entre as espécies pode haver, devido a uma série de alterações mutacionais, um “vício” da solução que se almeja apresentar – em suma, a solução sugerida pelo conjunto de dados amostrado não necessariamente reflete a realidade do processo evolutivo. A interpretação pode ser uma “indução” e, assim, no falseamento da hipótese, pode-se verificar, por exemplo, a não congruência em relação às filogenias já apresentadas por meio de análises morfológicas.

Evidência Total

Pode-se interpretar os dados filogenéticos como “protagonistas” da evolução. Em linhas gerais, ao se alterar o meio, selecionam-se geneticamente os organismos mais bem adaptados. Para serem repassadas tais informações genéticas, os organismos devem possuir sutis diferenciações a nível genético. E são as diferenças em nível molecular, em diversificadas regiões do material genético, as responsáveis por induzir “anomalias” nas interpretações filogenéticas com dados moleculares quando são comparados táxons próximos. Interpretar de forma equivocada os dados moleculares pode induzir o pesquisador a considerar “uma parcela dos dados como a imagem do todo”, ou seja, interpretar singularmente as regiões do material genético com fatores que levam à “verdade” pode levar a erros de interpretação da evolução dos grupos sob escrutínio.

Dessa forma, para podermos assumir evidências com maior grau de confiabilidade para interpretação dos dados moleculares na montagem de filogenias, deve-se utilizar das observações conjuntas na forma conhecida como “evidência total”, i.e., simultânea, que traga uma compilação dos resultados particionados em uma mesma matriz. Logo, avalia-se que praticar a análise individual dos dados pode transmitir informações não condizentes com o real.

Considerando a importância da evidência total, devemos considerar, também, duas importantes visões que implicadas no problema, uma sobre parcimônia e outra sobre os debates entre argumentos favoráveis, de um lado, à análises simultâneas e, de outro, à análises com dados particionados.

Sobre parcimônia, análise simultânea e particionada

Uma das vertentes que defendem a aplicação de “evidência total” é o da análise filogenética com base no critério da parcimônia. Todas as evidências são utilizadas para resolução da hipótese porque, com um maior número de dados, é mais possível que a hipótese mais parcimoniosa, em potencial, e que se revele a partir da análise das evidências, tenha maior poder explicativo (“poder explanatório máximo”).

Para exemplificar a idéia, retomemos aos patos do exemplo citado anteriormente. Suponha que o mesmo pesquisador, tendo em vista o problema de “vício” do conjunto de patos observados, tenha retomado seus trabalhos de campo. Na nova observação, sob um intervalo maior de pesquisa, considerando as rotas de migração e outros fatores que ele julgar importantes, o pesquisador tenha observado maior diversidade de espécies. Dentre a nova amostra coletada, havia patos pretos, brancos, marrons, e, dentre estes, um com plumagem verde e negra. Como método, nosso pesquisador descreveu todos os patos observados. O pesquisador, separadamente, considerou cada organismo como parte do ecossistema da região. A análise pode ser falseada se, por um motivo externo, descobrir-se que o pato com plumagem verde e negra não pertence ao hábitat local, (ele pode ter se perdido do resto da sua família). Com o método da análise de parcimônia, devem-se contabilizar todos os patos, mas nem todos servem para descrever a comunidade de patos da região observada (deve-se desconsiderar, no caso, a presença do pato incomum ao restante do grupo).

No caso das análises filogenéticas de parcimônia usando dados moleculares, devem-se interpretar os dados com um todo, porém, faz-se necessário a visão de uma “gama” maior de dados e interpretação na forma de grupo. Assim, desconsiderar-se-á dados que venham a possuir informação não representante de “um todo”. A análise simultânea é uma ferramenta bastante útil se considerarmos os dados como um todo. Mas, via de regra, deve-se ponderar quando é possível analisar e desenvolver a hipótese a partir de modelos com máxima parcimônia. O uso de análises particionadas, i.e., com vários conjuntos de dados sendo analisados separadamente, servem de evidências preliminares para posterior organização da análise dos dados em conjunto. Assim, com intuito de relacionar as análises antes particionadas, é criado um “super matriz” e a análise final é feita sob a óptica da evidência total.

Afinal...

Não se devem considerar as análises particionadas como sendo fatores últimos de evidência para uma hipótese, caso haja qualquer probabilidade da hipótese obtida ser mais frágil do que aquela derivada de uma análise com evidência total. Essa fragilidade pode ser registrada quando a hipótese não assume máxima parcimônia ou quando não pode assumir registro empírico. Uma possível solução para conjuntos de dados muito grandes é a utilização de modelos combinados: (1) filogenias prévias com os vários marcadores sendo analisados separadamente e de forma paralela, que podem ser comparadas com filogenias provenientes de outros conjuntos de dados (como morfológicos, comportamentais, ecológicos, etc). Elas podem servir para analisar o potencial de resolução das relações filogenéticas de determinados dados; e (2) análises de evidência total, para a obtenção de filogenias robustas e melhor resolvidas em todos (ou pelo menos na maior parte) dos nós da árvore.

Referências

FITZHUGH, K, The ‘requirement of total evidence’ and its role in phylogenetic systematics. Biology and Philosophy, Springer Press, Los Angeles, 2006.

NEY, M. e KUMAR, S. Molecular evolution and phylogenetics. Oxford University Press, New York, 2000.

Regier JC, Shultz JW, Zwick A, Hussey A, Ball B, Wetzer R, Martin JW, & Cunningham CW (2010). Arthropod relationships revealed by phylogenomic analysis of nuclear protein-coding sequences. Nature, 463 (7284), 1079-83 PMID: 20147900

quarta-feira, 2 de junho de 2010

Evo-devo: sobre genes homeóticos e "kit de ferramentas"

ResearchBlogging.orgAnna Carolina Russo C. Martin
anna.russocm@gmail.com

A morfologia orientou durante um bom tempo os trabalhos de reconstrução das relações de parentesco entre as espécies a partir do reconhecimento de suas semelhanças. Neste interim, acreditava-se que quanto maior fosse a semelhança morfológica entre dois táxons terminais, maior seria a semelhança genética entre eles, e vice e versa. Porém, como podemos ver em ensaios anteriores, podem existir semelhanças genéticas entre espécies muito distintas morfologicamente. Isso porque existem alguns genes compartilhados por vários grupos – não proximamente aparentados segundo as filogenias – que são responsáveis por ativar partes do DNA que irão diferenciar partes do corpo desses animais, portanto uma espécie pode conter um gene que está desativado e desta forma não é expresso nela, mas em uma outra espécie ele está ativado. Isso as deixa morfologicamente diferentes.

Se olharmos as diferenciações que ocorrem desde o estágio de zigoto, podemos observar que de uma única célula é originado um conjunto de sistemas extremamente complexo, através de processos de especializações das células de acordo com a função que ela desempenhará no indivíduo adulto, sendo esta determinada através de ativações nos genes que farão com que haja a produção seletiva de proteínas.

As informações necessárias para entender como acontece esse mecanismo detalhadamente foram obtidas em um primeiro momento através de estudos em bactérias Escherichia coli (que possui apenas um par de cromossomos), e deram um importante embasamento nas análises do desenvolvimento e da evolução de tanto desse organismo quanto de drosófilas e até mesmo vertebrados. Um exemplo são os dados provenientes de um experimento realizado pelos cientistas François Jacob e Jacques Monod (ver Carroll, 2006, p. 61–62). A E. coli degrada principalmente glicose como fonte de energia, porém, na ausência de glicose e presença de lactose (um outro carboidrato), a bactéria libera a enzima beta-galactosidade, que quebra a lactose em glicose e galactose, que podem ser absorvidas pela bactéria. Os dois cientistas, juntamente com André Lwoff, ao pesquisarem qual mecanismo faz com que a E. coli, na ausência de glicose, começa a produzir altas quantidades de beta-galactosidade, descobriram que a indução enzimatica acontece da seguinte forma: quando não há lactose no meio, um interruptor, que seria uma proteína repressora, reconhece uma sequência gênica que se localiza próxima do gene que traduz a beta-galactosidade e liga-se a essa sequência inativando o gene. Porém, quando há lactose no meio, essa proteína inibidora solta-se da sequência de DNA deixando o gene de beta-galactosidade ativo, pronto para ser transcrito (Figura 1).

Figura 1. Esquematização do mecanismo de produção de beta-galactose em E. coli.

O uso controlado do gene através de uma proteína repressora e o fato dela reconhecer no DNA uma sequência específica próxima ao gene de trancrição são dois apectos da lógica genética que veremos se repetir inúmeras vezes. Esse processo é chamado de regulação gênica.

Uma vez entendido o funcionamento da regulação gênica, podemos passar para o próximo passo que é o descobrimento dos genes mestres, que se repetem nas diferentes espécies de animais (como citado por Carroll (2006), "da E. coli aos elefantes"), e que codificam estruturas importantes como olhos, apêndices e o próprio coração.

A descoberta destes genes começou com estudos em drosófilas no laboratório de Walter Gehring, na Universidade da Basiléia (Suíça), em que foi isolado o gene eyeless que, quando mutado, é responsável pela perda dos olhos em moscas. Gehring e sua equipe descobriram que o eyeless corresponde ao gene Aniridia, presente nos seres humanos, e ao small eye, nos camundosgos. A partir daí, concluiu-se que a maquinaria genética que expressa os olhos não surgiu 40 vezes de forma independente durante a evolução animal, como se pensava, mas apenas uma vez sendo acionado várias vezes nas diferentes espécies. Esse complexo gênico ficou conhecido como Pax 6. Depois dele, muitos outros genes homeóticos foram descobertos, tal como o Distal less, responsável pela formação de apêndices (ou de qualquer coisa que se projete para fora do corpo de um animal), e o gene Tinman, responsável pelo aparecimento de bombas circulatórias como o coração.

Os genes mestres, assim chamados por Carroll (2006), sozinhos ainda não são capazes de conseguir organizar e "construir" um animal, afinal apesar deles serem responsáveis por grande parte das estruturas vitais nos animais, não são responsáveis por sua organização. Ainda no laboratório de Gehring, foi descoberto através de estudos na drosófila que, para cada um dos genes mestres existe um homeobox (ou gene hox) responsável pelo local de surgimento da estrutura expressa. Por exemplo, o gene Tinman possui um homeobox que sinalizará o local de surgimento do coração em um camundongo, por exemplo. Além disso, foi descoberto que a disposição desses homeobox no DNA corresponde ao local de aparecimento dessas estruturas no corpo do animal adulto (Figura 2).

Figura 2. Representação dos genes Hox em drosófila com seu posicionamento no DNA e seus respectivos locais de expressão.

Desta forma, podemos dizer que cada animal possui um "Kit de ferramentas" que, quando unidos, são capazes de construir um animal. Não importa seu tamanho nem sua complexidade, todos animais são definidos a partir de um pool gênico compartilhado, com pequenas alterações, cuja expressão diferencia-se por sua ativação ou desativação em determinadas espécies, e por pequenas mutações que podem ocorrer durante a história evolutiva.

Bibliografia:

Carroll, S.B. 2006. Infinitas Formas de Grande Beleza: Como a evolução forjou a grande quantidade de criaturas que habitam nosso planeta. 1ª. ed. Rio de Janeiro: Jorge Zahar Editor, 09 –81.

Gehring, W., & Hiromi, Y. (1986). Homeotic Genes and the Homeobox Annual Review of Genetics, 20 (1), 147-173 DOI: 10.1146/annurev.ge.20.120186.001051

GEHRING, W. (2001). The genetic control of eye development and its implications for the evolution of the various eye-types Zoology, 104 (3-4), 171-183 DOI: 10.1078/0944-2006-00022

Koroma BM, Yang JM, & Sundin OH (1997). The Pax-6 homeobox gene is expressed throughout the corneal and conjunctival epithelia. Investigative ophthalmology & visual science, 38 (1), 108-20 PMID: 9008636

Quiring R, Walldorf U, Kloter U, & Gehring WJ (1994). Homology of the eyeless gene of Drosophila to the Small eye gene in mice and Aniridia in humans. Science (New York, N.Y.), 265 (5173), 785-9 PMID: 7914031

Robert J. S. 2001. Interpreting the homeobox: methaphors of gene a.ction and activation in development and evolution. Evolution & Development 3:4 287-29

Zhang J, & Nei M (1996). Evolution of Antennapedia-class homeobox genes. Genetics, 142 (1), 295-303 PMID: 8770606

sexta-feira, 16 de abril de 2010

Como surgem os animais: alteração nas estruturas repetidas e variantes homeóticas

ResearchBlogging.org
Anna Carolina Russo C. Martin
anna.russocm@gmail.com

Antes de estudarmos a fundo os genes responsáveis pelo desenvolvimento de um animal, precisamos compreender como se dá seu desenvolvimento morfológico para que, desta forma, possamos procurar em seu material genético os genes responsáveis por expressar aquelas determinadas variações morfológicas. Podemos começar, então, observando a morfologia externa de um animal.

Uma formiga possui segmentos em seu corpo que podem ser descritos como partes semelhantes que se repetem ao longo de seu corpo. Seus segmentos seguem um mesmo padrão morfológico, porém se diferenciam em algumas partes dependendo de sua função, por exemplo, em um segmento temos a expressão de antenas e em outro a de apêndices locomotores (as chamadas pernas). Essas estruturas repetidas e de arquitetura modular (partes semelhantes) são muito encontradas entre os Metazoa, desde os primeiros registros fósseis dos organismos com simetria Bilateral. Um exemplo é a modularidade dos membros dos vertebrados com quatro patas, uma condição originada no ancestral comum dos tetrápodes.

Qualquer estrutura originária de uma mesma série repetida que sofreu diversas modificações e diferenciações é conhecida como homologia serial. Como exemplo, em alguns achados fósseis são encontradas estruturas repetidas, como os dentes, que, ao longo da evolução, modificaram-se, sendo selecionado um padrão da maquinaria dentária específica para cada hábito alimentar (como a presença de caninos em animais carnívoros). Temos que tomar cuidado para não confundirmos homologia serial com homologia no sentido de estrutura que surge no ancestral comum e se modifica a partir dele, estando presente nos seus descendentes. O termo homologia ainda não tem um consenso em sua definição, porém sabe-se que ela é a base da biologia comparada. Uma definição breve sobre homologia seria que ela se refere à comparação entre dois caracteres presentes em dois táxons distintos que foram originados de um mesmo ancestral. Esse tipo de comparação facilita o entendimento da evolução e é base da análise filogenética.

A observação das homologias seriais ao longo da evolução é muito importante para entendermos como se expressa a morfologia. Sabemos que a modularidade, simetria e polaridade são características básicas para a formação de um animal, portanto, uma vez conhecida as suas características morfológicas básicas, podemos procurar onde elas se originam e qual sua base de formação (que deve ser igual para todos, o DNA).

Podemos começar entendendo alguns experimentos que foram feitos por biólogos que tentavam descobrir algumas regras de formação dos animais através de cortes e mesclas de partes diferentes do embrião em diferentes fases de formação.

Um desses experimentos, em especial, foi o de Hans Spemann ver Carroll, páginas 45 e 46).
Ele usou um fio de cabelo de bebê para separar as metades do embrião na fase de gástrula (quando aparece o primeiro orifício do embrião, o blastóporo) de uma salamandra. Essas metades geraram girinos de salamandras normais. Em um segundo experimento, ele cortou novamente o embrião em duas partes, mas desta vez enlaçando-o perpendicularmente, o que gerou um girino e uma massa amorfa de células. Spemann chegou a conclusão de que o lábio dorsal do blastóporo era muito importante para o desenvolvimento embrionário. Com essa conclusão ele realizou um terceiro experimento no qual retirou o lábio dorsal do blastóporo de um embrião e colocou em outro blastóporo de outro, o que gerou um girino de salamandra com duas cabeças.

Bateson, um colecionador dessas anomalias, organizou, catalogou e descreveu inúmeros animais mutantes no tratado “Material for the study of variation”, de 1894. Ele classificou essas anormalidades em dois tipos básicos:

1º Número de partes repetidas alterado;

2º Uma parte do corpo assumira a parte de outra (originando as chamadas variantes homeóticas).

Essas mutações da segunda classificação são muito curiosas por se tratarem de alterações em genes isolados. Isso não significa, porém, que um organismo que sofreu tal mutação necessariamente originará uma nova espécie, uma vez que a seleção natural poderá impedir a transmissão de seus caracteres pelo fato dos organismos modificados serem, geralmente, inaptos à vida. Porém, isso não significa que esse tipo de mutações não possa gerar novas morfologias em um único salto evolutivo.

Com o estudo em drosófilas, descobriu-se que um pequeno número de genes homeóticos gera diferentes formas quando mutado. Isso indica que alguns poucos genes chamados de genes mestres “gerenciam” a diferenciação dessas partes do copo que são homólogas seriais, ou seja, originário de uma mesma série repetitiva que se diferenciou.

Uma vez entendido o funcionamento do surgimento de novas estruturas, temos que nos aprofundar no funcionamento desses genes mestres. Para isso, é preciso uma maior compreensão do DNA e do funcionamento dos genes, partindo da compreensão de suas estruturas nos diferentes animais.

Bibliografia:

CARROLL, S.B. 2006. Infinitas Formas de Grande Beleza: Como a evolução forjou a grande quantidade de criaturas que habitam nosso planeta. 1ª. ed. Rio de Janeiro: Jorge Zahar Editor, 09 – 55 p.
SANTOS, C.M.D. 2008. Os dinossauros de Hennig: sobre a importância do monofiletismo para a sistemática biológica. Scientiae Studia, 6: 179-200.
Santos, C.M.D., & Calor, A.R. (2008). Using the logical basis of phylogenetic as the framework for teaching biology Papeis Avulsos de Zoologia, 48 (18), 199-211

Referências figuras:
Richard C. Brusca, Gary J. Brusca, Invertebrates, 100
http://www.nature.com/nrm/journal/v7/n4/fig_tab/nrm1855_F1.html

sexta-feira, 12 de março de 2010

Adentrando no mundo da filogenia por dados moleculares - II

ResearchBlogging.orgpor Leandro Pereira Tosta
leandropereiratosta@gmail.com

Mudanças evolutivas em nível molecular são r
esponsáveis pela diversificação das espécies que habitam o globo. Isso tem acontecido desde o surgimento dos primeiros organismos, através da replicação das informações do genoma juntamente com mutações - erros na replicação - que vão se somando ao longo do tempo .

É de praxe dizer que a análise do genoma de diversas espécies é ferramenta de importância fundamental como fonte de informações para a biologia moderna. Mas, o que é genoma? Em linhas gerais, o genoma de um organismo é o seu conjunto de informações genéticas, sejam elas codificantes ou não.

As informações genéticas de um organismo pode
m ser transmitidas via reprodução sexuada ou assexuada (informações essas presentes no núcleo da célula) ou ainda transmitidas por meio de cloroplastos e mitocôndrias. Tanto os genes das mitocôndrias como os dos cloroplastos somente codificam as proteínas participantes da manutenção de suas próprias funções e para a expressão (Calcagnotto, 2001).

A evolução molecular investiga os mecanismos e consequências da evolução de macromoléculas em tópicos como as relações existentes entre as estruturas genéticas, protéicas e funcionais dos organismos (Heller et al., 2009). O alvo primeiro dos cientistas que estudam a evolução molecular dos organismos animais e vegetais é a mutação (variação nos parâmetros genéticos originais de um táxon considerado) ocorrida nos nucleotíde
os. A mudança na sequência de nucleotídeos pode, por exemplo, originar mudança na configuração das trincas e assim na configuração do aminoácido.

Uma preocupação que se tem ao iniciar os estudos consiste na escolha da base de dados. Ela é crucial já que árvores construídas para um mesmo grupo de organismos com base em conjuntos de dados diferentes podem resultar em filogeni
as diferentes (Russo et al., 1996; Kelsey et al., 1999). Para dados moleculares, independentemente de que gene ou porção do DNA é utilizada, é possível prever as taxas de substituições, os números de substituições de duas sequências homólogas de ancestrais comuns e o tempo de divergência das linhagens, dado pala fórmula “r = K/2T”, onde “r” é a taxa de substituição de nucleotídeos, “K” o número de substituições moleculares por sítio entre duas sequências homólogas e “T” o tempo de divergência (Li, 1997). Comparando-se a quantidade de substituições de nucleotídeos em algumas proteínas e o tempo de divergência de algumas espécies, no exame de táxons cada vez mais distantes, pode-se se montar uma escala cronológica e, dessa forma, inferir as idades de surgimento dos grupos biológicos durante a história evolutiva do planeta (Calcagnotto, 2001).

O alinhamento de sequências
Uma das principais vantagens de se trabalhar com sequências moleculares é que podemos escolher genes qu
e apresentam variabilidade compatível com o problema genético em questão (Russo et al., 1996) o que depende das métodos empregados e de uma boa amostragem de alinhamentos dos sítios em análise. O objetivo do alinhamento é identificar a homologia entre a posição (sítio) de cada base (ou aminoácido) que esteja sendo comparado entre duas ou mais sequências (Russo, 2001).

Após serem escolhidas as bases de comparação dos organismos que serão analisados, sejam elas DNA ou aminoácidos que não apresente
m mais de 20% ou 30% de diferença entre pares de sequência de nucleotídeos, inicia-se o processo de análise. Nesse sentido, caso o gene seja muito variável ou muito conservado, outro gene deve ser procurado (Russo et al., 1996)

Uma técnica relativamente simples é o “alinhamento de sequências”. O número mínimo amostral de organismos para inferir algum tipo de parentesco evolutivo é três, pois a relação colateral é interpretada como “A está mais próximo de B e
m relação a C”, i.e., A é grupo-irmão de B pois carrega um ancestral exclusivo não compartilhado com C. Para exemplificar o exposto, analisemos a figura a seguir:

Para o alinhamento de seqüências, após escolhidos os táxons e as regiões de DNA que serão analisados, procede-se com a comparação do locos gênico de proteínas homólogas dos organismos (homologias nas ciências biológicas inferem a existência de uma característica comum as pelo menos duas espécies que comp
artilham um ancestral comum exclusivo). Nesta etapa, analisam-se as regiões que possuem maior similaridade. Tais regiões são base do trabalho de análise. Com as sequências estabelecidas, monta-se uma “matriz de similaridade” que tem por objetivo a soma e a diferença entre cada par de organismos (Heller et al., 2009). Para análise de sequências divergentes mais longas, faz-se uso de algoritmos computacionais de análise probabilística (Nei e Kumar, 2000) no alinhamento de sequências de aminoácidos e de nucleotídeos (em softwares como ClustalW, ESEE, TreeAlign...).

Para as sequências de DNA alinhadas na matriz de similaridade, pode-se contar o número de diferenças em posições de nucleotídeos homólogos, que indicam o número mínimo de substituições nucleotídicas que deve ter ocorrido entre duas sequências (Heller et al., 2009). Consideram-se as seguintes possíveis substituições:

Substituição múltipla: duas ou mais substituições ocorreram em dado lócus entre os organismos ancestrais e os descendentes.

Substituições coincidentes: substituições alea
tórias diferentes ocorrem do ancestral para os descendentes.

Substituições paralelas: a mesma substituição ocorre independentemente entre o ancestral e cada descendente.

Substituições de retorno: substituição onde o nucleotídeo muda ao longo do tempo e depois, aleatoriamente, retorna à configuração original.

Tamanhos de sequências em análiseNão há
uma regra sobre o tamanho de sequências a ser comparadas. Porém, em teoria há uma uma maior confiabilidade em análises com maior número de amostras. Além disso, não basta analisarmos apenas grandes amostras, mas sim amostras sobre diferentes métodos, de locais gênicos diferentes e, de preferência, com sequência com grande número de nucleotídeos, quando possível.

Genes Homólogos
Todos os genes são, de uma forma ou outra
, homólogos, uma vez que pode-se traçar a história evolutiva de todos os organismos até o ancestral comum dos seres vivos. Genes existem sob duas formas: ortólogos (genes encontrados em diferentes táxons que, ao serem comparados, são passíveis de rastreamento até os eventos que levaram à especiação) e parálogos (genes em iguais ou diferentes táxons relacionados à ocorrências de duplicação gênica). Dado um gene “x”, que, a partir de um evento de duplicação gênica, passa a apresentar duas cópias, “x” e “y”. Tais cópias, x e y, são chamadas de cópias parálogas do mesmo gene x. Supondo que, ao longo tempo, essa população passe por um evento de especiação, as duas cópias x e y irão evoluir independentemente nas duas espécies, acumulando substituições únicas e, por conseguinte, diferenciando-se. Logo, as cópias resultantes x’, x” e y’, y” serão cópias ortólogas (Russo, 2001).

Para reconstruções da história evolutiva, usam-se genes homólogos ortólogos. Para reconstruções na história das alterações das funções devido às duplicações gênicas, usam-se genes homólogos parálogos.

É importante deixar claro, para finalizarmos, que a escolha cuidadosa do gene é muito mais importante do que a escolha do método de reconstrução filogenética, i.e., a diferença de eficiência na reconstrução da filogenia verdadeira é muito maior quando se comparam genes codificadores de proteínas diferentes do que quando comparam os resultados oriundos de uma mesma base de dados analisada a partir de métodos de reconstrução filogenética diferentes (Russo, 2001).

Referências

Calcagnotto, D., Taxas de evolução e o relógio molecular. In Matioli, S.R. (ed.) Biologia Molecular e Evolução, 5:51-61, Holos Editora, Ribeirão Preto, 2001.
Heller et al., Vida a Ciência da Biologia, Vol. II Evolução, Biodiversidade e Ecologia, p. 524-539, Editora Artmed, São Paulo, 2009.
Hennig, W., Grundzuge einer theorie der phylogenetischen Systematics, Deuscher Zentralverlag, Berlin, 1950.
Kelsey, C.R., Crandall, K.A. e Voevodin, A.F., Diferent models, different Trees: the geographic origin of PTLV-1, Mol. Phylogenet. Evol. 13: 336-347, 1999.
Li, W-H, Molecular Evolution, Sinauer Associates, Sunderland Massachusetts, 1997.
Miyaki C.Y.,Russo, C.A.M., Reconstrução filogenética: Métodos probabilísticos, S.R. (ed.) Biologia Molecular e Evolução, p. 117-127, Holos Editora, Ribeirão Preto, 2001.
Miyaki C.Y., Russo, C.A.M., Pereira, S.L., Reconstrução filogenética. Introdução e o método da máxima parcimônia, S.R. (ed.) Biologia Molecular e Evolução, p. 97-107, Holos Editora, Ribeirão Preto, 2001.
Ney, M. e Kumar, S. Molecular evolution and phylogenetics. Oxford University Press, New York, 2000.
Russo, C.A.M., Como escolher genes para problemas filogenéticos específicos. In Matioli, S.R. (ed.) Biologia Molecular e Evolução, 12:130-135, Holos Editora, Ribeirão Preto, 2001.
Russo CA, Takezaki N, & Nei M (1996). Efficiencies of different genes and different tree-building methods in recovering a known vertebrate phylogeny. Molecular biology and evolution, 13 (3), 525-36 PMID: 8742641

quinta-feira, 11 de março de 2010

Perdas gênicas e a reconstrução da evolução dos Metazoa

Anna R. C. Martin
anna.russocm@gmail.com

Genes identificados nas seqüências de apenas um grupo taxonômico e não em outros, tem sido naturalmente considerados como novidades evolutivas (Raible, 2004). Ou seja, alguns genes considerados exclusivos de um determinado táxon identificariam uma novidade evolutiva provavelmente responsável por originar característica nova que levará à divergência do nó ancestral, com o surgimento de novas espécies. Um exemplo seria o surgimento de simetria bilateral, cujo gene responsável provavelmente surgiu no Pré-Cambriano e levou ao aparecimento dos Bilateria.

Figura 1 - Árvore filogenética mostrando a ramificação dos Bilateria no período Pré-Cambriano.

Após análises comparativas de genomas de algumas espécies, verificou-se que alguns genes que pareciam exclusivos de uma determinada espécie estavam presentes também em outras consideradas distantes nas hipóteses filogenéticas disponíveis. Um exemplo é Acropora (grupo de cnidário que formam corais) que se ramifica na filogenia antes de Urbilateria, porém compartilha 12% de genes exclusivos com Homo sapiens contra 1% com Drosophila melanogaster e Caenorhabditis elegans. Há duas hipóteses que explicam esse compartilhamento de genes: a primeira seria que o gene surge em Eumetazoa (presente em Acropora), porém se perde em Protostomia (representado pela ausência em C. elegans e Drosophila) mas não em Deuterostomia (presente em H. sapiens), o que nos faz concluir que H. sapiens perdeu menos genes do que as outras duas espécies de animais bilaterais e que o Urmetazoa era mais complexo do que se esperava, uma vez que esses genes já eram expressos nele. A outra hipótese é que o mesmo gene tenha aparecido no H. sapiens e em Acropora independentemente. No entanto, se considerarmos o princípio da parcimônia, o gene pode ser perdido facilmente mas é improvável que ele surja exatamente igual e independentemente em duas espécies distintas e filogeneticamente distantes (mas não impossível, claro).

Figura 2 – Filogenia de espécies de eucariotos baseada na perda genética (modificado de Kortschak et al. 2003).

O princípio de parcimônia reforça a teoria da perda gênica, que considera que um gene compartilhado por um grupo de espécies pode desaparecer independentemente em cada espécie ou grupo. Um dos motivos para acontecer a perda gênica é quando um gene é pouco acionado. Desta forma, genes com a menor propensão para a perda gênica, durante a evolução, parecem estar mais envolvidos em funções indispensáveis do que os genes que foram perdidos em diferentes linhagens (Krylov et. al. 2004). Portanto, se um gene é mantido durante um longo período na evolução, é de se esperar que sua função seja essencial para a sobrevivência daquela espécie. Por isso que, em uma análise comparativa de genomas, o padrão de conservação de um determinado gene pode ser indicador de genes que expressam funções essenciais. Isso implica que genes expressos evoluem mais lentamente, ou seja, há mais conservação e reparo gênico, impedindo que ele sofra mutações e se perca.

Um exemplo de linhagem que provavelmente sofreu muitas perdas gênicas durante sua evolução é a que deu origem ao Trichoplax adherens, única espécie que compõe o filo Placozoa. Essa espécie pouco conhecida foi descoberta em 1883 em um aquário de água salgada no Instituto Zoológico de Graz, na Austrália. Seu corpo possui de 2 a 3 mm de diâmetro, sendo um organismo morfologicamente simples composto apenas por uma placa de camada dupla de células. Esse organismo tão simples é importante para a compreensão da evolução pelo fato de que ele possui um sistema digestório provisório no qual a camada de células ventral serve como “estômago” após sofrer uma invaginação, que engloba o alimento a ser digerido. Por ter esse sistema, os Placozoa são inseridos na filogenia de Metazoa, por alguns biólogos, entre Porifera e Cnidaria. Mesmo esse posicionamento é controverso, pelo fato do Trichoplax ser um organismo extremamente simples e pequeno, mais até que os próprios poríferos. Além disso, o Trichoplax possui um DNA pequeno (aproximado com o tamanho de uma bactéria ou um protista), o que faz pensar que muitos genes foram perdidos durante a evolução do grupo.

Figura 3 - Trichoplax (modificado de Srivastava et al., 2008)

O estudo da perda gênica começou através de análises comparativas de conjuntos de genes de genomas completamente sequenciados – atualmente, existem poucas espécies com o DNA completamente sequenciado. Essas espécies são chamadas de organismos-modelo ou espécies-modelo e são usadas constantemente em analises comparativas de genomas. Hoje, tem-se o genoma completo da Arabidopsis tatiana (planta), C. elegans, D. melanogaster e H. sapiens (metazoários), Saccharomyces cerevisae, S. pombe (fungos) e Encephalitozoon cuniculi (protozoário), que aparecem usualmente em muitas filogenias de diferentes autores.

O problema de análises filogenéticas usando apenas organismos-modelo é que o espaço amostral é pequeno. A quantidade de espécies com genoma completamente sequenciado e sua diversidade levam a relações de parentescos que vão de encontro com relações filogenéticas já aceitas. Como exemplo, a filogenia da figura 2, que considera H. sapiens mais próximo de D. melanogaster, em relação ao C. elegans (espécie de nematóide). Isso é contrário à diversas outras propostas, que aproximam os nematóides dos insetos. Portanto, comparações feitas com base apenas nestes organismos podem dar uma imagem enganosa das relações de parentesco. Isso porque se analisarmos somente o genoma de duas espécies, pode-se encontrar seqüência semelhantes que aproximam essas duas espécies, mesmo elas sendo morfologicamente muito distintas, como a Acropora e o H. sapiens. Também pode acontecer de os genomas de espécies morfologicamente semelhantes apresentarem pouca similaridade - se a filogenia se baseasse apenas na similaridade genômica, as espécies certamente estariam afastadas filogeneticamente. Isso ocorre porque não está sendo considerado que, ao longo da evolução, pode ter ocorrido uma série de perdas gênicas e mutações que podem levar à divergência de duas sequências gênicas ou manter próximas espécies nas quais ocorreram possíveis perdas.

Figura 4 - Árvore filogenética com todos os metazoários apontando a posição de cada espécie animal da filogenia presente na figura 2.

Uma das possibilidades de diminuir conclusões errôneas sobre as relações de parentesco é analisar as sequências de genes juntamente com a função que ele exerce em cada grupo de metazoários. Análises genéticas recentes mostraram que existem genes homólogos presentes em todos metazoários que são responsáveis por seu desenvolvimento. Esses genes são conhecidos como “caixa de ferramentas” ou genes do desenvolvimento e são responsáveis por ativar outros genes que podem dar origem a apêndices, por exemplo.

Estudos mais completos utilizando dados moleculares nos permitem entender o porquê de alguns metazoários não terem certos genes, como o caso dos Placozoa. Também nos permite saber que, apesar de duas espécies possuírem genes relativamente semelhantes, elas não estão necessariamente próximas em uma árvore filogenética, como é o caso dos H. sapiens e a Acropora. Portanto, uma análise sobre a evolução utilizando apenas um conjunto de dados ou fonte de evidências pode ser menos conclusiva do que se interligarmos vários dos caminhos que levaram a grande diversidade de hoje.

Referências bibliográficas

Kortschak, R., Samuel, G., Saint, R., & Miller, D. (2003). EST Analysis of the Cnidarian Acropora millepora Reveals Extensive Gene Loss and Rapid Sequence Divergence in the Model Invertebrates Current Biology, 13 (24), 2190-2195 DOI: 10.1016/S0960-9822(03)00872-8

Krylov, D. M., Wolf Y. I., Rogozin I. B. & Koonin E. V., 2003, Gene loss, protein sequence divergence, gene dispensability, expression level, and interactivity are correlated in eukaryotic evolution, Genome Res. 13: 2229–2235.

Raible, F. & Arendt, D., 2004. Metazoan evolution: some animals are more equal than others. Current Biology 14: R106-R108.

Srivastava, M., Begovic E., Chapman J., Putnam N. H., Kawashima T., Kou A., Mitros T., Salamov A., Carpenter M. L., Signorovitch A.Y, Moreno M. A., Kamm K., Grimwoods J., Schmutz J., Shapiroi H., Grigorev I. V., Buss L.W., Schierwater B., Dellaporta S. L. & Rokhsar D. S., 2008. The Trichoplax genome and the nature of placozoans. Nature 454:955-960.

sexta-feira, 19 de fevereiro de 2010

Adentrando no mundo das filogenias por dados moleculares

Parte 1

Leandro Pereira Tosta

Universidade Federal do ABC

e-mail: leandropereiratosta@gmail.com

Sistemática: a “arte” de classificar

O ato de organizar e classificar as coisas tem por objetivo a comunicação entre as pessoas. Mas, existe algum padrão nessa comunicação? Todos nós entendemos o que todos nós falamos? A teoria da informação nos traz a resposta: em toda comunicação sempre haverá certo tipo de ruído! O ruído pode ser de cunho cultural, temporal ou espacial. Devemos considerar o momento histórico em que nos encontramos, a cultura que nos forma como pessoas sociáveis (ou não) e onde nos encontramos geograficamente. Logo, não há uma forma padrão de comunicação para tudo e entre todos. Mas há tentativas modernas: a partir da ciência nascente após a revolução francesa, o senso comum deixou de ser a base de medida para todas as coisas. O método científico passou a ser pregado a fim de orientar o homem em direção a um modelo de comunicação no qual todos os falantes que desejam compartilhar dessa “padronização”, necessária e inquestionável, pudessem fazê-lo.

Na sistemática biológica, o ato da classificação segue alguns critérios. Imaginemos descrever uma espécie no norte da África e mais ao sul também ser descrita a mesma espécie. Sabe-se da grandiosa miscelânea cultural africana: sem um padrão, os atos de comunicação, descrição e classificação seriam inviáveis mesmo dentro de um único continente (quem diria o mundo!).

Segundo o entomólogo alemão Willi Hennig (1950), os organismos que compartilhassem condições derivadas de caracteres poderiam ser inferidos como sendo descendentes da espécie ancestral a partir da qual a condição primitiva foi herdada. Para exemplificar, toma-se por base um organismo qualquer que possua apêndices que atue diretamente na sobrevivência desse animal. Ao longo dos tempos mutações e recombinações cromossômicas ocorrem na linhagem que remete a esse organismo, alterando os padrões morfológicos desses apêndices e os dotando de potencial de locomoção (apêndices primitivos dando origem às pernas). Deve-se considerar que as chances de tais alterações proporcionarem melhor desempenho de sobrevida e sexual são ínfimas. É uma loteria natural onde as chances do organismo sobreviver e repassar suas informações são muito pequenas. De qualquer maneira, Hennig chamava as características primitivas (os apêndices primitivos no nosso exemplo) de características plesiomórficas e as condições derivadas das primitivas (as pernas hipotéticas) de apomórficas.

Atualmente, partindo da necessidade de padronização da sistemática, faz-se necessário o uso de metodologias cada vez mais eficazes. O papel da sistemática filogenética, portanto, passa a ser o de organizar o conhecimento sobre a diversidade biológica a partir das relações de parentesco entre os grupos e do conhecimento da evolução das suas características morfológicas, comportamentais, ecológicas, fisiológicas, citogenéticas e moleculares. Como já discutido nesse blog, o resultado de tais estudos são apresentados graficamente na forma de filogenias (Miyaki et al., 2001).

Algoritmos para reconstrução da “Árvore da Vida”

Algoritmos são as técnicas usadas para exercer uma dada função ou uma atividade – são sequências finitas de instruções bem definidas e não ambíguas. Na biologia moderna eles são usados em diversas ocasiões desde diagnósticos médicos até reconstruções de árvores evolutivas. Sem tais algoritmos, seria inviável promover certas tarefas como as análises filogenéticas. No caso de nosso estudo, uma das ferramentas é de natureza molecular, i.e., as bases moleculares serão úteis para recriação de árvores da vida, enfatizando os metazoários (animais). Devido ao grande quantidade de informações nas amostras que serão analisadas, faremos uso de alguns algoritmos para reduzir o tempo de análise. Deve-se considerar que diferentes algoritmos podem influir nos resultados (Russo et al., 1996; Takezaki e Gojobori, 1999).

Para se ter uma idéia do tamanho do problema, um exemplo é útil: estima-se que algumas proteínas advindas do veneno da cascavel Crotalus durissus, muito comum em toda extensão do país, possuem cerca de 3000 aminoácidos (9000 bases de nucleotídeos); seria inviável a comparação manual, sem utilização de algum algoritmo computacional, de tais proteínas entre essa e outras espécies para construção da história evolutiva do grupo das serpentes e também deve-se salientar os mais novos trabalhos com nucleotídeos de artrópodes com mais de 42 mil bases analisadas em trabalhos de filogenia molecular com auxílio computacional.

Serão apresentados dois grupos de algoritmos usados para a obtenção de filogenias: os algoritmos exatos e os algoritmos heurísticos (Miyaki et al., 2001).

Algoritmos Exatos

O primeiro algoritmo a ser descrito é o da “busca exaustiva”. Tal algoritmo consiste em enumerar todas possíveis árvores existentes para os grupos taxonômicos sob escrutínio. Avalia-se, posteriormente, qual árvore melhor representa a situação em análise, seguindo critérios como parcimônia ou máxima verossimilhança.

Outro algoritmo exato é o “Branch-and-Bound”. Tal algoritimo assemelha-se ao da busca exaustiva. Todas as possibilidades são testadas na formação das árvores filogenéticas a um determinado número de amostras. A diferença é que o algoritmo descarta possibilidades subótimas, diminuindo o tempo de análise.

Algoritmos Heurísticos

Inicialmente descreveremos de modo simplificado a “decomposição por politomia”. Essa consiste em unir todos os táxons em um único nó interno. Depois se analisa cada par de decomposições do nó inicial desconsiderando condições subótimas.

Outro algoritmo é o “stepwise addition”. Forma-se uma árvore com três táxons. As etapas seguintes consistem em adicionar táxon por táxon, analisando as melhores posições (segundo o critério escolhido) entre tais táxons.

O terceiro algoritmo heurístico é o “branch-swapping” que consiste em análise de um grande número de táxons ao mesmo tempo. O algoritmo rearranja de forma a trocar as posições entre táxons vizinhos a fim melhor representar as posições possíveis.

Critério: Máxima Parcimônia

O método é simples por natureza, mas de grande utilidade e aplicação. Em linhas gerais, prevê que o aparecimento único de um caráter é mais provável que dois aparecimentos independentes.

Para o entendimento do método da máxima parcimônia segue a descição: as características posteriores à ocorrência de um dado traço morfológico ou molecular em seu estágio primitivo (plesiomórfico) serão herdadas nas novas espécies surgidas a partir dos ancestrais comuns (sinapormorfias). Não considerar tal método pode nos induzir a afirmar que os traços morfológicos semelhantes entre os descendentes e o organismo ancestral ocorreram por obra do acaso, por mera coincidência!

Para nosso estudo molecular, é mais parcimonioso pensar que uma base muda de A (adenina) para T (timina) – uma única mudança – do que de A para C (citosina) e posteriormente para T (duas mudanças). É importante ressaltar que alguns especialistas afirmam a necessidade de se adequar os pesos das transformações entre os nucleotídeos devido a uma série de fatores. Transições (de purina a purina, de pirimidina a pirimidina) são mais comuns que transversões (de purina a pirimidina) devido às possíveis distorções na largura da molécula de DNA e a probabilidade de reparo nas transversões serem maiores (Miyaki et al., 2001).

Critério: Máxima Verossimilhança

Para melhor compreensão dos estudos da biologia molecular devemos nos recordar dos trabalhos de Fisher durante o século XX, matemático e estatístico que dera grande colaboração as estudos da genética. Uma de suas teorias é conhecida como método de máxima verossimilhança. Tal método prevê um modelo probabilístico de evolução considerando pesos aos diversos tipos de mutação e suas freqüências (Nei e Kumar, 2000). O resultado dessa modelagem é uma árvore resultante de probabilidades dos organismos serem próximos. Hoje o modelo usado nos estudos de métodos probabilísticos levando em conta a máxima verossimilhança é um pouco diferente daquele proposto por Fisher (Pereira, 2001). Uma melhor valorização da teoria se dá aplicando o modelo da máxima verossimilhança considerando a variação dos ramos resultantes da filogenia.

Princípios

O objetivo primeiro do método de verossimilhança é estimar a probabilidade, com base em um dos modelos que serão apresentados, de que um conjunto de dados possa ter ocorrido. Na aplicação voltada à evolução dos dados genéticos, o método irá calcular a probabilidade de que as sequências tenham sido geradas seguindo as premissas do modelo evolutivo escolhido. A probabilidade é calculada para todas as topologias possíveis variando o tamanho dos ramos. A melhor representação – a mais verossímil –, é escolhida para a filogenia. O cálculo envolve a ocorrência de todos os possíveis estados ancestrais dos caracteres.

Alguns Modelos Matemáticos

O desenvolvimento de modelos cada vez mais complexos deu-se graças ao aumento gradativo do conhecimento a respeito da evolução de sequências do DNA (Myiaki et al., 2001).

1) Modelo de um tipo de substituição (1969):

Prevê que os nucleotídeos em uma sequência de DNA ocorrem com freqüências iguais e a probabilidade de substituição de um nucleotídeo qualquer “i” por outro “j”em um determinado intervalo de tempo “dt” depende de uma taxa de substituição “u”:

Pij= udt

2) Modelo de dois parâmetros (1980):

Substituições do tipo transição ocorrem com mais freqüência que as substituições do tipo transversões. Logo, adequou-se pesos diferentes (h taxa de transição e x para taxa de transversão) como forma de parâmetro.

Pij(dt)= {hdt

{xdt

3) Modelo proporcional (1981):

O modelo prevê que nem sempre as frequências de nucleotídeos são similares. Sendo assim, toma-se por base πj que representa a freqüência específica para cada nucleotídeo:

Pij(dt)= uπjdt

4) Modelo HKY85 (1985):

Combina-se as diferentes taxas de transição e transversão permitindo uma modelagem mais aperfeiçoada em relação aos outros até então desenvolvidos:

Pij(dt)= {hπjdt para transição

{xπjdt para transversão

5) Modelo TN93 (1993):

A diferença na composição de bases reflete diferenças não apenas na taxa de transversão e transição, mas também entre as transições entre pirimidinas e purinas.

Pij(dt)= {hRπjdt

{hYπjdt

{xπjdt

Encontrar uma árvore filogenética não é fácil. Deve-se, sempre que possível proceder com algoritmos heurísticos aliado aos modelos probabilísticos ou de parcimônia para melhor obtenção de resultados. É uma tarefa complicada!

quarta-feira, 20 de janeiro de 2010

Mutações: alguns segredos da evolução

Anna Carolina Russo
anna.russocm@gmail.com

“A ciência não pode prever o que vai acontecer.
Só pode prever a probabilidade de algo acontecer”

César Lattes

Segundo a teoria de Darwin (que já descrevemos inúmeras vezes aqui neste blog), a formação de novas espécies está relacionada com a variabilidade da natureza e a seleção natural imposta sobre ela. Paralelamente ao desenvolvimento do evolucionismo darwiniano, Gregor Mendel, considerado hoje “pai da genética”, realizava pesquisas com fecundação artificial entre plantas ornamentais e ervilhas. Ele postulou, então, as três leis de Mendel, como são conhecidas hoje, que dão base à genética. Publicou sua pesquisa em 1865 em um artigo chamado “Experimento em plantas híbridas”.


Somente no século XX os cientistas retomaram as questões referentes aos genes, querendo saber qual é sua composição química e aonde eles se localizavam. Começaram, então, a desconfiar do DNA por ser uma molécula repetitiva e estável. Através de estudos experimentais de vários cientistas e com a apresentação da estrutura de dupla hélice de Watson e Crick, em meados do século passado, foi confirmado que o local dos genes era mesmo o DNA.

Foi descoberto que o DNA, apesar de ser uma molécula extremamente conservativa, pode apresentar pequenas mudanças após sua replicação, ou após uma lesão físico-química causada por algo como radiação. Estas lesões, se não forem reparadas, poderão ser passadas para os descendentes do indivíduo que sofreu a mutação, gerando a variabilidade, já mencionada por Darwin (mas não no contexto genético, obviamente). Porém, hoje se sabe que somente uma parcela dessas mutações que ocorrem conseguem se perpetuar. Isso porque normalmente essas mutações podem afetar o desenvolvimento do organismo, deixando-o inviável à vida, além de poder favorecer o surgimento de doenças genéticas como tumores . Há ainda a possibilidade de ocorrência de macromutações, que sofrerão seleção negativa. Portanto, a seleção natural, provavelmente selecionou aqueles indivíduos que tinham um mecanismo de reparação eficaz. O mecanismo de reparação é o conjunto de estruturas como, enzimas e moléculas, que farão o trabalho de descobrir onde aconteceu uma mudança de base, ou algo do tipo, revertendo-a.

Irei aqui descrever brevemente alguns tipos de mutações mais frequentes e alguns mecanismos de reparação.

Um tipo de mutação que ocorre em um a cada 109 a 1010 nucleotídeos incorporados é a incorporação incorreta de nucleotídeos, ou seja, que não obedecem à ordem A-T e C-G. Esse mecanismo funciona basicamente da seguinte forma: quando a DNA polimerase vai fazer a transcrição, ela pode colocar, no lugar de uma Guanina por exemplo, uma Adenina para se emparelhar com a Citosina. Esse tipo de mudança, dependendo da sua localização na trinca que codificará um aminoácido, pode mudar totalmente a proteína. Para que isso não ocorra, a DNA polimerase tem uma região em sua estrutura chamada de subunidade revisora, a qual é responsável por identificar esse tipo de falha e fazer com que a polimerização se mova no sentido contrário, voltando no nucleotídeo errado para que a subunidade catalítica da DNA polimerase coloque a Guanina em seu lugar (no caso, a base certa).

Se por algum motivo alguma base errada passou despercebida, existe um tempo para que esse nucleotídeo seja removido e substituído. Esse é o tempo da fita recém sintetizada não estar ainda metilada. Sabe-se que a DNA metilase é uma enzima responsável por anexar um radical metil ao DNA. Quando a fita acaba de ficar pronta, esta enzima demora um certo tempo para entrar em ação. È durante esse período que o mecanismo de reparo conhecido como reparo por emparelhamento errado de bases, ou em inglês mismatch repair, entra em ação. Isso porque, como a fita não foi ainda metilada, ela pode ser diferenciada da fita-mãe, que já está com os radicais, fazendo com que uma série de enzimas desse sistema de reparo remova a parte da cadeia da fita que foi incorporada de forma errada e faça uma nova.

As causas dessa metilação são tema da epigenética, que estuda todas as mudanças no genoma (mais especificamente, na eucromatina) que são reversíveis e não alteram a sequência de nucleotídeos. Além disso, ela estuda como essas mudanças são passadas para os descendentes e como ocorrem essas mutações através do tempo, influenciadas por fatores ambientais.

Você pode estar se perguntando: por fatores ambientais? Mas isso não é Lamarck?

Isso mesmo! Recentemente, estudos publicados têm corroborado alguns dos argumentos de Lamarck. Um dos exemploes é o experimento divulgado na revista Nature em 2004, no qual foram selecionadas ratinhas grávidas que possuíam diferentes formas de cuidar de sua cria. Uma era extremamente cuidadosa, demonstrando esse cuidado pela forma de encurvar seu corpo para amamentar e proteger seus filhotes. Já a segunda mãe não apresentava os mesmos cuidados que a primeira ratinha. Foi observado que os filhotes da segunda rata tinham mais propensão à doenças do que os da primeira.


Foi analisado o DNA das mães e ficou demonstrado que o da segunda mãe possuía mais metil do que da ratinha cuidadosa. Em segunda análise, os pesquisadores observaram o material genético dos filhotes e verificaram que o DNA dos filhotes da mãe com pouco cuidado também era bastante metilado. Para verificar se a proprensão à doenças era ou não genética, as mães tiveram uma nova cria, porém, desta vez, os filhotes foram trocados - os filhotes da mãe cuidadosa foram para a mãe de pouco cuidado e vice e versa. Após certo tempo, com as mães cuidando dos filhotes trocados, foi novamente analisando o DNA dos filhotes. Verificou-se que os filhotes da mãe cuidadosa que desta vez, foram criados pela segunda ratinha, possuíam muito mais metil, assim como a mãe que criou. E os filhotes criados pela ratinha cuidadosa possuíam poucos.

Desta forma, podemos perceber que o modo como a ratinha mãe cuidou de seus filhotes influenciou na metilação do DNA de sua cria, dando maiores ou menores chances dele adquirir doenças no decorrer de sua vida. Porém, essa é uma área recente da ciência que esta se desenvolvendo e indo de encontro à algumas das premissas do evolucionismo darwiniano. Ela está descobrindo alguns segredos das mutações que podem ser incorporados ao arcabouço teórico que temos hoje, baseado nos trabalhos pioneiros de Darwin-Wallace e desenvolvido durante todo o século XX. Muitas coisas novas poderão vir e cabe a nós descobrirmos pois a ciência está constantemente sofrendo mutações e se aprimorando.


Bibliografia:

http://www.genetica.esalq.usp.br/pub/seminar/FSalvato-200702-Resumo.pdf
http://www.unesp.br/aci/revista/ed03/pdf/UC_03_evolução01.pdf
Ian C G, et al., Epigenetic programming by maternal behavior, Nature, 847 – 854
Matioli, S. R. Biologia Molecular e evolução, Ribeirão Preto: Holos, 2001. p. 40 – 50
Mendel, G.. Experiments in plant hybridization, Natural History Society, 1865, Abhandlungen, 3–47

Fonte figuras:
Fig. 01: http://biologia.laguia2000.com/wp-content/uploads/2008/09/mendel011.jpg
Fig. 02: http://faculty.ksu.edu.sa/17257/Pictures%20Library/WatsonJames-CrickFrancis.jpg
Fig. 03: http://www.invitrogen.com/site/us/en/home/Products-and-Services/Applications / RNAi-Epigenetics-and-Gene-Regulation/Methylation-Analysis-.html
Fig. 04: http://genetica.ufcspa.edu.br/seminarios%20monitores/epigenetica_texto_2007.pdf
Fig. 05: http://thumbs.dreamstime.com/thumb_41/1139435556sB71s6.jpg