sexta-feira, 12 de março de 2010

Adentrando no mundo da filogenia por dados moleculares - II

ResearchBlogging.orgpor Leandro Pereira Tosta
leandropereiratosta@gmail.com

Mudanças evolutivas em nível molecular são r
esponsáveis pela diversificação das espécies que habitam o globo. Isso tem acontecido desde o surgimento dos primeiros organismos, através da replicação das informações do genoma juntamente com mutações - erros na replicação - que vão se somando ao longo do tempo .

É de praxe dizer que a análise do genoma de diversas espécies é ferramenta de importância fundamental como fonte de informações para a biologia moderna. Mas, o que é genoma? Em linhas gerais, o genoma de um organismo é o seu conjunto de informações genéticas, sejam elas codificantes ou não.

As informações genéticas de um organismo pode
m ser transmitidas via reprodução sexuada ou assexuada (informações essas presentes no núcleo da célula) ou ainda transmitidas por meio de cloroplastos e mitocôndrias. Tanto os genes das mitocôndrias como os dos cloroplastos somente codificam as proteínas participantes da manutenção de suas próprias funções e para a expressão (Calcagnotto, 2001).

A evolução molecular investiga os mecanismos e consequências da evolução de macromoléculas em tópicos como as relações existentes entre as estruturas genéticas, protéicas e funcionais dos organismos (Heller et al., 2009). O alvo primeiro dos cientistas que estudam a evolução molecular dos organismos animais e vegetais é a mutação (variação nos parâmetros genéticos originais de um táxon considerado) ocorrida nos nucleotíde
os. A mudança na sequência de nucleotídeos pode, por exemplo, originar mudança na configuração das trincas e assim na configuração do aminoácido.

Uma preocupação que se tem ao iniciar os estudos consiste na escolha da base de dados. Ela é crucial já que árvores construídas para um mesmo grupo de organismos com base em conjuntos de dados diferentes podem resultar em filogeni
as diferentes (Russo et al., 1996; Kelsey et al., 1999). Para dados moleculares, independentemente de que gene ou porção do DNA é utilizada, é possível prever as taxas de substituições, os números de substituições de duas sequências homólogas de ancestrais comuns e o tempo de divergência das linhagens, dado pala fórmula “r = K/2T”, onde “r” é a taxa de substituição de nucleotídeos, “K” o número de substituições moleculares por sítio entre duas sequências homólogas e “T” o tempo de divergência (Li, 1997). Comparando-se a quantidade de substituições de nucleotídeos em algumas proteínas e o tempo de divergência de algumas espécies, no exame de táxons cada vez mais distantes, pode-se se montar uma escala cronológica e, dessa forma, inferir as idades de surgimento dos grupos biológicos durante a história evolutiva do planeta (Calcagnotto, 2001).

O alinhamento de sequências
Uma das principais vantagens de se trabalhar com sequências moleculares é que podemos escolher genes qu
e apresentam variabilidade compatível com o problema genético em questão (Russo et al., 1996) o que depende das métodos empregados e de uma boa amostragem de alinhamentos dos sítios em análise. O objetivo do alinhamento é identificar a homologia entre a posição (sítio) de cada base (ou aminoácido) que esteja sendo comparado entre duas ou mais sequências (Russo, 2001).

Após serem escolhidas as bases de comparação dos organismos que serão analisados, sejam elas DNA ou aminoácidos que não apresente
m mais de 20% ou 30% de diferença entre pares de sequência de nucleotídeos, inicia-se o processo de análise. Nesse sentido, caso o gene seja muito variável ou muito conservado, outro gene deve ser procurado (Russo et al., 1996)

Uma técnica relativamente simples é o “alinhamento de sequências”. O número mínimo amostral de organismos para inferir algum tipo de parentesco evolutivo é três, pois a relação colateral é interpretada como “A está mais próximo de B e
m relação a C”, i.e., A é grupo-irmão de B pois carrega um ancestral exclusivo não compartilhado com C. Para exemplificar o exposto, analisemos a figura a seguir:

Para o alinhamento de seqüências, após escolhidos os táxons e as regiões de DNA que serão analisados, procede-se com a comparação do locos gênico de proteínas homólogas dos organismos (homologias nas ciências biológicas inferem a existência de uma característica comum as pelo menos duas espécies que comp
artilham um ancestral comum exclusivo). Nesta etapa, analisam-se as regiões que possuem maior similaridade. Tais regiões são base do trabalho de análise. Com as sequências estabelecidas, monta-se uma “matriz de similaridade” que tem por objetivo a soma e a diferença entre cada par de organismos (Heller et al., 2009). Para análise de sequências divergentes mais longas, faz-se uso de algoritmos computacionais de análise probabilística (Nei e Kumar, 2000) no alinhamento de sequências de aminoácidos e de nucleotídeos (em softwares como ClustalW, ESEE, TreeAlign...).

Para as sequências de DNA alinhadas na matriz de similaridade, pode-se contar o número de diferenças em posições de nucleotídeos homólogos, que indicam o número mínimo de substituições nucleotídicas que deve ter ocorrido entre duas sequências (Heller et al., 2009). Consideram-se as seguintes possíveis substituições:

Substituição múltipla: duas ou mais substituições ocorreram em dado lócus entre os organismos ancestrais e os descendentes.

Substituições coincidentes: substituições alea
tórias diferentes ocorrem do ancestral para os descendentes.

Substituições paralelas: a mesma substituição ocorre independentemente entre o ancestral e cada descendente.

Substituições de retorno: substituição onde o nucleotídeo muda ao longo do tempo e depois, aleatoriamente, retorna à configuração original.

Tamanhos de sequências em análiseNão há
uma regra sobre o tamanho de sequências a ser comparadas. Porém, em teoria há uma uma maior confiabilidade em análises com maior número de amostras. Além disso, não basta analisarmos apenas grandes amostras, mas sim amostras sobre diferentes métodos, de locais gênicos diferentes e, de preferência, com sequência com grande número de nucleotídeos, quando possível.

Genes Homólogos
Todos os genes são, de uma forma ou outra
, homólogos, uma vez que pode-se traçar a história evolutiva de todos os organismos até o ancestral comum dos seres vivos. Genes existem sob duas formas: ortólogos (genes encontrados em diferentes táxons que, ao serem comparados, são passíveis de rastreamento até os eventos que levaram à especiação) e parálogos (genes em iguais ou diferentes táxons relacionados à ocorrências de duplicação gênica). Dado um gene “x”, que, a partir de um evento de duplicação gênica, passa a apresentar duas cópias, “x” e “y”. Tais cópias, x e y, são chamadas de cópias parálogas do mesmo gene x. Supondo que, ao longo tempo, essa população passe por um evento de especiação, as duas cópias x e y irão evoluir independentemente nas duas espécies, acumulando substituições únicas e, por conseguinte, diferenciando-se. Logo, as cópias resultantes x’, x” e y’, y” serão cópias ortólogas (Russo, 2001).

Para reconstruções da história evolutiva, usam-se genes homólogos ortólogos. Para reconstruções na história das alterações das funções devido às duplicações gênicas, usam-se genes homólogos parálogos.

É importante deixar claro, para finalizarmos, que a escolha cuidadosa do gene é muito mais importante do que a escolha do método de reconstrução filogenética, i.e., a diferença de eficiência na reconstrução da filogenia verdadeira é muito maior quando se comparam genes codificadores de proteínas diferentes do que quando comparam os resultados oriundos de uma mesma base de dados analisada a partir de métodos de reconstrução filogenética diferentes (Russo, 2001).

Referências

Calcagnotto, D., Taxas de evolução e o relógio molecular. In Matioli, S.R. (ed.) Biologia Molecular e Evolução, 5:51-61, Holos Editora, Ribeirão Preto, 2001.
Heller et al., Vida a Ciência da Biologia, Vol. II Evolução, Biodiversidade e Ecologia, p. 524-539, Editora Artmed, São Paulo, 2009.
Hennig, W., Grundzuge einer theorie der phylogenetischen Systematics, Deuscher Zentralverlag, Berlin, 1950.
Kelsey, C.R., Crandall, K.A. e Voevodin, A.F., Diferent models, different Trees: the geographic origin of PTLV-1, Mol. Phylogenet. Evol. 13: 336-347, 1999.
Li, W-H, Molecular Evolution, Sinauer Associates, Sunderland Massachusetts, 1997.
Miyaki C.Y.,Russo, C.A.M., Reconstrução filogenética: Métodos probabilísticos, S.R. (ed.) Biologia Molecular e Evolução, p. 117-127, Holos Editora, Ribeirão Preto, 2001.
Miyaki C.Y., Russo, C.A.M., Pereira, S.L., Reconstrução filogenética. Introdução e o método da máxima parcimônia, S.R. (ed.) Biologia Molecular e Evolução, p. 97-107, Holos Editora, Ribeirão Preto, 2001.
Ney, M. e Kumar, S. Molecular evolution and phylogenetics. Oxford University Press, New York, 2000.
Russo, C.A.M., Como escolher genes para problemas filogenéticos específicos. In Matioli, S.R. (ed.) Biologia Molecular e Evolução, 12:130-135, Holos Editora, Ribeirão Preto, 2001.
Russo CA, Takezaki N, & Nei M (1996). Efficiencies of different genes and different tree-building methods in recovering a known vertebrate phylogeny. Molecular biology and evolution, 13 (3), 525-36 PMID: 8742641

quinta-feira, 11 de março de 2010

Perdas gênicas e a reconstrução da evolução dos Metazoa

Anna R. C. Martin
anna.russocm@gmail.com

Genes identificados nas seqüências de apenas um grupo taxonômico e não em outros, tem sido naturalmente considerados como novidades evolutivas (Raible, 2004). Ou seja, alguns genes considerados exclusivos de um determinado táxon identificariam uma novidade evolutiva provavelmente responsável por originar característica nova que levará à divergência do nó ancestral, com o surgimento de novas espécies. Um exemplo seria o surgimento de simetria bilateral, cujo gene responsável provavelmente surgiu no Pré-Cambriano e levou ao aparecimento dos Bilateria.

Figura 1 - Árvore filogenética mostrando a ramificação dos Bilateria no período Pré-Cambriano.

Após análises comparativas de genomas de algumas espécies, verificou-se que alguns genes que pareciam exclusivos de uma determinada espécie estavam presentes também em outras consideradas distantes nas hipóteses filogenéticas disponíveis. Um exemplo é Acropora (grupo de cnidário que formam corais) que se ramifica na filogenia antes de Urbilateria, porém compartilha 12% de genes exclusivos com Homo sapiens contra 1% com Drosophila melanogaster e Caenorhabditis elegans. Há duas hipóteses que explicam esse compartilhamento de genes: a primeira seria que o gene surge em Eumetazoa (presente em Acropora), porém se perde em Protostomia (representado pela ausência em C. elegans e Drosophila) mas não em Deuterostomia (presente em H. sapiens), o que nos faz concluir que H. sapiens perdeu menos genes do que as outras duas espécies de animais bilaterais e que o Urmetazoa era mais complexo do que se esperava, uma vez que esses genes já eram expressos nele. A outra hipótese é que o mesmo gene tenha aparecido no H. sapiens e em Acropora independentemente. No entanto, se considerarmos o princípio da parcimônia, o gene pode ser perdido facilmente mas é improvável que ele surja exatamente igual e independentemente em duas espécies distintas e filogeneticamente distantes (mas não impossível, claro).

Figura 2 – Filogenia de espécies de eucariotos baseada na perda genética (modificado de Kortschak et al. 2003).

O princípio de parcimônia reforça a teoria da perda gênica, que considera que um gene compartilhado por um grupo de espécies pode desaparecer independentemente em cada espécie ou grupo. Um dos motivos para acontecer a perda gênica é quando um gene é pouco acionado. Desta forma, genes com a menor propensão para a perda gênica, durante a evolução, parecem estar mais envolvidos em funções indispensáveis do que os genes que foram perdidos em diferentes linhagens (Krylov et. al. 2004). Portanto, se um gene é mantido durante um longo período na evolução, é de se esperar que sua função seja essencial para a sobrevivência daquela espécie. Por isso que, em uma análise comparativa de genomas, o padrão de conservação de um determinado gene pode ser indicador de genes que expressam funções essenciais. Isso implica que genes expressos evoluem mais lentamente, ou seja, há mais conservação e reparo gênico, impedindo que ele sofra mutações e se perca.

Um exemplo de linhagem que provavelmente sofreu muitas perdas gênicas durante sua evolução é a que deu origem ao Trichoplax adherens, única espécie que compõe o filo Placozoa. Essa espécie pouco conhecida foi descoberta em 1883 em um aquário de água salgada no Instituto Zoológico de Graz, na Austrália. Seu corpo possui de 2 a 3 mm de diâmetro, sendo um organismo morfologicamente simples composto apenas por uma placa de camada dupla de células. Esse organismo tão simples é importante para a compreensão da evolução pelo fato de que ele possui um sistema digestório provisório no qual a camada de células ventral serve como “estômago” após sofrer uma invaginação, que engloba o alimento a ser digerido. Por ter esse sistema, os Placozoa são inseridos na filogenia de Metazoa, por alguns biólogos, entre Porifera e Cnidaria. Mesmo esse posicionamento é controverso, pelo fato do Trichoplax ser um organismo extremamente simples e pequeno, mais até que os próprios poríferos. Além disso, o Trichoplax possui um DNA pequeno (aproximado com o tamanho de uma bactéria ou um protista), o que faz pensar que muitos genes foram perdidos durante a evolução do grupo.

Figura 3 - Trichoplax (modificado de Srivastava et al., 2008)

O estudo da perda gênica começou através de análises comparativas de conjuntos de genes de genomas completamente sequenciados – atualmente, existem poucas espécies com o DNA completamente sequenciado. Essas espécies são chamadas de organismos-modelo ou espécies-modelo e são usadas constantemente em analises comparativas de genomas. Hoje, tem-se o genoma completo da Arabidopsis tatiana (planta), C. elegans, D. melanogaster e H. sapiens (metazoários), Saccharomyces cerevisae, S. pombe (fungos) e Encephalitozoon cuniculi (protozoário), que aparecem usualmente em muitas filogenias de diferentes autores.

O problema de análises filogenéticas usando apenas organismos-modelo é que o espaço amostral é pequeno. A quantidade de espécies com genoma completamente sequenciado e sua diversidade levam a relações de parentescos que vão de encontro com relações filogenéticas já aceitas. Como exemplo, a filogenia da figura 2, que considera H. sapiens mais próximo de D. melanogaster, em relação ao C. elegans (espécie de nematóide). Isso é contrário à diversas outras propostas, que aproximam os nematóides dos insetos. Portanto, comparações feitas com base apenas nestes organismos podem dar uma imagem enganosa das relações de parentesco. Isso porque se analisarmos somente o genoma de duas espécies, pode-se encontrar seqüência semelhantes que aproximam essas duas espécies, mesmo elas sendo morfologicamente muito distintas, como a Acropora e o H. sapiens. Também pode acontecer de os genomas de espécies morfologicamente semelhantes apresentarem pouca similaridade - se a filogenia se baseasse apenas na similaridade genômica, as espécies certamente estariam afastadas filogeneticamente. Isso ocorre porque não está sendo considerado que, ao longo da evolução, pode ter ocorrido uma série de perdas gênicas e mutações que podem levar à divergência de duas sequências gênicas ou manter próximas espécies nas quais ocorreram possíveis perdas.

Figura 4 - Árvore filogenética com todos os metazoários apontando a posição de cada espécie animal da filogenia presente na figura 2.

Uma das possibilidades de diminuir conclusões errôneas sobre as relações de parentesco é analisar as sequências de genes juntamente com a função que ele exerce em cada grupo de metazoários. Análises genéticas recentes mostraram que existem genes homólogos presentes em todos metazoários que são responsáveis por seu desenvolvimento. Esses genes são conhecidos como “caixa de ferramentas” ou genes do desenvolvimento e são responsáveis por ativar outros genes que podem dar origem a apêndices, por exemplo.

Estudos mais completos utilizando dados moleculares nos permitem entender o porquê de alguns metazoários não terem certos genes, como o caso dos Placozoa. Também nos permite saber que, apesar de duas espécies possuírem genes relativamente semelhantes, elas não estão necessariamente próximas em uma árvore filogenética, como é o caso dos H. sapiens e a Acropora. Portanto, uma análise sobre a evolução utilizando apenas um conjunto de dados ou fonte de evidências pode ser menos conclusiva do que se interligarmos vários dos caminhos que levaram a grande diversidade de hoje.

Referências bibliográficas

Kortschak, R., Samuel, G., Saint, R., & Miller, D. (2003). EST Analysis of the Cnidarian Acropora millepora Reveals Extensive Gene Loss and Rapid Sequence Divergence in the Model Invertebrates Current Biology, 13 (24), 2190-2195 DOI: 10.1016/S0960-9822(03)00872-8

Krylov, D. M., Wolf Y. I., Rogozin I. B. & Koonin E. V., 2003, Gene loss, protein sequence divergence, gene dispensability, expression level, and interactivity are correlated in eukaryotic evolution, Genome Res. 13: 2229–2235.

Raible, F. & Arendt, D., 2004. Metazoan evolution: some animals are more equal than others. Current Biology 14: R106-R108.

Srivastava, M., Begovic E., Chapman J., Putnam N. H., Kawashima T., Kou A., Mitros T., Salamov A., Carpenter M. L., Signorovitch A.Y, Moreno M. A., Kamm K., Grimwoods J., Schmutz J., Shapiroi H., Grigorev I. V., Buss L.W., Schierwater B., Dellaporta S. L. & Rokhsar D. S., 2008. The Trichoplax genome and the nature of placozoans. Nature 454:955-960.