sexta-feira, 12 de março de 2010

Adentrando no mundo da filogenia por dados moleculares - II

ResearchBlogging.orgpor Leandro Pereira Tosta
leandropereiratosta@gmail.com

Mudanças evolutivas em nível molecular são r
esponsáveis pela diversificação das espécies que habitam o globo. Isso tem acontecido desde o surgimento dos primeiros organismos, através da replicação das informações do genoma juntamente com mutações - erros na replicação - que vão se somando ao longo do tempo .

É de praxe dizer que a análise do genoma de diversas espécies é ferramenta de importância fundamental como fonte de informações para a biologia moderna. Mas, o que é genoma? Em linhas gerais, o genoma de um organismo é o seu conjunto de informações genéticas, sejam elas codificantes ou não.

As informações genéticas de um organismo pode
m ser transmitidas via reprodução sexuada ou assexuada (informações essas presentes no núcleo da célula) ou ainda transmitidas por meio de cloroplastos e mitocôndrias. Tanto os genes das mitocôndrias como os dos cloroplastos somente codificam as proteínas participantes da manutenção de suas próprias funções e para a expressão (Calcagnotto, 2001).

A evolução molecular investiga os mecanismos e consequências da evolução de macromoléculas em tópicos como as relações existentes entre as estruturas genéticas, protéicas e funcionais dos organismos (Heller et al., 2009). O alvo primeiro dos cientistas que estudam a evolução molecular dos organismos animais e vegetais é a mutação (variação nos parâmetros genéticos originais de um táxon considerado) ocorrida nos nucleotíde
os. A mudança na sequência de nucleotídeos pode, por exemplo, originar mudança na configuração das trincas e assim na configuração do aminoácido.

Uma preocupação que se tem ao iniciar os estudos consiste na escolha da base de dados. Ela é crucial já que árvores construídas para um mesmo grupo de organismos com base em conjuntos de dados diferentes podem resultar em filogeni
as diferentes (Russo et al., 1996; Kelsey et al., 1999). Para dados moleculares, independentemente de que gene ou porção do DNA é utilizada, é possível prever as taxas de substituições, os números de substituições de duas sequências homólogas de ancestrais comuns e o tempo de divergência das linhagens, dado pala fórmula “r = K/2T”, onde “r” é a taxa de substituição de nucleotídeos, “K” o número de substituições moleculares por sítio entre duas sequências homólogas e “T” o tempo de divergência (Li, 1997). Comparando-se a quantidade de substituições de nucleotídeos em algumas proteínas e o tempo de divergência de algumas espécies, no exame de táxons cada vez mais distantes, pode-se se montar uma escala cronológica e, dessa forma, inferir as idades de surgimento dos grupos biológicos durante a história evolutiva do planeta (Calcagnotto, 2001).

O alinhamento de sequências
Uma das principais vantagens de se trabalhar com sequências moleculares é que podemos escolher genes qu
e apresentam variabilidade compatível com o problema genético em questão (Russo et al., 1996) o que depende das métodos empregados e de uma boa amostragem de alinhamentos dos sítios em análise. O objetivo do alinhamento é identificar a homologia entre a posição (sítio) de cada base (ou aminoácido) que esteja sendo comparado entre duas ou mais sequências (Russo, 2001).

Após serem escolhidas as bases de comparação dos organismos que serão analisados, sejam elas DNA ou aminoácidos que não apresente
m mais de 20% ou 30% de diferença entre pares de sequência de nucleotídeos, inicia-se o processo de análise. Nesse sentido, caso o gene seja muito variável ou muito conservado, outro gene deve ser procurado (Russo et al., 1996)

Uma técnica relativamente simples é o “alinhamento de sequências”. O número mínimo amostral de organismos para inferir algum tipo de parentesco evolutivo é três, pois a relação colateral é interpretada como “A está mais próximo de B e
m relação a C”, i.e., A é grupo-irmão de B pois carrega um ancestral exclusivo não compartilhado com C. Para exemplificar o exposto, analisemos a figura a seguir:

Para o alinhamento de seqüências, após escolhidos os táxons e as regiões de DNA que serão analisados, procede-se com a comparação do locos gênico de proteínas homólogas dos organismos (homologias nas ciências biológicas inferem a existência de uma característica comum as pelo menos duas espécies que comp
artilham um ancestral comum exclusivo). Nesta etapa, analisam-se as regiões que possuem maior similaridade. Tais regiões são base do trabalho de análise. Com as sequências estabelecidas, monta-se uma “matriz de similaridade” que tem por objetivo a soma e a diferença entre cada par de organismos (Heller et al., 2009). Para análise de sequências divergentes mais longas, faz-se uso de algoritmos computacionais de análise probabilística (Nei e Kumar, 2000) no alinhamento de sequências de aminoácidos e de nucleotídeos (em softwares como ClustalW, ESEE, TreeAlign...).

Para as sequências de DNA alinhadas na matriz de similaridade, pode-se contar o número de diferenças em posições de nucleotídeos homólogos, que indicam o número mínimo de substituições nucleotídicas que deve ter ocorrido entre duas sequências (Heller et al., 2009). Consideram-se as seguintes possíveis substituições:

Substituição múltipla: duas ou mais substituições ocorreram em dado lócus entre os organismos ancestrais e os descendentes.

Substituições coincidentes: substituições alea
tórias diferentes ocorrem do ancestral para os descendentes.

Substituições paralelas: a mesma substituição ocorre independentemente entre o ancestral e cada descendente.

Substituições de retorno: substituição onde o nucleotídeo muda ao longo do tempo e depois, aleatoriamente, retorna à configuração original.

Tamanhos de sequências em análiseNão há
uma regra sobre o tamanho de sequências a ser comparadas. Porém, em teoria há uma uma maior confiabilidade em análises com maior número de amostras. Além disso, não basta analisarmos apenas grandes amostras, mas sim amostras sobre diferentes métodos, de locais gênicos diferentes e, de preferência, com sequência com grande número de nucleotídeos, quando possível.

Genes Homólogos
Todos os genes são, de uma forma ou outra
, homólogos, uma vez que pode-se traçar a história evolutiva de todos os organismos até o ancestral comum dos seres vivos. Genes existem sob duas formas: ortólogos (genes encontrados em diferentes táxons que, ao serem comparados, são passíveis de rastreamento até os eventos que levaram à especiação) e parálogos (genes em iguais ou diferentes táxons relacionados à ocorrências de duplicação gênica). Dado um gene “x”, que, a partir de um evento de duplicação gênica, passa a apresentar duas cópias, “x” e “y”. Tais cópias, x e y, são chamadas de cópias parálogas do mesmo gene x. Supondo que, ao longo tempo, essa população passe por um evento de especiação, as duas cópias x e y irão evoluir independentemente nas duas espécies, acumulando substituições únicas e, por conseguinte, diferenciando-se. Logo, as cópias resultantes x’, x” e y’, y” serão cópias ortólogas (Russo, 2001).

Para reconstruções da história evolutiva, usam-se genes homólogos ortólogos. Para reconstruções na história das alterações das funções devido às duplicações gênicas, usam-se genes homólogos parálogos.

É importante deixar claro, para finalizarmos, que a escolha cuidadosa do gene é muito mais importante do que a escolha do método de reconstrução filogenética, i.e., a diferença de eficiência na reconstrução da filogenia verdadeira é muito maior quando se comparam genes codificadores de proteínas diferentes do que quando comparam os resultados oriundos de uma mesma base de dados analisada a partir de métodos de reconstrução filogenética diferentes (Russo, 2001).

Referências

Calcagnotto, D., Taxas de evolução e o relógio molecular. In Matioli, S.R. (ed.) Biologia Molecular e Evolução, 5:51-61, Holos Editora, Ribeirão Preto, 2001.
Heller et al., Vida a Ciência da Biologia, Vol. II Evolução, Biodiversidade e Ecologia, p. 524-539, Editora Artmed, São Paulo, 2009.
Hennig, W., Grundzuge einer theorie der phylogenetischen Systematics, Deuscher Zentralverlag, Berlin, 1950.
Kelsey, C.R., Crandall, K.A. e Voevodin, A.F., Diferent models, different Trees: the geographic origin of PTLV-1, Mol. Phylogenet. Evol. 13: 336-347, 1999.
Li, W-H, Molecular Evolution, Sinauer Associates, Sunderland Massachusetts, 1997.
Miyaki C.Y.,Russo, C.A.M., Reconstrução filogenética: Métodos probabilísticos, S.R. (ed.) Biologia Molecular e Evolução, p. 117-127, Holos Editora, Ribeirão Preto, 2001.
Miyaki C.Y., Russo, C.A.M., Pereira, S.L., Reconstrução filogenética. Introdução e o método da máxima parcimônia, S.R. (ed.) Biologia Molecular e Evolução, p. 97-107, Holos Editora, Ribeirão Preto, 2001.
Ney, M. e Kumar, S. Molecular evolution and phylogenetics. Oxford University Press, New York, 2000.
Russo, C.A.M., Como escolher genes para problemas filogenéticos específicos. In Matioli, S.R. (ed.) Biologia Molecular e Evolução, 12:130-135, Holos Editora, Ribeirão Preto, 2001.
Russo CA, Takezaki N, & Nei M (1996). Efficiencies of different genes and different tree-building methods in recovering a known vertebrate phylogeny. Molecular biology and evolution, 13 (3), 525-36 PMID: 8742641

Nenhum comentário:

Postar um comentário