terça-feira, 27 de julho de 2010

Sobre dados moleculares à luz da comparação entre análise particionada e de evidência total

ResearchBlogging.org

por Leandro Pereira Tosta

email: leandropereiratosta@gmail.com

Atualmente, as fontes de evidências disponíveis para se estabelecer hipóteses sobre a organização hierárquica entre os seres vivos são bastante diversificadas. Podem-se utilizar parâmetros morfológicos e moleculares que, quando bem aplicados, à luz de uma metodologia consistente, pode gerar bons resultados em termos de classificações filogenéticas. Na construção de árvores filogenéticas consistentes deve-se primar, inicialmente, por caracteres que promovam agrupamentos entre os táxons – no caso do presente trabalho, por dados moleculares, que constituirão uma matriz de dados (base na construção das árvores).

Tendo em vista dados de recentes dos trabalhos sobre filogenia de Arthropoda (Cunningham et al., 2010), para melhor compreensão das hipóteses, faremos uma análise dos resultados moleculares na forma particionada, para cada um dos marcadores que foram usados no trabalho original supracitado, e na forma simultânea, utilizando todos os resultados para a obtenção de uma hipótese única, a fim de se criar um modelo filogenético sólido.

Quando se deseja apresentar “quão válida” é uma hipótese, deve-se considerar uma visão racional sobre ela. Caso não haja um sentido racional, o pesquisador pode incorrer em uma opinião, no mínino, tendenciosa. O “sentido racional” pode ser estabelecido por meio de uma “lógica indutivista” caso haja à disposição “elementos confiáveis” e pertinentes à defesa da hipótese (entende-se “elementos confiáveis” como sendo dados empiricamente satisfatórios).

Popper já discutia os problemas da teoria do inducionismo para o falseamento de hipóteses (Popper defendia o deducionismo como método científico).Para exemplificar o caso, usemos o exemplo hipotético de um trabalho com aves. O pesquisador de campo verifica a presença de 10 patos dentre as aves observadas. Todos os patos apresentam coloração marrom. O pesquisador considera que todos os patos da região pesquisada são marrons. Na realidade, nada impede que outras aves que habitam a região, em outras épocas do ano, tenham coloração diferente. O simples fato da observação restringir-se a patos marrons não significa que todos os patos existentes sejam dessa cor! Isso faz com que nosso pesquisador apresente um resultado “viciado”. À luz dos dados filogenéticos, nosso caso pode ser apresentado da seguinte forma: têm-se uma amostra definida de nucleotídeos de uma determinada região do DNA de diversos grupos de animais. Se partirmos desse determinado conjunto de dados e usarmos tais resultados para inferência de filogenias entre as espécies pode haver, devido a uma série de alterações mutacionais, um “vício” da solução que se almeja apresentar – em suma, a solução sugerida pelo conjunto de dados amostrado não necessariamente reflete a realidade do processo evolutivo. A interpretação pode ser uma “indução” e, assim, no falseamento da hipótese, pode-se verificar, por exemplo, a não congruência em relação às filogenias já apresentadas por meio de análises morfológicas.

Evidência Total

Pode-se interpretar os dados filogenéticos como “protagonistas” da evolução. Em linhas gerais, ao se alterar o meio, selecionam-se geneticamente os organismos mais bem adaptados. Para serem repassadas tais informações genéticas, os organismos devem possuir sutis diferenciações a nível genético. E são as diferenças em nível molecular, em diversificadas regiões do material genético, as responsáveis por induzir “anomalias” nas interpretações filogenéticas com dados moleculares quando são comparados táxons próximos. Interpretar de forma equivocada os dados moleculares pode induzir o pesquisador a considerar “uma parcela dos dados como a imagem do todo”, ou seja, interpretar singularmente as regiões do material genético com fatores que levam à “verdade” pode levar a erros de interpretação da evolução dos grupos sob escrutínio.

Dessa forma, para podermos assumir evidências com maior grau de confiabilidade para interpretação dos dados moleculares na montagem de filogenias, deve-se utilizar das observações conjuntas na forma conhecida como “evidência total”, i.e., simultânea, que traga uma compilação dos resultados particionados em uma mesma matriz. Logo, avalia-se que praticar a análise individual dos dados pode transmitir informações não condizentes com o real.

Considerando a importância da evidência total, devemos considerar, também, duas importantes visões que implicadas no problema, uma sobre parcimônia e outra sobre os debates entre argumentos favoráveis, de um lado, à análises simultâneas e, de outro, à análises com dados particionados.

Sobre parcimônia, análise simultânea e particionada

Uma das vertentes que defendem a aplicação de “evidência total” é o da análise filogenética com base no critério da parcimônia. Todas as evidências são utilizadas para resolução da hipótese porque, com um maior número de dados, é mais possível que a hipótese mais parcimoniosa, em potencial, e que se revele a partir da análise das evidências, tenha maior poder explicativo (“poder explanatório máximo”).

Para exemplificar a idéia, retomemos aos patos do exemplo citado anteriormente. Suponha que o mesmo pesquisador, tendo em vista o problema de “vício” do conjunto de patos observados, tenha retomado seus trabalhos de campo. Na nova observação, sob um intervalo maior de pesquisa, considerando as rotas de migração e outros fatores que ele julgar importantes, o pesquisador tenha observado maior diversidade de espécies. Dentre a nova amostra coletada, havia patos pretos, brancos, marrons, e, dentre estes, um com plumagem verde e negra. Como método, nosso pesquisador descreveu todos os patos observados. O pesquisador, separadamente, considerou cada organismo como parte do ecossistema da região. A análise pode ser falseada se, por um motivo externo, descobrir-se que o pato com plumagem verde e negra não pertence ao hábitat local, (ele pode ter se perdido do resto da sua família). Com o método da análise de parcimônia, devem-se contabilizar todos os patos, mas nem todos servem para descrever a comunidade de patos da região observada (deve-se desconsiderar, no caso, a presença do pato incomum ao restante do grupo).

No caso das análises filogenéticas de parcimônia usando dados moleculares, devem-se interpretar os dados com um todo, porém, faz-se necessário a visão de uma “gama” maior de dados e interpretação na forma de grupo. Assim, desconsiderar-se-á dados que venham a possuir informação não representante de “um todo”. A análise simultânea é uma ferramenta bastante útil se considerarmos os dados como um todo. Mas, via de regra, deve-se ponderar quando é possível analisar e desenvolver a hipótese a partir de modelos com máxima parcimônia. O uso de análises particionadas, i.e., com vários conjuntos de dados sendo analisados separadamente, servem de evidências preliminares para posterior organização da análise dos dados em conjunto. Assim, com intuito de relacionar as análises antes particionadas, é criado um “super matriz” e a análise final é feita sob a óptica da evidência total.

Afinal...

Não se devem considerar as análises particionadas como sendo fatores últimos de evidência para uma hipótese, caso haja qualquer probabilidade da hipótese obtida ser mais frágil do que aquela derivada de uma análise com evidência total. Essa fragilidade pode ser registrada quando a hipótese não assume máxima parcimônia ou quando não pode assumir registro empírico. Uma possível solução para conjuntos de dados muito grandes é a utilização de modelos combinados: (1) filogenias prévias com os vários marcadores sendo analisados separadamente e de forma paralela, que podem ser comparadas com filogenias provenientes de outros conjuntos de dados (como morfológicos, comportamentais, ecológicos, etc). Elas podem servir para analisar o potencial de resolução das relações filogenéticas de determinados dados; e (2) análises de evidência total, para a obtenção de filogenias robustas e melhor resolvidas em todos (ou pelo menos na maior parte) dos nós da árvore.

Referências

FITZHUGH, K, The ‘requirement of total evidence’ and its role in phylogenetic systematics. Biology and Philosophy, Springer Press, Los Angeles, 2006.

NEY, M. e KUMAR, S. Molecular evolution and phylogenetics. Oxford University Press, New York, 2000.

Regier JC, Shultz JW, Zwick A, Hussey A, Ball B, Wetzer R, Martin JW, & Cunningham CW (2010). Arthropod relationships revealed by phylogenomic analysis of nuclear protein-coding sequences. Nature, 463 (7284), 1079-83 PMID: 20147900

Nenhum comentário:

Postar um comentário