AULA 6

A idéia de se usar dados moleculares na inferência de filogenias surgiu com Zuckerkandl & Paulin (1965). Eles sugeriram detectar mutações de nucleotídeos através das proteínas. Desde então, houve um crescimento progressivo nos estudos filogenéticos com dados moleculares. Em 79 revistas entre 1989-1991, foram relacionados 1140 artigos que incluíam árvores filogenéticas, sendo 77% desses estudos baseados em dados filogenéticos, incluindo parcimônia ou distância, mas não UPGMA, e 53% dos estudos já usavam evidências moleculares. Morfologicamente, parecia consenso que as angiospermas eram monofiléticas e que seu grupo irmão estaria nas Gnetales. Entretanto, as topologias variavam de modo geral conforme dos dados morfológicos e dependendo dos dados moleculares, assim como entre dados morfológicos e moleculares (Donoghue 1994). As principais justificativas para explicar tantas contradições eram o excesso de homoplasias, dificuldade na seleção do grupo externo, na codificação dos estados de caracteres e na pequena amostragem.

Os primeiros estudos moleculares em planta se concentraram no genoma de plastídeos, como o cloroplasto. Isso porque, esse genoma circular é pequeno e, abundante na célula, ele representa porção significativa do DNA total. Estudos preliminares na década de 80 descobriram que a quantidade de variação no gene codificante da enzima ribulose 1,5-bifosfato carboxilase (rbcL), que fixa o gás carbônico na fotossíntese, era pequena entre monocotiledôneas e dicotiledôneas e que, portanto, essa região poderia ser útil na investigação das relações filogenéticas das angiospermas em um nível profundo (Zarawski & Clegg 1993).

Entre 1991 e 1992, Douglas Soltis e Mark Chase iniciaram um grande projeto na investigação das relações filogenética entre as angiospermas. Em pouco tempo, se juntaram mais 42 pesquisadores, e juntos eles publicaram o primeiro trabalho relevante e compreensível em sistemática molecular de angiospermas (Chase et al. 1993). O artigo foi acompanhado por mais 13 artigos em subgrupos de angiospermas no Annals of Missouri Botanical Garden. A análise incluiu até 499 seqüências de rbcL, cuja variação é adequada para relações até o nível de família ou ordem. Pouco depois, com a advento do PCR (polymerase chain reaction), o seqüenciamento passou a ser muito mais eficiente. Hoje, com uma pequena quantidade de DNA é simples e relativamente barato ampliar a região desejada. O PCR foi o impulso que a sistemática molecular precisava. A partir daí, muitas regiões foram exploradas filogenéticamente e muitos grupos avaliados mais detalhadamente. Essa revolução laboratorial foi acompanhada de perto por progressos computacionais que permitiriam avaliar um grande número de seqüências de maneira mais eficiente, assim como utilizar algorítimos mais complexos tanto para busca de árvores como para avaliação estatística dos resultados. Quatro anos mais tarde Douglas Soltis e 19 pesquisadores (Soltis et al. 1997) publicaram resultados com 18S rDNA (nuclear) e logo depois Pamela Soltis e Douglas Soltis publicaram resultados usando regiões dos três genomas (atp de mitocondrias, rbcL do cloroplasto e 18S rDNA nuclear; Soltis et al. 1999 e Soltis et al. 2000). Esses resultados foram incorporados na classificação taxonômica por uma equipe internacional composta de 29 taxonomistas denominada Angiosperm Phylogeny Group (APG 1998), encabeçada por Käre Bremer, Mark Chase e Peter Stevens, caracterizando um dos maiores trabalhos cooperativos em sistemática e pondo os estudos em plantas à frente dos em animais na área pela primeira vez na história.

Mais recentemente foram publicados trabalhos com cinco, seis e dez regiões. Ainda assim, dificuldades para se detectar a raiz das angiospermas estimularam a elaboração de uma análise com 17 regiões do cloroplasto (plastídeos; Graham 2000). Estudos moleculares estão sendo também altamente relevantes na datação de eventos evolutivos e no desenvolvimento ontogenético de características evolutivamente relevantes como as estruturas florais.

O cladograma de Chase et al. (1993), com 375 e 499 táxons, não teve a pretensão de estabelecer relação para todos os grupos de angiospermas, mas sim de fornecer um panorama preliminar para investigações futuras mais detalhadas e rigorosas. O tamanho da matriz foi a maior dificuldade do estudo, e alguns anos mais tarde métodos de busca mais eficientes foram capazes de encontrar árvores mais parcimoniosas (Rice 1997), ainda que não alterando as conclusões gerais. A árvore foi enraizada em Cycadales e assim não pode ser usada para estabelecer relações entre os grupos de espermatófitas de maneira abrangente. Os grupos de Magnoliidae, que incluiriam supostamente os grupos basais de angiospermas foram discutidos num artigo no mesmo volume (Qiu et al. 1993). Esses dados de rbcL apresentaram Gnetales como grupo-irmão das angiospermas e Ceratophyllum como ramo que divergiu inicialmente (raiz das angiospermas), sendo grupo-irmão das demais angiospermas. Vale notar, entretanto, que a região do cladograma onde se resolve esses padrões possuem ramos muito longos em relação aos demais ramos da árvore, o que pode levar a interpretações equivocadas devido a atração de longos ramos, quando a probabilidade de similaridades por convergência passa a ser maior do que a similaridade por ancestralidade em ramos curtos.

Ceratophyllum à parte, as angiospermas se dividiriam em dois grupos reconhecidos pelo pólen monossulcado e trissulcado, exceção feita a Illiciaceae e Schisandraceae que possuem pólen tricolpado, mas que teria evoluído independentemente das eudicotledôneas. As Magnoliidae aparecem divididas em cinco clados: Magnoliales, Laurales, Piperales (incluindo Aristolochiaceae e Lactodoriaceae), Nymphaeales (excluindo Nelumbonaceae, mas incluindo Amborelaceae, Austrobaileyaceae, Chloranthaceae e Illiciaceae) e Ranunculales. Esta última sendo grupo irmão das eudicotiledôneas. As Piperales aparecem como grupo irmão dos demais clados do grupo com pólen monossulcado, que incluem as monocotiledôneas como grupo monofilético bem sustentado. Procurando verificar com mais detalhes o padrão de diversificação inicial das angiospermas, Qiu et al. (1993) realizaram análises com apenas 82 terminais, mantendo a representatividade de Magnoliidae, mas apenas amostras dos demais grupos. Essas análises foram realizadas com e sem grupo externo para verificar a influência de ramos longos; nesse último caso, a árvore foi enraizada entre táxons com pólen mono e tricolpados (padrão detectado nas demais análises de rbcL). Foram encontradas duas ilhas, grupo de árvores com mesmo número de passos, mas encontradas a parti de inícios independentes da buscas. A posição de Ceratophyllum ficou então a ser controversa, aparecendo como grupo-irmão das demais angiospermas na maior ilha (89 árvores) e inserido em Magnoliales na menor ilha (3 árvores). Uma árvore com Nymphaeales na raiz das angiospermas seria apenas 11 passos mais longa que a mais parcimoniosa, com 3414 passos.

Os Anais do Missouri continuaram publicando uma série de artigos relacionados à filogenia das angiospermas nos anos subsequentes. Doyle et al. (1994) fizeram um exercício para verificar a origem das angiospermas. Eles incluíram grupos fósseis e utilizaram apenas um representante de angiosperma por análise. A posição das angiospermas se mostrou instável, variando conforme o grupo de angiosperma utilizado, o que influencia a interpretação para a evolução dos caracteres. Isso poderia sugerir eventualmente que as angiospermas teriam se originado mais de uma vez a partir de grupos fósseis distintos. Quando utilizado apenas táxons vivos, incluindo nove táxons de angiospermas, as Gnetales apareceram como grupo-irmão das plantas com flores. Os únicos clados bem sustentados são as antófitas, as Gnetales e as angiospermas. Apesar das paleoervas aparecerem na raiz das angiospermas, apenas um passo a mais poderia modificar a topologia do cladograma de modo que as paleoárvores estivessem na raiz das angiospermas.

Utilizando dados de rRNA, eles encontraram uma árvores que também sugere as paleoervas na raiz das angiospermas (como em Hamby & Zimmer 1992), sendo a hipótese das paleoárvores 13 passos mais longas. A sustentação para os clados é melhor, mas ainda baixa para maiores inferências. A análise combinada entre dados moleculares e morfológicos não oferece grandes mudanças.

Nixon et al. (1994), incluindo ou não fósseis, exploraram dados morfológicos e moleculares. A análise completa incluiu 46 táxons e 103 caracteres. Na análise II, não foram incluídos os fósseis, diminuindo os táxons para 31 e os caracteres para 97. Na análise III, as angiospermas foram condensadas em um único terminal, na IV, as angiospermas foram consideradas um terminal e na V, também sem fósseis, as angiospermas e as coníferas foram condensadas como um único terminal cada. A análise completa foi feita também combinada com rbcL; os fósseis foram codificados como informação perdida. A análise completa indicou um grande número de politomias. As Gnetales aparecem como grupo parafilético, incluindo as angiospermas, em todas as análises. A análise sem fósseis, no entanto, foi mais informativa, revelando Chloranthaceae como grupo que primeiro divergiu entre as angiospermas. Os dados de Nixon et al. (1994) foram reanalisados por Doyle (1996) que voltou a defender uma origem exclusiva para as Gnetales, e reafirmar a origem única das angiospermas, assim como Nymphaeales na raiz das plantas com flores. As Caytonia seriam o grupo irmão das angiospermas, mas entre os grupos atuais o grupo irmão são as Gnetales. Ele explorou a evolução de vários caracteres baseado na topologia obtida e sugeriu que a origem das Gnetales e angiospermas teria ocorrido a partir de Glossopterides, grupo que desapareceu durante a grande extinção do Permiano. A relação com Bennettitales e Caytoniales, sugere que os dois grupos teriam surgido por volta do Triássico, e caso eles tenham derivado diretamente das Glossopterídes essa data pode ser expandida para o Permiano ou até mesmo o Carbonífero.

Como rbcL não é capaz de resolver padrões na base das angiospermas, uma forma de solucionar o problema é acrescentar mais caracteres, o que em sistemática molecular significa adicionar outras regiões na tentativa de aumentar a resolução do cladograma e a sustentação dos clado. Assim, Nickrent & Soltis (1995) utilizaram as angiospermas como estudo de caso para avaliar a utilidade do gene ribossomal 18S DNAr na reconstrução de filogenias. Diferente do rbcL, que é uma região do cloroplasto, o 18S é uma região do genoma nuclear. Os ribossomos são formados por pedaços de RNAr associados a proteínas. Esses pedaços, 18S, 5.8.S e 26S, estão separados no DNA por espaçadores, formando uma unidade. Várias repetições dessas unidades estão organizadas em seqüência no genoma nuclear. Antes de 1990, era comum seqüenciar o RNAr, mas com o advento do PCR, passaram a seqüenciar o DNA diretamente. Eles utilizaram 62 táxons que possuíam seqüências para rbcL e 18S. No consenso estrito a partir de rbcL as paleoervas aparecem na base da árvore e as monocotiledôneas na raiz das angiospermas. Com 18S rDNA, a árvore é muito pouco informativa, e o consenso estrito gera uma enorme politomia. A comparação entre as duas regiões indicou que o 18S tem uma taxa de evolução três vezes menor que o rbcL, o que apesar de ser em parte compensado pelo maior número de caracteres, não é suficiente para adicionar informações relevantes ao padrão filogenético nesse nível de análise, sendo provavelmente mais úteis em problemas hierarquicamente mais antigos. Ambas as análise revelaram as Gnetales como grupo-irmão das angiospermas.

Dois anos mais tarde, Soltis et al. (1997) reavaliaram a importância do DNAr 18S na reconstrução da filogenia das angiospermas. Dessa vez, foram usadas 223 seqüências, incluindo ou não os indels e retirando parte dos terminais que possuíam seqüência parcial ou ramos longos. Como eles seqüenciaram novamente alguns terminais, alguns com a mesma amostra, notaram que existiam vários equívocos que poderiam ter prejudicado análises anteriores. Nessa análise, curiosamente, diversos grupos com pólen monossulcado apareceram inseridos nas eudicotiledôneas. Na análise com 194 terminais, Amborellaceae aparece como grupo irmão das outras angiospermas, seguidas por um clado composto de Illiciaceae, Austrobaileyaceae e Schisandraceae, e Nymphaeaceae. Apesar de resultados espúrios no restante da árvore, os grupos basais foram confirmado em estudos posteriores, apesar da ordem do clado ter variado de acordo com a análise.

No começo do século passado, Arber & Parkin (1908), o criadores da teoria do antostrobilar, já tinham concluído que: 1) as Gnetales formavam um grupo monofilético; 2) as Gnetales estavam mais relacionadas com as angiospermas do que qualquer outro grupo vivente. Essas duas conclusões parecem ter sido amplamente corroborada por análises filogenéticas utilizando técnicas cladísticas (Crane 1996). Dessa maneira, as gimnospermas, definidas pela ausência do carpelo, formam um grupo parafilético na ausência das angiospermas. Dentre as tendências e semelhanças que corroboram essa relação entre Gnetales e as angiospermas estão: 1) a presença de vasos; 2) a redução do número de células do microgametófito em Gnetum, Welwitschia e angiospermas (ainda mais reduzido, pela ausência da célula protalial); 3) a ausência de arquegônios tanto em angiospermas como em Gnetum e Welwitschia; 4) dupla fecundação e; 5) ausência de fase cenocítica no desenvolvimento do embrião de Gnetum, Welwitschia e angiospermas.