XML - ORGANIZANDO O CAOS



Infelizmente, o conteúdo da Web, atualmente, só tem servido, geralmente, para aproveitamento de ávidos internautas, estudantes e pessoas comuns. Ou seja, não existem aplicativos que possam aproveitar diretamente as páginas da WWW e manipular as informações contidas em tais documentos. O motivo disso, é a desestruturação dos dados contidos nos diversos sites da Web, que não tem significado claro para softwares específicos.

A linguagem de formatação HTML, como o nome já diz, só mostra para um navegador como ele deve exibir o conteúdo de uma página, apenas se importando com a aparência.

A eXtensible Markup Language (XML), surge como uma forma de se agregar semântica aos conteúdos da Web, contornando as limitações neste campo da HTML. Através desta linguagem, será possível se dizer com precisão, por exemplo, que uma página está falando sobre um determinado livro, um capítulo desse livro ou o seu sumário. Com isso, já se pode imaginar mecanismos de busca com uma precisão invejável, dentre outras coisas. A linguagem XML, que é um especificação do W3C, consórcio internacional que regulamenta padrões para a Web, ainda está sendo discutida e aprimorada. Mas mesmo assim, já existe um navegador, o Internet Explorer 5, que já traz suporte a documentos feitos nesta linguagem.

XML possui também um padrão de folhas de estilo conhecido por XSL, além de um poderoso mecanismo de ligação (muito melhor do que o da HTML), dado pelas especificações XPointer e XLink.

Uma aplicação XML muito interessante, que também é uma especificação do W3C, é o Resource Description Framework (RDF). Através do RDF, é possível se organizar recursos (que podem ser desde um símbolo até um site Web inteiro) em níveis hierárquicos, utilizando o velho e bom paradigma da orientação a objetos. Isso poupa o projetista XML de ter que criar na "mão grande" complexas relações que são constantemente usadas. Agora, basta usar as facilidades do RDF!

Mas, atenção! XML não tem nada de nova! Ela é derivada da Standard Generalized Markup Language (SGML), a qual é uma linguagem que remonta a 1986 e é um padrão grande e complexo. Portanto, um programa para tirar proveito da SGML é muito caro. Isso não acontece com a XML, que já possui vários analisadores gramaticais gratuitos, é muita enxuta e só tem os comandos SGML absolutamente necessários.

Os estudos iniciais para a linguagem XML começaram em 1996, quando Jon Bosak, profissional da Sun Microsystems, liderou um grupo de estudiosos nesta empreitada, com o aval do W3C.

A XML ainda vai demorar um pouco para pegar na Internet. Mas, à medida que novos editores XML forem lançados no mercado, junto com ferramentas de autoria, não restam muitas dúvidas que ela irá "deslanchar" na net. Isto não quer dizer que a HTML vá desaparecer. Será usada onde não houver necessidade de semântica, como em marketing puro, por exemplo.



Abaixo, seguem links para traduções livres, feitas por mim, para as partes iniciais das especificação da XML 1.0 e do Esquema RDF:

ESPECIFICAÇÃO DA XML 1.0

ESPECIFICAÇÃO DO ESQUEMA RDF