GRDDL – Sugando Páginas da Internet
Saturday, May 19th, 2007Nem me pergunte, eu não sei como se pronuncia isso!
Só sei que é uma tecnologia útil:
O GRDDL, que significa Gleaning Resource Descriptions from Dialects of Languages (ufa!) ou Coletanto Descrições de Recursos de Dialetos de Linguagens é uma maneira legal de extrair informação organizada de uma internet organizada. Basicamente, o GRDDL funciona assim:
- A Web atualmente é desorganizada. Semanticamente, existem muitos dialetos, ou seja, pequenos padrões internos dentro dos sites. Cada site usa seu próprio padrão pra criar os elementos HTML, por exemplo.
- A Web Semântica traz um dialeto universal, um padrão uniforme pra descrever recursos: O RDF. Poucos sites o utilizam.
- As ferramentas pra trabalhar com RDF não lêem os demais dialetos, que são em HTML normal.
- Mecanismos GRDDL lêem os dialetos específicos e transformam em RDF.
Pra isso, obviamente, é necessário construir GRDDL para cada fonte que você deseja coletar. GRDDL é baseado em XSLT, uma linguagem que transforma arquivos XHTML e RDF.
O difícil mesmo é criar um exemplo pra isso. O W3C ainda está trabalhando em um documento com exemplos e explicação para iniciantes. Quem sabe eu não me animo e faço algo em português pra exemplificar


Imagine se pudessemos ensinar uma máquina tudo que a humanidade aprendeu. É um dos primeiros passos pra criação da tão sonhada (e temida) Inteligência Artificial.
O que torna o System One diferente é a maneira que você cria as páginas dentro do wiki. Ele possui um editor de texto próprio bem simples, com uma função interessante: conforme você digita, ele traz na parte inferior resultados relacionados com o texto que você está digitando. As buscas são feitas na internet, nas próprias páginas do System One, nos seus emails particulares, no seus feeds prediletos e nos seus arquivos pessoais.
O