Banco de dados da Wikipedia vai responder perguntas dos internautas

Wikidata baseia-se em busca semântica e deve ficar pronta em março de 2013

Thássius Veloso
• Atualizado há 8 meses

A Fundação Wikimedia está com um novo, grandioso e importante projeto na praça. Inicialmente desenvolvido pelo escritório na Alemanha, a Wikidata começa a ser desenvolvida e futuramente corre o risco de ser um dos mais importantes e completos bancos de dados do mundo. A ideia é alimentar, a partir desses bancos de dados, os verbetes publicados pela Wikipedia nos mais variados idiomas.

Esse novo projeto objetiva fornecer informações atualizadas para os verbetes daquela que se diz “a enciclopédia livre”, bem como para qualquer um disposto a usar os dados. Eles serão publicados na internet por meio de licença Creative Commons, aquela que, dependendo das permissões atribuídas, permite reproduzir, modificar e editar a informação fornecida gratuitamente.

Esboço da Wikidata

A ideia é bem bacana. Por exemplo, os verbetes sobre personalidades poderiam — todos eles — buscar dados sobre data de nascimento e data de morte do indivíduo na Wikidata, que centralizaria essa informação. Um trabalho a menos para os internautas que participam da edição da Wikipedia.

A aplicação vai além. Alguns verbetes em edições localizadas da enciclopédia virtual não estão atualizados. Com a Wikidata ficaria, em tese, mais fácil manter esses conteúdos atualizados com as últimas informações disponíveis, visto que uma alteração no banco de dados refletiria nos verbetes apresentados nas mais de duzentas edições da Wikipedia disponíveis no mundo.

O TechCrunch colocou as mãos no cronograma de lançamento da Wikidata. Serão três fases. Na primeira, cada verbete da Wikipedia ganha uma entrada na Wikidata para agrupar links e informações básicas, como as datas de nascimento. A fase número dois prevê que os internautas adicionem mais detalhes às entradas da Wikidata e usem essas informações na Wikipédia — portanto, a enciclopédia passa a consultar o banco de dados para alguns dados presentes no verbete.

Talvez a mais promissora fase seja a terceira, na qual os usuários vão fazer perguntas para a Wikidata e o mecanismo de banco de dados (!) vai responder. Por exemplo, a partir das informações daria para dizer “quais das dez maiores cidades do mundo têm prefeitas mulheres”. Chegar nesse resultado é difícil e envolve o uso de muita semântica para entender exatamente o que o internauta procura. Hoje em dia a Wikipédia até responde algumas perguntas desse tipo, porém são respostas baseadas em listas criadas manualmente. Não é um processo automatizado.

A iniciativa Wikidata conta com dinheiro proveniente do Allen Institute for Artificial Intelligence, do co-fundador da Microsoft, Paul Allen. Ele deu 50% dos recursos. Também tem fundos do Gordon and Betty Moore Foundation e do Google (veja só), cada um bancando 25% dos 1,3 milhões de euros previstos no orçamento. O buscador com certeza poderia tirar bom proveito de um banco de dados dessa magnitude — caso a Wikidata vá para frente.

Quem tem a temer com isso é o Wolfram Alpha, mecanismo de buscas e cálculos baseados em operações matemáticas. Não sei até que ponto os dois serviços são concorrentes, mas certamente a Wikidata pode abocanhar uma fatia das requisições feitas atualmente no buscador alternativo.

A Wikidata deve ficar pronta em março de 2013.

Estou empolgado com o que pode vir a ser a Wikidata. Um banco de dados dessa magnitude faz falta na nossa internets. E você, se animou também?

Relacionados

Escrito por

Thássius Veloso

Thássius Veloso

Editor

Thássius Veloso é jornalista especializado em tecnologia. Desde 2008, participa das principais feiras de eletrônicos, TI e inovação. Thássius é editor do Tecnoblog e também atua como comentarista da CBN, palestrante e apresentador de eventos. Já colaborou com o Jornal Nacional e a GloboNews, entre outros veículos. Ganhou o Prêmio Especialistas em duas ocasiões e foi indicado diversas vezes ao Prêmio Comunique-se. Pode ser encontrado como @thassius nas redes sociais.