Por dentro da Stilingue, ferramenta que usa inteligência artificial para resumir a internet

Jean Prado
Por
• Atualizado há 1 ano
stilingue-dashboard-capa

O que você faz quando quer analisar um assunto específico sem precisar gastar horas pesquisando, anotando e estruturando dados? Normalmente é necessário recorrer a uma ferramenta que faz isso para você, mas muitas funcionam bem apenas em inglês. O contexto também precisa ser observado e bem entendido, para que a pesquisa seja mais precisa possível.

São esses pontos que a startup brasileira Stilingue toca ao lançar o WarRoom, o software que usa inteligência artificial para analisar o comportamento online de brasileiros e influenciadores digitais. Com a ferramenta, é possível coletar, interpretar e resumir dados obtidos de mais de 1.100 veículos, 100 mil blogs, fóruns, as principais redes sociais e muito mais ― tudo em tempo real.

Como funciona: pesquisa rápida

É possível acompanhar os assuntos de duas maneiras: com uma pesquisa rápida e outra pré-definida, o que eles chamam de monitoramento personalizado. Ao pesquisar sobre o Tecnoblog, por exemplo, dá para ver a representatividade nas redes sociais, distribuição por gênero, ocupação, sentimento, dispositivo, os termos relacionados e até os influenciadores.

Pesquise qualquer coisa da Internet e veja um resumo completo por diferentes pontos de vista.
Pesquise qualquer coisa da Internet e veja um resumo completo por diferentes pontos de vista.

Como mostra a imagem acima, 75% das publicações sobre o TB na internet foram feitas por homens, 25% pelas mulheres, 90% das pessoas que escreveram os posts faziam algo relacionado à mídia, 98% das publicações demonstravam um sentimento positivo e 76% foram feitas no computador, enquanto 24% foram escritas no celular.

Vale lembrar que essas estatística são estimadas e considera somente as publicações que foram classificadas (na foto não apareceu a porcentagem classificada porque é necessário passar o mouse em cima dos gráficos). O gráfico também mostra a quantidade de publicações neutras, quando disponível.

Nos termos relacionados, fica fácil acompanhar quais são as palavras-chave mais próximas utilizadas em contexto com o nome Tecnoblog. Android é um dos termos mais usados, seguido de smartphone, preços, Brasil, WhatsApp e mais. Ao lado, aparecem os influenciadores ― pessoas com uma grande audiência que realmente entendem sobre o assunto pesquisado.

Como funciona: pesquisa personalizada

Também é possível coletar informações pelo monitoramento personalizado ― e é aí que os dados começam a ser estruturados de maneira inteligente, com inúmeras opções para acompanhar os resultados dos relatórios em tempo real. Brayan Neves, sócio da Stilingue que me apresentou a ferramenta, conta que quanto mais tempo o monitoramento fica ativo, melhor é a estruturação dos dados.

Para fins de demonstração, Brayan abriu uma pesquisa personalizada sobre “produtoras de filmes” que coletava dados já há alguns meses. O monitoramento analisava o contexto de filmes e longametragens e tinha vários grupos de observação como foco, em especial grandes produtoras como Columbia Pictures, Dreamworks, Walt Disney, 20th Century Fox, etc.

Ainda que tudo isso esteja configurado, pode haver problemas para filtrar os dados com precisão. Por exemplo: a produtora Fox pode ser confundida com a atriz Megan Fox, então Brayan configurou o contexto da pesquisa dos grupos de observação para filtrar só publicações com o nome da produtora, para evitar ambiguidade. Assim, a ferramenta consegue distinguir, pela análise do contexto, qual post se refere à atriz e qual se refere ao grupo desejado ― no caso, a produtora.

stilingue-web

Com tudo pronto, a ferramenta também dá a sugestão de temas para acompanharem a pesquisa. Ou seja, filtros que vão ser aplicados em cima do que foi coletado pelos grupos e contexto, como “gêneros”, “efeitos visuais”, etc. A análise de uma série de fontes torna possível que o monitoramento ofereça os principais temas na mídia, termos relacionados, informais ou gírias e até as hashtags que estão sendo usadas nas redes sociais para falar sobre o assunto.

A primeira tela é uma espécie de timeline, que mostra um post sobre o assunto nas redes sociais, quem escreveu, o número de seguidores, likes, compartilhamentos, comentários, localização e até classifica automaticamente como positivo ou negativo. Caso não esteja correta (a ferramenta não garante identificar sarcasmo, por exemplo), é só selecionar a outra opção.

Os filtros podem ser por grupo, tema ou canal. Como a maior base da ferramenta é a análise dos canais e redes sociais, a lista é enorme: são monitorados blogs (e comentários), Facebook, Twitter, Foursquare, Fóruns, Google+, Instagram, LinkedIn, notícias (e veículos), ReclameAqui, Tumblr, YouTube e até televisão (!). Isso é possível porque alguns jornais, como os da Globo, disponibilizam a transcrição do conteúdo e ela é acessível pelo Stilingue.

Também é possível ver as fotos que estão sendo compartilhadas junto com o assunto monitorada, além de uma visão geral, que é semelhante à pesquisa rápida. Assim, são mostrados o número de posts, usuários, distribuição por canais, ranking por influência, gênero, ocupação, dispositivos e mais.

Explorar Termos

Acima estão os termos mais usados quando se fala das produtoras de filmes. Observe que “filmes da disney”, “globo filmes”, “warner” são os termos mais próximos, mas estão esfriando (por isso estão em azul). É só olhar ao redor que você encontra outros temas como “procurando dory”, “superman”, “o bom dinossauro”, sinalizando maior aceleração do termo entre as publicações.

Ranking Evolutivo

No final, é possível acompanhar os grupos de observação. Nesse caso, são mostradas as produtoras, porque foram os grupos que Brayan configurou no começo da pesquisa, e dá para acompanhar a movimentação das publicações sobre eles. No ranking evolutivo, mostrado acima, a Walt Disney sempre fica no topo, com a 20th Century Fox perdendo o segundo lugar nos últimos dias.

Evolução de Clusters
Evolução de Clusters-Hightlight

A ferramenta mostra ainda a evolução dos clusters, ou seja, como a inteligência artificial agrupou e mensurou assuntos descobertos automaticamente. Na imagem, dois trailers foram lançados pela Disney (Alice Através do Espelho e Procurando Dory), e por isso a produtora aparece em destaque durante esses dois períodos.

Segmentação de Menções

Por fim, os dados obtidos podem ser cruzados para segmentar a informação. Na imagem acima, os temas foram relacionados com os grupos de observação para ver quais produtoras têm mais movimentação de alguns assuntos como roteiro, efeitos visuais, trilha sonora, gêneros e tudo mais.

Compreensão do português é essencial

Brayan conta que o funcionamento da ferramenta em português é um diferencial e essencial para obter bons resultados, dedicando a tecnologia de processamento de texto para a nossa língua. A startup está reunindo uma série de professores brasileiros para ensinar a nossa língua e cultura, permitindo a estruturação do Big Data brasileiro. Atualmente, muitas soluções que coletam dados na internet realizam buscas simples por palavras-chave, sem considerar sintaxe e aspectos semânticos da língua, então elas não conseguem separar o que é relevante ou não.

No caso da Stilingue, vários recursos, como a classificação de positivo/negativo, temas relacionados e os tópicos, não estariam disponíveis sem um grande estudo de processamento da língua. “Nossa tecnologia foi pensada e educada especialmente para o português brasileiro. Isso faz com que o Stilingue entenda nossa língua e cultura, apontando o ‘o quê’, ‘quem’ e ‘onde’ estão as conversas sobre um tema estratégico para nossos clientes. O mais interessante: pró-ativamente, além do que foi informado para o computador”, explica Milton Stiilpen Jr., sócio responsável pela tecnologia.

O ranking de influenciadores, por exemplo, vai além dos seguidores e likes. Como a linguagem é realmente compreendida, a Stilingue consegue analisar e interpretar o texto publicado, para priorizar quem corresponde mais com o tema de interesse dos clientes. Rodrigo Helcer, co-fundador da startup, ressalta:

“Muitas vezes, vemos que celebridades e famosos não tem afinidade com o assunto desejado por nossos clientes e, por isso, não deveriam ocupar os primeiros lugares no ranking. Isso é levado em conta no nosso software, que lê os textos e dá notas para a afinidade por tópico. Com isso, chegamos a um ranking valioso para quem procura porta-vozes poderosos e acessíveis, fora do círculo comercial já saturado”

Helcer sinaliza que a crise atual pode favorecer o crescimento da ferramenta, ideal para analisar a percepção de marca, repercussão de ações e campanhas. “Neste momento delicado da economia, os profissionais de marketing buscam formas de fazer mais com menos. Encontrar pesquisas de baixo investimento e rápido feedback e descobrir como os influenciadores digitais direcionam consumidores na internet são dois pontos de partida importantes para alavancar vendas por mídias com um bom custo benefício”, diz.

A tecnologia já está disponível para uso em três formatos: aluguel de software; contratação de pesquisas e relatórios sob medida; e plug-ins para desenvolvedores que desejem embarcar a inteligência artificial em seus aplicativos. A startup é de Ouro Preto (MG) e foi criada em 2014 por dois mestrandos em Ciência da Computação. Eles já receberam investimentos da Play Capital e têm avaliação de mercado superior a R$ 10 milhões.

Receba mais sobre Stilingue na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Jean Prado

Jean Prado

Ex-autor

Jean Prado é jornalista de tecnologia e conta com certificados nas áreas de Ciência de Dados, Python e Ciências Políticas. É especialista em análise e visualização de dados, e foi autor do Tecnoblog entre 2015 e 2018. Atualmente integra a equipe do Greenpeace Brasil.

Relacionados