Microsoft cria tecnologia que identifica emoções em fotos
As expressões faciais dizem muito sobre o nosso estado de espírito. Com um rápido lance de olhar para o rosto de uma pessoa a gente consegue perceber se ela está alegre, triste, brava, entediada, enfim. Já para os computadores, obviamente, essa não é uma tarefa trivial. Mas não é que a Microsoft encarou o desafio e criou um algoritmo que reconhece emoções a partir de fotos?
Esse trabalho faz parte do Project Oxford, um conjunto de APIs de aprendizado de máquina que pesquisadores da Microsoft vêm desenvolvendo há alguns meses. Dali já saíram outras ideias interessantes, como o site que tenta adivinhar a sua idade em uma foto (virou febre na época do lançamento) e um outro que tenta estimar quão “gêmeo” você é de outra pessoa.
O sistema de reconhecimento de emoções pode ser testado nesta página. Para isso, você precisar enviar para o site uma foto que tenha pelo menos 36×36 pixels e até 4 MB de tamanho. Os formatos suportados são: JPEG, GIF, PNG e BMP. No caso de GIF animado, somente o primeiro frame será considerado.
Após essa etapa, o algoritmo gastará alguns poucos segundos analisando a imagem. O resultado ainda não é apresentado com gráficos bonitinhos como na imagem que abre este post, mas em números que indicam qual o grau de cada tipo de emoção no rosto estudado.
Evidentemente, o maior número da lista indica a emoção mais provável do indivíduo que aparece na imagem. Eu fiz testes com fotos de pessoas rindo, chorando, esbravejando, entre outros. Os resultados foram precisos com a maioria.
Você deve estar se perguntando como isso funciona. A Microsoft não entrou em detalhes, mas explicou que o sistema se baseia em uma técnica de reconhecimento facial que faz comparação com traços de imagens de rostos que foram previamente associados com estados emocionais. Quanto mais fotos analisadas, mais o sistema aprende. Assim, o reconhecimento melhora com o passar do tempo.
Bacana, só que parece não ter utilidade prática, né? Mas o pessoal da Microsoft afirma que tem, sim. Para Ryan Galgon, gerente sênior de programa da companhia, desenvolvedores podem usar a ferramenta para criar sistemas que estudam a reação das pessoas ao analisar produtos em uma loja, por exemplo (sim, certamente haverá discussão sobre privacidade e ética aí, mas é uma ideia).
Mas eu vejo um sistema como esse sendo destinado a um fim mais nobre: reconhecer se uma pessoa está, entre outras emoções, irritada ou enojada por meio de expressões faciais é fácil para a maioria, mas há indivíduos — como crianças com autismo — que podem precisar de ajuda profissional para desenvolver essa habilidade.
Há softwares que ajudam substancialmente nessa tarefa, como o LIFEisGAME. Um sistema que utiliza reconhecimento facial para identificar emoções poderia tornar ferramentas do tipo ainda mais eficazes.
No fundo, a intenção da Microsoft com um algoritmo como esse é demonstrar o que o Project Oxford é capaz de proporcionar. É possível utilizar as APIs disponíveis ali em várias aplicações. A ideia, segundo a companhia, é permitir que desenvolvedores incluam em seus projetos mecanismos de reconhecimento de imagem e voz, por exemplo, mas sem ter que lidar com a complexidade de um sistema de aprendizado de máquina.