Início » Inteligência Artificial » Este é Jarvis, assistente virtual de… Mark Zuckerberg

Este é Jarvis, assistente virtual de… Mark Zuckerberg

Você não leu errado: no início do ano, Mark Zuckerberg prometeu criar o seu próprio Jarvis e assim o fez.

Emerson Alecrim Por

O ano está terminando, então deixe-me perguntar: você cumpriu as resoluções que fez para 2016? Bom, a gente conhece um cara que cumpriu. No começo de janeiro, Mark Zuckerberg prometeu criar um assistente virtual inteligente. Na segunda-feira (19), ele revelou que o Jarvis já é realidade.

Jarvis não é o nome oficial, mas Zuckerberg o utiliza porque o projeto é inegavelmente inspirado no assistente virtual do Homem de Ferro. Conceitualmente, a maior diferença entre ambos é que o Jarvis da ficção não atua apenas como um mero mordomo virtual, mas também ajuda Tony Stark a ser um herói. Já o Jarvis “real” foi idealizado para atuar em tarefas domésticas.

Zuckerberg explica que, tal como prometido no início do ano, o seu assistente já consegue controlar as luzes, ajustar a temperatura, reproduzir músicas e gerenciar as câmeras de segurança da sua casa. O assistente recebe comandos por computador e smartphone, mas também pode automatizar algumas tarefas: ele reconhece todos os moradores do local e, com isso, consegue aprender as preferências de cada um.

Para tanto, uma das primeiras etapas do projeto consistiu em tornar os dispositivos domésticos em dispositivos domésticos conectados (sim, algo na pegada da internet das coisas). Zuckerberg explica que essa fase deu bastante trabalho: a maioria dos dispositivos não foi projetada para se conectar à internet; entre os que estão preparados para isso, como uma TV Samsung e uma câmera Nest, não há padronização de protocolos.

Ao descrever essas complicações, Mark Zuckerberg enviou um recado à indústria: “precisamos de mais dispositivos conectados e que a indústria desenvolva APIs e padrões que permitam que os dispositivos conversem entre si”.

Inteligência artificial

A etapa seguinte foi tão ou mais desafiadora, mas suspeito que mais divertida também: implementar os algoritmos de inteligência artificial. Isso porque o assistente precisa não só entender comandos de voz, mas também interpretar contextos. Por exemplo, se Zuckerberg pede para apagar a luz, o assistente precisa entender que a instrução se refere ao recinto em que ele está.

É mais difícil do que parece. Os comandos podem ter variações muito sutis. O próprio Zuckerberg dá um exemplo: há diferenças entre pedir para o assistente “reproduzir Someone Like You”, “reproduzir algo como Adele” e “reproduzir algo da Adele”.

Jarvis Server

Essas instruções soam bastante parecidas (em inglês, pelo menos), mas nós conseguimos interpretá-las corretamente. Uma máquina, porém, precisa de um mecanismo avançado de aprendizagem para interpretar corretamente os comandos, principalmente se levarmos em conta que cada usuário tem preferências distintas.

Para lidar com tudo isso, o assistente conta com algoritmos de reconhecimento de voz, de processamento de linguagem natural, de aprendizagem por reforço, de reconhecimento facial, entre outros, tudo escrito em Python, PHP e Objective-C, segundo Zuckerberg.

O Jarvis precisa de olhos

O assistente também foi desenvolvido para monitorar Max (filha de Zuckerberg) no quarto, reconhecer amigos batendo na porta e, claro, gerar alertas se um invasor entrar na casa (daí o algoritmo de reconhecimento facial). Para isso, o Jarvis precisa “enxergar”. Os olhos deles são as câmeras que Zuckerberg espalhou pelo local.

Jarvis no Facebook Messenger

Se um amigo bate na porta, o assistente é capaz de informar “Fulano acabou de chegar”. De igual forma, o Jarvis pode avisar Mark ou Priscilla Chan (a esposa de Zuckerberg) que Max acabou de acordar. A implementação desse sistema foi uma das etapas mais fáceis: faz tempo que o Facebook tem um sistema de reconhecimento facial que trabalha bem.

Não termina aí. Zuckerberg achou que seria legal enviar comandos ao assistente quando estiver longe de casa. Para isso, ele integrou um bot ao Facebook Messenger. Comandos escritos são usados, por exemplo, quando Zuckerberg não quer incomodar alguém que está por perto (ou talvez ele tenha vergonha de pronunciar comandos na frente de outras pessoas, vai saber). O Jarvis também usa o Messenger proativamente, enviando a Mark, entre outras informações, fotos de pessoas que se aproximaram da casa em sua ausência.

Um grande experimento

Mas, na maior parte do tempo, os comandos de voz é que são usados. Por isso, Zuckerberg programou um app de reconhecimento de voz para iOS (uma versão para Android também deve ser desenvolvida) para ficar sempre ativo.

Aqui, o criador do Facebook percebeu que, apesar de a inteligência artificial ter avançado bastante, ainda há muito trabalho a ser feito: sistemas do tipo ainda têm dificuldades para compreender conversas inteiras; eles ainda dependem de padrões de comunicação muito específicos.

O próximo passo?

O próximo passo?

Mark Zuckerberg não disse se pretende disponibilizar o Jarvis como um produto comercial ou, de alguma forma, aproveitar a tecnologia no Facebook. Por ora, o projeto é um grande experimento que, como tal, deixou evidente a ele o que é a inteligência artificial atualmente: algo muito avançado, que pode fazer coisas como curar doenças e dirigir carros, mas que ainda não é capaz de aprender habilidades por si só — tudo o que o Jarvis faz ainda precisa ser programado.

Ah, sim: Zuckerberg promete revelar a sua resolução para 2017 nas próximas semanas. Já pensou se ele resolve se tornar, tanto quanto possível, um equivalente do Homem de Ferro?

Comentários

Envie uma pergunta

Os mais notáveis

Comentários com a maior pontuação

Antonio Carlos Da Silva de Ass
ochateador

Eu entendi que em inglês é tudo parecido (a escrita/fala).
Mas pare e veja as 3 opções, para alguém que já sabe interpretar isso é fácil de diferenciar, mas as máquinas ainda estão na fase criança-bebê e por isso não sabem interpretar/diferenciar as 3 opções. E é esse o ponto que estou destacando.

ochateador
Eu entendi que em inglês é tudo parecido (a escrita/fala). Mas pare e veja as 3 opções, para alguém que já sabe interpretar isso é fácil de diferenciar, mas as máquinas ainda estão na fase criança-bebê e por isso não sabem interpretar/diferenciar as 3 opções. E é esse o ponto que estou destacando.
@Sckillfer

A questão não é essa... A questão é que em inglês é tudo some... like...

Sckillfer
A questão não é essa... A questão é que em inglês é tudo some... like...
Tiago Celestino

é um fanfarrão esse Zuck! hahahah

Tiago Celestino
é um fanfarrão esse Zuck! hahahah
Claudio Roberto Cussuol

Quando eu digo pro Google Now: "Toca Raul!!!!"
Ele entende. Na última vez soltou Maluco Beleza.

Claudio Roberto Cussuol
Quando eu digo pro Google Now: "Toca Raul!!!!" Ele entende. Na última vez soltou Maluco Beleza.
Raphael

"Consider these requests related to Adele: "play someone like you", "play someone like adele", and "play some adele". "

Raphael
"Consider these requests related to Adele: "play someone like you", "play someone like adele", and "play some adele". "
Jhonny Gonçalves

não esquecendo que ele tem senhas padrão: dadada. Ou seja ¯\_(ツ)_/¯

Jhonny Gonçalves
não esquecendo que ele tem senhas padrão: dadada. Ou seja ¯_(?)_/¯
Ed. Blake

Tal qual a superestimada VR de hoje em dia.
Cada um querendo comer sozinho um troço que não tá pronto.

Se não padronizar, não vai ter apelo pois desenvolvedor não quer fazer o mesmo código pra 5 ou 6 APIs diferentes.

Comediante
Tal qual a superestimada VR de hoje em dia. Cada um querendo comer sozinho um troço que não tá pronto. Se não padronizar, não vai ter apelo pois desenvolvedor não quer fazer o mesmo código pra 5 ou 6 APIs diferentes.
Exibir mais comentários