ChatGPT para celular ganha comandos por voz e imagem; IA também aprende a falar

OpenAI apresentou nesta segunda nova atualização da IA que permite o envio de prompts por fotos e voz, além de respostas faladas

Felipe Freitas
Por
ChatGPT
ChatGPT agora pode ver, ouvir e falar — mas só para quem paga (Imagem: Vitor Pádua / Tecnoblog)

A OpenAI anunciou nesta segunda-feira (25) uma nova e importante atualização para o ChatGPT. Agora, a ferramenta de inteligência artificial é capaz de receber comandos com imagens e por voz, além de responder falando com o usuário — mas só se o acesso ocorrer via smartphones. As novidades chegarão primeiro para os usuários dos serviços pagos ChatGPT Plus e ChatGPT Enterprise.

A empresa informou que a atualização chegará para todos usuários ao longo das próximas duas semanas — com os primeiros clientes recebendo as novidades a partir de hoje. A OpenAI revela ainda que, após esse período, liberará o uso dessas novidades para desenvolvedores. Entretanto, não revelou quando os novos recursos chegarão para os usuários não-pagantes.

ChatGPT agora escuta, vê e fala — pelo menos em celulares

Os novos modos de enviar comandos ao ChatGPT, além de mostrar a evolução da inteligência artificial, devem entregar mais praticidade para os usuários — principalmente o recurso de prompts por imagem. Na semana passada, a OpenAI informou que a Dall-E 3 foi integrado ao ChatGPT.

Como mostra a conta da OpenAI no X/Twitter e por exemplos no seu site, o ChatGPT poderá identificar uma foto e auxiliar o usuário após analisar o conteúdo da imagem. Na rede social, a empresa publicou um vídeo da IA explicando como ajustar o banco de uma bicicleta.

ChatGPT pode entender comandos com base em imagens (Imagem: Reprodução/Tecnoblog)
ChatGPT pode entender comandos com base em imagens (Imagem: Reprodução/Tecnoblog)

O ChatGPT pede uma imagem mais detalhada do ponto de fixação do banco, ferramentas que o usuário tem e o manual da bicicleta. No vídeo, a inteligência artificial identifica que o banco precisa de uma chave Allen, também conhecida como sextavada, e que esta ferramenta está na caixa — analisando a imagem subida pelo usuário.

A OpenAI também mostrou o recurso de prompt por voz e resposta falada. No exemplo, o ChatGPT possui uma voz feminina e, conforme o comando de voz de uma usuária, conta uma história infantil. A história não é completada pela IA em um único prompt, mas a usuária faz mais um comando para dar sequência ao conto infantil.

Se você assina o ChatGPT Plus ou Enterprise, pode ativar o recurso de voz (se já foi liberado para você) através das configurações do aplicativo.

Com informações: The Verge

Receba mais sobre OpenAI na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Felipe Freitas

Felipe Freitas

Repórter

Felipe Freitas é jornalista graduado pela UFSC, interessado em tecnologia e suas aplicações para um mundo melhor. Na cobertura tech desde 2021 e micreiro desde 1998, quando seu pai trouxe um PC para casa pela primeira vez. Passou pelo Adrenaline/Mundo Conectado. Participou da confecção de reviews de smartphones e outros aparelhos.

Relacionados