Google revela Gemini, novo modelo de IA que vai equipar Bard e smartphones

Gemini tem três versões e roda até mesmo em um smartphone. Pixel 8 Pro usará tecnologia para resumir gravações e sugerir respostas. Bard também deve ficar mais esperto.

Giovanni Santa Rosa

O Google revelou mais detalhes sobre o Gemini, seu novo modelo de linguagem em larga escala, que vai equipar o Bard e outros produtos da marca. A empresa promete que o Gemini Pro, versão intermediária da tecnologia, é capaz de superar o GPT-3.5, que equipa a versão gratuita do ChatGPT.

O Gemini tem três versões. A mais potente delas é a Ultra, voltada para tarefas mais exigentes. A intermediária é a Pro, já mencionada, que deve servir para grande parte dos usos. Por fim, há uma versão Nano, que pode ser executada diretamente em dispositivos móveis, como celulares.

O Gemini consegue reconhecer, ao mesmo tempo, vídeo, imagens, texto e voz. Por enquanto, ele só responde em texto ou código.

Gemini chega primeiro ao Bard e ao Pixel 8 Pro

O Pixel 8 Pro, smartphone da empresa, usará o Gemini Nano para tarefas como resumir arquivos de áudio do app Gravador e sugerir respostas inteligentes no teclado Gboard, começando pelo WhatsApp. O Google enfatiza que o aparelho é o primeiro celular projetado para rodar o modelo.

A partir desta quarta-feira (6), uma versão aprimorada do Gemini Pro passará a equipar o Bard. Ela estará disponível em mais de 170 países e territórios, mas funciona apenas em inglês.

O Google diz que o Gemini Pro supera o GPT-3.5, usado na versão gratuita do ChatGPT. A versão Plus do ChatGPT, porém, usa o GPT-4. Segundo a CNBC, executivos do Google se esquivaram desta comparação.

O Gemini Pro também estará disponível para desenvolvedores e clientes corporativos a partir de 13 de dezembro, por meio da Gemini API e da Google Cloud Vertex AI. Já desenvolvedores de apps Android poderão usar o Gemini Nano.

Google quer garantir segurança da versão Ultra

Segundo o Google, o Gemini Ultra é o primeiro modelo a superar especialistas humanos em MMLU, sigla em inglês para “compreensão de linguagem multitarefa em massa”, uma combinação de 57 assuntos, como matemática, física, história, direito, medicina e ética para testes de conhecimento e resolução de problemas. Isso pode ajudar na compreensão de nuances e no raciocínio em tópicos complexos.

Esta versão ainda não está disponível. O Google quer terminar testes adicionais de segurança antes de liberá-la. Alguns clientes, desenvolvedores, parceiros e especialistas em segurança terão acesso antecipado para experimentar e dar feedback.

Além disso, o Google pretende criar uma versão mais potente do Bard, chamada Bard Advanced. Ela usará os melhores modelos da empresa, começando pelo Gemini Ultra. A companhia ainda não revelou quando o Bard Advanced será lançado, nem quanto vai custar.

Com informações: Google, Axios, CNBC

Relacionados

Escrito por

Giovanni Santa Rosa

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.