Google revela Gemini, novo modelo de IA que vai equipar Bard e smartphones
Gemini tem três versões e roda até mesmo em um smartphone. Pixel 8 Pro usará tecnologia para resumir gravações e sugerir respostas. Bard também deve ficar mais esperto.
Gemini tem três versões e roda até mesmo em um smartphone. Pixel 8 Pro usará tecnologia para resumir gravações e sugerir respostas. Bard também deve ficar mais esperto.
O Google revelou mais detalhes sobre o Gemini, seu novo modelo de linguagem em larga escala, que vai equipar o Bard e outros produtos da marca. A empresa promete que o Gemini Pro, versão intermediária da tecnologia, é capaz de superar o GPT-3.5, que equipa a versão gratuita do ChatGPT.
O Gemini tem três versões. A mais potente delas é a Ultra, voltada para tarefas mais exigentes. A intermediária é a Pro, já mencionada, que deve servir para grande parte dos usos. Por fim, há uma versão Nano, que pode ser executada diretamente em dispositivos móveis, como celulares.
O Gemini consegue reconhecer, ao mesmo tempo, vídeo, imagens, texto e voz. Por enquanto, ele só responde em texto ou código.
O Pixel 8 Pro, smartphone da empresa, usará o Gemini Nano para tarefas como resumir arquivos de áudio do app Gravador e sugerir respostas inteligentes no teclado Gboard, começando pelo WhatsApp. O Google enfatiza que o aparelho é o primeiro celular projetado para rodar o modelo.
A partir desta quarta-feira (6), uma versão aprimorada do Gemini Pro passará a equipar o Bard. Ela estará disponível em mais de 170 países e territórios, mas funciona apenas em inglês.
O Google diz que o Gemini Pro supera o GPT-3.5, usado na versão gratuita do ChatGPT. A versão Plus do ChatGPT, porém, usa o GPT-4. Segundo a CNBC, executivos do Google se esquivaram desta comparação.
O Gemini Pro também estará disponível para desenvolvedores e clientes corporativos a partir de 13 de dezembro, por meio da Gemini API e da Google Cloud Vertex AI. Já desenvolvedores de apps Android poderão usar o Gemini Nano.
Segundo o Google, o Gemini Ultra é o primeiro modelo a superar especialistas humanos em MMLU, sigla em inglês para “compreensão de linguagem multitarefa em massa”, uma combinação de 57 assuntos, como matemática, física, história, direito, medicina e ética para testes de conhecimento e resolução de problemas. Isso pode ajudar na compreensão de nuances e no raciocínio em tópicos complexos.
Esta versão ainda não está disponível. O Google quer terminar testes adicionais de segurança antes de liberá-la. Alguns clientes, desenvolvedores, parceiros e especialistas em segurança terão acesso antecipado para experimentar e dar feedback.
Além disso, o Google pretende criar uma versão mais potente do Bard, chamada Bard Advanced. Ela usará os melhores modelos da empresa, começando pelo Gemini Ultra. A companhia ainda não revelou quando o Bard Advanced será lançado, nem quanto vai custar.