Google anuncia o Gemini 1.5, novo modelo para inteligência artificial

LLM do Google consegue lidar com até 1 milhão de tokens. Empresa usou arquitetura MoE para lidar com mais dados de forma mais rápida.

Por Thássius Veloso

há 5 meses

Marca do Gemini em cores claras, num fundo azul — Chatbot Gemini ganha aplicativo próprio e substitui Google Assistente (Imagem: Vitor Pádua/Tecnoblog)

O Google ampliou a capacidade da sua inteligência artificial com o anúncio do Gemini 1.5. Dentre os principais avanços, a empresa destaca maior capacidade de processamento num tempo menor. Ou seja, as respostas do chatbot serão apresentadas mais rápido para o usuário. A nova geração do modelo de linguagem foi anunciada nesta quinta-feira (15).

As melhorias do Gemini 1.5 têm a ver com uma arquitetura de inteligência artificial (IA) chamada de Mixture of Experts (MoE). Esse tema é absolutamente técnico, mas, em resumo, podemos dizer que o Gemini 1.5 seleciona parte do modelo de linguagem para atuar num determinado comando. Não seria necessário, portanto, ativar todas as redes neurais a cada nova tarefa.

O Google diz que o Gemini 1.5 é capaz de lidar com até 1 milhão de tokens. Em comparação, o GPT-4 chega a 128 mil tokens e o Gemini 1.0 consegue lidar com 32 mil tokens. Durante as pesquisas, os engenheiros conseguiram fazer o Gemini 1.5 Pro lidar com 10 milhões de tokens.

Gráfico compara a capacidade de LLMs do mercado (Imagem: Imagem/Google)

Mas o que são tokens, então? Eis aqui outro conceito complicado de explicar. Mas, de maneira completamente simplista, seria o equivalente às sílabas de uma palavra. Imagine o impacto do maior volume de tokens quando estamos falando de reportagens, discursos, artigos científicos, livros inteiros, roteiros de cinema etc.

O Gemini 1.5 é “tão capaz” quanto o Gemini 1.0 Ultra, modelo apresentado há uma semana pela empresa e presente no plano pago Google One AI Premium (R$ 96,99 no Brasil). Ele supera o Gemini 1.0 Pro em 87% e vence o Gemini 1.0 Ultra em 55% dos testes de benchmark.

O CEO da Alphabet, Sundar Pichar, explicou que o Gemini 1.5 consegue lidar com contextos mais amplos. Uma das possibilidades seria de considerar toda a trilogia cinematográfica de Senhor dos Anéis em busca de erros de continuidade. O executivo não confirmou (nem negou) que as equipes do Google tenham feito o experimento.

O departamento de IA DeepMind informou que inicialmente o Gemini 1.5 será liberado para desenvolvedores e clientes corporativos. Ainda não se sabe quando ele irá chegar à plataforma pública do Gemini, que recentemente colocou o Google Bard para escanteio.

De acordo com a empresa, ainda estão sendo feito testes de segurança e de integridade no Gemini 1.5. O modelo poderá ser acessado mediante solicitação. O Google fez a ressalva de que o uso de 1 milhão de tokens terá preço diferenciado.

O anúncio foi feito no mesmo dia em que a gigante dos chips Nvidia ultrapassou a Alphabet em valor de mercado. Coincidência?

Com informações: Google, Google Cloud, The Verge e CNET