Google anuncia o Gemini 1.5, novo modelo para inteligência artificial

LLM do Google consegue lidar com até 1 milhão de tokens. Empresa usou arquitetura MoE para lidar com mais dados de forma mais rápida.

Thássius Veloso
Por
Marca do Gemini em cores claras, num fundo azul
Chatbot Gemini ganha aplicativo próprio e substitui Google Assistente (Imagem: Vitor Pádua/Tecnoblog)

O Google ampliou a capacidade da sua inteligência artificial com o anúncio do Gemini 1.5. Dentre os principais avanços, a empresa destaca maior capacidade de processamento num tempo menor. Ou seja, as respostas do chatbot serão apresentadas mais rápido para o usuário. A nova geração do modelo de linguagem foi anunciada nesta quinta-feira (15).

As melhorias do Gemini 1.5 têm a ver com uma arquitetura de inteligência artificial (IA) chamada de Mixture of Experts (MoE). Esse tema é absolutamente técnico, mas, em resumo, podemos dizer que o Gemini 1.5 seleciona parte do modelo de linguagem para atuar num determinado comando. Não seria necessário, portanto, ativar todas as redes neurais a cada nova tarefa.

O Google diz que o Gemini 1.5 é capaz de lidar com até 1 milhão de tokens. Em comparação, o GPT-4 chega a 128 mil tokens e o Gemini 1.0 consegue lidar com 32 mil tokens. Durante as pesquisas, os engenheiros conseguiram fazer o Gemini 1.5 Pro lidar com 10 milhões de tokens.

Gráfico
Gráfico compara a capacidade de LLMs do mercado (Imagem: Imagem/Google)

Mas o que são tokens, então? Eis aqui outro conceito complicado de explicar. Mas, de maneira completamente simplista, seria o equivalente às sílabas de uma palavra. Imagine o impacto do maior volume de tokens quando estamos falando de reportagens, discursos, artigos científicos, livros inteiros, roteiros de cinema etc.

O Gemini 1.5 é “tão capaz” quanto o Gemini 1.0 Ultra, modelo apresentado há uma semana pela empresa e presente no plano pago Google One AI Premium (R$ 96,99 no Brasil). Ele supera o Gemini 1.0 Pro em 87% e vence o Gemini 1.0 Ultra em 55% dos testes de benchmark.

O CEO da Alphabet, Sundar Pichar, explicou que o Gemini 1.5 consegue lidar com contextos mais amplos. Uma das possibilidades seria de considerar toda a trilogia cinematográfica de Senhor dos Anéis em busca de erros de continuidade. O executivo não confirmou (nem negou) que as equipes do Google tenham feito o experimento.

O departamento de IA DeepMind informou que inicialmente o Gemini 1.5 será liberado para desenvolvedores e clientes corporativos. Ainda não se sabe quando ele irá chegar à plataforma pública do Gemini, que recentemente colocou o Google Bard para escanteio.

De acordo com a empresa, ainda estão sendo feito testes de segurança e de integridade no Gemini 1.5. O modelo poderá ser acessado mediante solicitação. O Google fez a ressalva de que o uso de 1 milhão de tokens terá preço diferenciado.

O anúncio foi feito no mesmo dia em que a gigante dos chips Nvidia ultrapassou a Alphabet em valor de mercado. Coincidência?

Com informações: Google, Google Cloud, The Verge e CNET

Receba mais sobre Google na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Thássius Veloso

Thássius Veloso

Editor

Thássius Veloso é jornalista especializado em tecnologia e editor do Tecnoblog. Desde 2008, participa das principais feiras de eletrônicos, TI e inovação. Também atua como comentarista da GloboNews, palestrante, mediador e apresentador de eventos. Tem passagem pela CBN e pelo TechTudo. Já apareceu no Jornal Nacional, da TV Globo, e publicou artigos na Galileu e no jornal O Globo. Ganhou o Prêmio Especialistas em duas ocasiões e foi indicado diversas vezes ao Prêmio Comunique-se.

Relacionados