Google anuncia Imagen 2, nova geração da IA capaz de criar imagens

IA está disponível para clientes do Google Cloud Vertex; nova geração traz “fotos” mais realistas e pode mostrar futuro do Bard

Felipe Freitas
Por
Inteligência artificial
IA do Google para criação de imagens chega na sua segunda geração (Imagem: Vitor Pádua / Tecnoblog)

O Google anunciou nesta quarta-feira (13) o Imagen 2, nova (e segunda) geração do seu modelo de IA para criação de imagens. Essa inteligência artificial só está disponível para os clientes do Vortex AI, um serviço disponível do Google Cloud. Nas prévias mostradas pela big tech, o Imagen 2 entrega resultados ultrarrealistas.

O Google também afirma que o Imagen 2 teve a sua compreensão de prompts melhoradas, o que deve levar o usuário a atingir os resultados desejados (ou o mais próximo possível disso). Infelizmente, por ser um serviço pago dentro de outro serviço pago, não podemos testá-lo e nem há um espaço de testes disponibilizado pela empresa — e o caso do Gemini deixa o pé atrás.

Imagens 2 treinou com a leitura de legendas

Imagens hiper-realistas criadas pelo Imagen 2 (Imagem: Reprodução/Google)
Imagens hiper-realistas criadas pelo Imagen 2 (Imagem: Reprodução/Google)

No anúncio oficial do Imagen 2, feito no site do DeepMind, subsidiária do Google, a empresa revela que para aprimorar o entendimento dos prompts, trabalhou em ampliar a descrição das imagens usadas no treinamento da IA. Segundo o Google, isso permitiu ao Imagen 2 melhorar a compreensão do contexto e nuances dos comandos.

O modelo de IA usado na ferramenta recebeu ainda um “treinamento especializado” em estética baseado nas preferências humanas. O Google criou uma escala de estética (o popular instagramável) para cada imagem, levando em consideração fatores como iluminação, tempo de exposição, enquadramento e nitidez. A empresa afirma que isso permite que o Imagen 2 gere imagens de qualidade ainda maior.

Essa habilidade, somado ao exemplo dado pelo Google, levanta uma questão: em quanto tempo as IAs estarão presente nos feeds das rede sociais através das belas imagens instagrameáveis? Imagens de pessoas estão cada vez mais realista, mas por que alguém se interessaria em publicar uma foto de outra pessoa ou alguém parecido? Imagens de belas paisagens seguem mais atrativas para likes.

Imagen 2 foi treinado com descrições mais amplas, o que promete resultados mais realistas, como esta de um tordo (Imagem: Reprodução/Google)
Imagen 2 foi treinado com descrições mais amplas, o que promete resultados mais realistas, como esta de um tordo (Imagem: Reprodução/Google)

Imagen conta com ferramenta para reconhecer suas imagens

Um diferencial da IA do Imagen é que ela possui uma marca d’água que reconhece imagens feita por ela mesmo. Essa tecnologia do Google cria um identificador nos pixels das fotos e artes criadas pela inteligência artificial e, segundo a empresa, não pode ser removido de nenhuma maneira. Assim, um usuário pode subir uma imagem para o Imagen e ele identificará se foi feito por IA ou não.

O ponto negativo para o Imagen é que ele segue restrito aos clientes do Google. O Bard ainda não é capaz de gerar imagens (apesar dele dizer que sim, ele apenas pesquisa por elas no Google). A IA generativa do Google utiliza o LLM Gemini, mas os planos do Google para levar a criação de imagens para o Bard são desconhecidos. Todavia, o Imagen já dá uma prévia do que podemos ver no futuro (distante ou próximo).

Com informações: TechCrunch

Receba mais sobre Google na sua caixa de entrada

* ao se inscrever você aceita a nossa política de privacidade
Newsletter
Felipe Freitas

Felipe Freitas

Repórter

Felipe Freitas é jornalista graduado pela UFSC, interessado em tecnologia e suas aplicações para um mundo melhor. Na cobertura tech desde 2021 e micreiro desde 1998, quando seu pai trouxe um PC para casa pela primeira vez. Passou pelo Adrenaline/Mundo Conectado. Participou da confecção de reviews de smartphones e outros aparelhos.

Relacionados