Google anuncia Imagen 2, nova geração da IA capaz de criar imagens

IA está disponível para clientes do Google Cloud Vertex; nova geração traz “fotos” mais realistas e pode mostrar futuro do Bard

Por Felipe Freitas

há 7 meses

Inteligência artificial — IA do Google para criação de imagens chega na sua segunda geração (Imagem: Vitor Pádua / Tecnoblog)

O Google anunciou nesta quarta-feira (13) o Imagen 2, nova (e segunda) geração do seu modelo de IA para criação de imagens. Essa inteligência artificial só está disponível para os clientes do Vortex AI, um serviço disponível do Google Cloud. Nas prévias mostradas pela big tech, o Imagen 2 entrega resultados ultrarrealistas.

O Google também afirma que o Imagen 2 teve a sua compreensão de prompts melhoradas, o que deve levar o usuário a atingir os resultados desejados (ou o mais próximo possível disso). Infelizmente, por ser um serviço pago dentro de outro serviço pago, não podemos testá-lo e nem há um espaço de testes disponibilizado pela empresa — e o caso do Gemini deixa o pé atrás.

Imagens 2 treinou com a leitura de legendas

Imagens hiper-realistas criadas pelo Imagen 2 (Imagem: Reprodução/Google)

No anúncio oficial do Imagen 2, feito no site do DeepMind, subsidiária do Google, a empresa revela que para aprimorar o entendimento dos prompts, trabalhou em ampliar a descrição das imagens usadas no treinamento da IA. Segundo o Google, isso permitiu ao Imagen 2 melhorar a compreensão do contexto e nuances dos comandos.

O modelo de IA usado na ferramenta recebeu ainda um “treinamento especializado” em estética baseado nas preferências humanas. O Google criou uma escala de estética (o popular instagramável) para cada imagem, levando em consideração fatores como iluminação, tempo de exposição, enquadramento e nitidez. A empresa afirma que isso permite que o Imagen 2 gere imagens de qualidade ainda maior.

Essa habilidade, somado ao exemplo dado pelo Google, levanta uma questão: em quanto tempo as IAs estarão presente nos feeds das rede sociais através das belas imagens instagrameáveis? Imagens de pessoas estão cada vez mais realista, mas por que alguém se interessaria em publicar uma foto de outra pessoa ou alguém parecido? Imagens de belas paisagens seguem mais atrativas para likes.

Imagen 2 foi treinado com descrições mais amplas, o que promete resultados mais realistas, como esta de um tordo (Imagem: Reprodução/Google)

Imagen conta com ferramenta para reconhecer suas imagens

Um diferencial da IA do Imagen é que ela possui uma marca d’água que reconhece imagens feita por ela mesmo. Essa tecnologia do Google cria um identificador nos pixels das fotos e artes criadas pela inteligência artificial e, segundo a empresa, não pode ser removido de nenhuma maneira. Assim, um usuário pode subir uma imagem para o Imagen e ele identificará se foi feito por IA ou não.

O ponto negativo para o Imagen é que ele segue restrito aos clientes do Google. O Bard ainda não é capaz de gerar imagens (apesar dele dizer que sim, ele apenas pesquisa por elas no Google). A IA generativa do Google utiliza o LLM Gemini, mas os planos do Google para levar a criação de imagens para o Bard são desconhecidos. Todavia, o Imagen já dá uma prévia do que podemos ver no futuro (distante ou próximo).

Com informações: TechCrunch

Comentários da Comunidade

$com 40% mais IA que a concorrência. ¯\_(ツ)_/¯$

6 comentários

Participe da discussão

Os mais notáveis

Comentários com a maior pontuação

João Gomes 7 meses atrás

Parece que essa IA sabre criar mãos, isso é um grande avanço

com 40% mais IA que a concorrência. ¯\_(ツ)_/¯ 7 meses atrás

Quanto tempo até alguém usar essa IA pra conteúdo de entreterimento adulto? Aquele que geralmente o pessoal abrevia pra 4 letras e as vezes trocam a vogal por número além de trocar ela de lugar com a consoante seguinte…