Nova imagem AI “Lexica Aperture” gera imagens fotorrealistas

Fotos e imagens AI ainda são fáceis de distinguir – mas por quanto tempo? Uma nova ferramenta desfoca ainda mais as linhas entre imagens reais e geradas.

Sharif Shameem, que criou o extenso Banco de dados de imagens AI Lexica Art revelou seu novo projeto: Lexica Aperture é um gerador de imagens que produz imagens realistas a partir de uma simples entrada de texto em segundos.

Os atuais geradores de imagens AI não são bons para gerar imagens fotorrealistas. Imitando vários estilos artísticos em Midjourney, DALL-E e co. já está em alto nível ( para grande frustração de alguns artistas ), mas o fotorrealismo ainda é experimental. Com as instruções certas, no entanto, você pode chegar perto disso.

Midjourney V4 demonstrou isso de forma muito impressionante, e O DALL-E 2 já produz fotorrealismo com o prompt certo . Não é de admirar que bancos de dados de imagens de IA estão se preparando para competir com os diretórios de fotos clássicos, A Shutterstock está entrando em uma cooperação com a OpenAI e alguns fotógrafos se perguntam se seu hobby ou profissão acabou .

O Lexica Aperture oferece uma interface web direta

O Lexica Aperture pode ser testado gratuitamente através do interface web simples após o login. As configurações são limitadas a ajustar a resolução entre 512 x 768 Pixels, a escala de orientação entre 4 e 13 e uma chave para evitar cabeças duplas que geralmente ocorrem em retratos AI.

Ao lado do prompt há um campo para entrada negativa do que não deve ser visível na imagem. Alguns segundos depois de clicar em “Gerar”, o Lexica Aperture mostra quatro resultados. Depois de concluídas, as imagens podem ser dimensionadas para um tamanho máximo de 3.072 x 2.048 Pixels.

Difusão estável treinada com fotos de alta resolução

O desenvolvedor Shameem não fornece uma visão mais aprofundada da arquitetura do modelo no momento. No entanto, é quase certamente uma versão ajustada do Stable Diffusion.

“Como o modelo é treinado em fotos de alta resolução, descobri que uma heurística decente para o Aperture é pensar nele como um mecanismo 3D fotorrealista que você pode solicitar via texto,” Shameem escreve .

O Lexica Aperture certamente não deixará os fotógrafos sem trabalho ainda, mesmo que os rostos pareçam mais realistas do que nunca à primeira vista. Com muita frequência, um olhar mais atento revela artefatos e inconsistências que expõem a imagem como resultado de uma IA e não de uma câmera. Ainda assim, o modelo faz um excelente trabalho com fotos, principalmente ao simular tomadas em filmes antigos.