Teste DALL-E 2: você consegue dizer a diferença entre IA e arte humana?

O DALL-E 2 e sistemas AI semelhantes criam imagens autênticas. Você ainda consegue dizer a diferença entre arte feita pelo homem e arte feita à máquina?

A pesquisa e a indústria de IA fizeram grandes progressos no desenvolvimento de modelos multimodais de IA no ano passado. O DALL-E da OpenAI no início de 2021 mostrou para onde a jornada estava indo: IA que gera motivos hipnóticos, surreais, fotorrealistas e todos os outros desejados em resposta à entrada de texto.

Cerca de um ano depois, esses avanços nos modelos multimodais possibilitaram o desenvolvimento de DALL-E 2 da OpenAI . A IA supera em muito a sua antecessora, gerando imagens impressionantes continuamente em muitos estilos e em muitos tópicos.

No final de maio, Google revelou Imagen , uma IA de imagem generativa que realmente supera o DALL-E 2 em algumas áreas. Em ambos os casos, basta uma pequena entrada de texto – e dois minutos depois, a imagem está pronta.

Arte de IA: os humanos ainda conseguem perceber a diferença?

Para chamar a atenção para esses avanços, Sahar Mor, gerente de produto da Stripe e entusiasta de IA, lançou o site thisimagedoesnotexist.com. Os visitantes podem testar se ainda conseguem distinguir entre imagens geradas por humanos e por máquinas.

Para o site, inspirado no clássico site falso de IA thispersondoesnotexist.com, ele coletou várias centenas de imagens geradas pelo DALL-E 2, bem como imagens criadas por humanos, e desenvolveu um procedimento de votação simples: A imagem vem do DALL-E 2 ou é derivado de um cérebro humano?

Sahar descreve seu site como um teste visual de Turing: ele mostra 30 imagens uma após a outra, feitas por inteligência artificial ou por humanos. Para cada imagem, os visitantes podem votar em uma das duas opções e depois verificar se estão corretas. No caso de imagens geradas por IA, o site exibe a entrada de texto usada para gerá-las.

DALL-E 2: As coisas (não) parecem boas

Na primeira semana após o lançamento do site, mais de 40.000 visitantes de mais de 100 países votaram mais de 400.000 vezes. A pontuação média é de 18 em 30, portanto, os visitantes só conseguiram classificar corretamente as imagens em pouco mais da metade dos casos. Isso é pouco melhor do que coincidência.

Para OpenAI, esta é uma boa notícia. Para algumas pessoas que ganham a vida com gráficos, ilustrações e fotos, provavelmente não .

Os visitantes estavam particularmente errados sobre as duas imagens mostradas acima: 74 por cento pensaram no robô com boné (fonte da imagem: Onda Plana ) foi gerada por IA, 82% pensaram que a porção de frango frito era uma foto real. É o contrário. O DALL-E 2 gerou a foto com base na entrada “KFC Original Recipe Chicken, Fresh, Hot and Juicy, 8K High Resolution, Studio Lighting”.

Aqui você pode testar seu próprio talento para detectar imagens geradas por IA .