Sumário
- Emulando a realidade: o que há em um prompt?
- A magia da lente
- Sigma 85 mm f/1.4 – boa para uma lente de retrato
- Sigma 85 mm f/8 – menos profundidade de campo e fundo mais nítido (menos bokeh)
- Sigma 24 mm f/8 – ângulo mais amplo, distância focal menor
- Sigma 24 mm f/8, velocidade do obturador de 1/10 s – desfoque de movimento, velocidade do obturador mais lenta
- Velocidade do obturador Sigma 24 mm f/8 1/1000 seg – movimento, mas imagem nítida – com velocidade do obturador mais lenta
- Encontrando as configurações certas
- trilhas leves
- luz de estúdio
Em primeiro lugar: Sim, com o DALL-E você pode obter imagens fotorrealistas impressionantes. Mas a pergunta é: o que você entende pelo termo “fotorrealismo”?
Autor: Vladimir Alexeev
Nossa percepção é supersaturada pela mídia. Nossas expectativas podem abranger “a mesma qualidade da vida real”. Mas isso é, cá entre nós, uma grande mentira. Uma boa fotografia não transfere a realidade da “vida real” para o papel fotográfico ou arquivo digital. Em vez disso, é uma realidade encenada: um ângulo específico, iluminação, lente, etc.
Resumindo, o que você vê não é a “realidade”; em vez disso, é uma interpretação de uma fotografia.
Com o DALL-E 2, obtemos uma interpretação artificial do nosso mundo. Para ficar simples e superficial aqui, vamos segmentar o fotorrealismo em
- Emulando a realidade: abordagem para trazer uma imagem de forma mais convincente (alinhando-se com as expectativas e experiências dos espectadores)
- Emulation Medium: meta-abordagem para simular diferentes técnicas fotográficas, câmeras e estilos.
Uma Lomografia realista não parece fotorrealista, mas deve nos convencer de seu “realismo”. E DALL-E pode fazê-lo.
Emulando a realidade: o que há em um prompt?
Se você inserir um prompt de conteúdo sem nenhum modificador e esse conteúdo tiver um caráter relativamente objetivo ou figurativo, você já obterá imagens fotorrealistas.
Por exemplo, inserindo “Um Apple ” obterá uma série de imagens fotorrealistas da maçã. Nem mais nem menos.
De fato, se você adicionar o modificador “by Magritte”, este suplemento mudará drasticamente todo o caráter do prompt:
As coisas ficarão complicadas se você tentar criar imagens paradoxais, que sem dúvida não estavam no conjunto de dados do treinamento DALL-E, como: Um gato dirigindo uma bicicleta.
Aqui você vê como o DALL-E tenta reproduzir seu prompt, mas falha. Você pode ajudar a IA adicionando um modificador de artista: Um gato dirigindo uma bicicleta, uma ilustração de Michael Sowa.
O antropomorfismo de animais é típico para ilustrações de livros, portanto, essa tarefa é fácil para DALL-E com o modificador apropriado.
Claro, tudo é possível — e com o prompt certo, você pode criar uma fotografia de um gato dirigindo uma bicicleta, por exemplo, adicionando um modificador correcional “mas como fotografia”: Um gato dirigindo uma bicicleta, uma ilustração de Michael Sowa, mas como fotografia.
Agora, mesmo que não totalmente, quase alcançamos o fotorrealismo de nossa visão exigida:
- Criamos um conteúdo (gato de bicicleta)
- Nós o deixamos fantasiar sobre situações absurdas e irreais por meio de um truque de “ilustração”
- Trouxemos essa visão estranha de volta aos reinos “fotográficos” pelo modificador final.
Mas e o fotorrealismo? Sobre a emulação da Realidade?
A magia da lente
Os usuários do DALL-E trocam ideias, observações e experiências em nosso Discord. Uma das descobertas interessantes da comunidade DALL-E Discord foi a seguinte: se você adicionar especificações de lente como modificadores, obterá imagens especialmente “fotorrealistas”, típicas de sessões fotográficas com essas especificações.
Ou o conjunto de dados de treinamento para DALL-E foi muito bem rotulado ou até mesmo considerou metadados nos arquivos de imagem. Aqui estão exemplos de lentes (obrigado, Sharif).
Observação: devido às regras da OpenAI, não publicamos retratos humanos fotorrealistas. Mas podemos fazê-lo com animais e objetos.
Sigma 85 mm f/1.4 – boa para uma lente de retrato
- Um retrato de um cachorro em uma biblioteca, Sigma 85 mm f/1.4.
- Uma maçã mordida pendurada no galho de uma macieira, Sigma 85 mm f/1.4
- Um copo plástico na calçada de uma cidade grande, Sigma 85 mm f/1.4
É assim que o fotorrealismo se parece. Você pode literalmente ver cada pelo do pelo do cachorro. E o fundo da biblioteca é um lindo bokeh.
Sigma 85 mm f/8 – menos profundidade de campo e fundo mais nítido (menos bokeh)
- Um retrato de um cachorro em uma biblioteca, Sigma 85 mm f/8
- Uma maçã mordida pendurada no galho de uma macieira, Sigma 85 mm f/8
- Um copo plástico na calçada de uma cidade grande, Sigma 85 mm f/8
Observe como o fundo está brilhando através do copo de plástico translúcido.
Sigma 24 mm f/8 – ângulo mais amplo, distância focal menor
- Um retrato de um cachorro em uma biblioteca, Sigma 24 mm f/8
- Uma maçã mordida pendurada no galho de uma macieira, Sigma 24 mm f/8
- Um copo plástico na calçada de uma cidade grande, Sigma 24 mm f/8
Sigma 24 mm f/8, velocidade do obturador de 1/10 s – desfoque de movimento, velocidade do obturador mais lenta
Se você deseja capturar alguém em movimento, esta é a configuração certa.
- Cachorro correndo em uma biblioteca, Sigma 24 mm f/8, velocidade do obturador de 1/10 s
- Uma maçã mordida esvoaça ao vento forte no galho de uma macieira, em motion blur, Sigma 24 mm f/8, 1/10 seg.
- Um copo de plástico é levado pelo vento na calçada de uma cidade grande, Sigma 24 mm f/8, 1/10 seg.
Curiosamente, DALL-E hesitou em desfocar a maçã, então temos que adicionar explicitamente “in motion blur” para mais movimento. Provavelmente não havia muitas imagens desfocadas da maçã no conjunto de dados (uma vez que as classificamos anteriormente como “falha na foto”).
Velocidade do obturador Sigma 24 mm f/8 1/1000 seg – movimento, mas imagem nítida – com velocidade do obturador mais lenta
- Cão correndo em uma biblioteca, Sigma 24 mm f/8 1/1000 seg. obturador
- Uma maçã mordida, capturada no momento da queda, Sigma 24 mm f/8, obturador de 1/10 seg
- Copo plástico com líquido sendo capturado no momento em que é virado pelo vento na calçada de uma cidade grande, Sigma 24 mm f/8, obturador 1/1000 seg
Curiosamente, no caso da imagem do cachorro, aqui vemos um fenômeno de desintegração — a imagem é nítida, mas perde seu fotorrealismo.
Procurar os metadados de uma foto pode trazer mais ideias sobre como obter a qualidade desejada. Por exemplo, usando esta configuração arquitetônica, você pode recriar fotos de interiores convincentes:
Interior de um apartamento luminoso com estantes, quadros e janelas com vista para a megapolis, Nikon D810 | ISO 64 | distância focal 20 mm (Voigtländer 20 mm f3.5) | abertura f/9 | tempo de exposição 1/40 seg (DRI)
Encontrando as configurações certas
Usando coleções de fotos populares como Unsplash ou Flickr, você pode aprender mais sobre as configurações, pois os metadados estão sempre incluídos na descrição da imagem. Um exemplo é este foto maravilhosa do japonês Momiji .
De acordo com o Flickr, as seguintes configurações da câmera estavam em uso: Autumn Momiji, Nikon D810, ƒ/2.5, distância focal: 85,0 mm, tempo de exposição: 1/800, ISO: 200
Então, vamos tentar reproduzir o motivo e as configurações:
Ou vamos criar uma foto com pessoas dançando, como nesta foto . Pessoas dançando à noite, vistas de trás, pôr do sol, Canon EOS 1000D, ƒ/3.5, distância focal: 18,0 mm, tempo de exposição: 1/5, ISO 400, flash ligado.
trilhas leves
Se você deseja criar uma foto noturna de um carro com faixas de luz, precisa trabalhar com ISO: Um carro passa pelo fotógrafo à noite com luzes, visto de fora, 24 mm, f8, 1,6 s, ISO 1000.
Teleobjetiva? Mas é claro! Esta bela lua foto foi tirada com as seguintes configurações. Vamos tentar torná-lo mais interessante e adicionar um pássaro. Foto de uma lua com um pássaro voando em primeiro plano, Canon EOS Digital Rebel XTi, 100-300 mm Canon f/5.6, tempo de exposição: 1/160, ISO 400
Você pode experimentar infinitamente diferentes lentes, aberturas e valores ISO. O principal é a sua ideia e conceito de como e como deve ser.
luz de estúdio
Outro grande truque é usar o modificador Studio Light. Vamos apenas comparar o prompt “One apple” e o prompt “One apple, studio light”.
Todo objeto ridículo e chato (desculpe, Apple ) torna-se profundo e visualmente impressionante.
Suponho que, no conjunto de dados, havia tantas fotografias de estúdio que DALL-E sabe como criar uma imagem perfeita. Ainda estamos no começo. Como você pode ver, o DALL-E pode reproduzir imagens “fotorrealistas” de maneiras muito variadas e interessantes (no sentido de “realidade emulada”). Para mais atualizações sobre IA e arte, confira Merzmensch Kosmopol no Twitter .