OpenAI DALL-E 2 Prompt Guide: Como controlar a geração de imagens

O DALL-E 2 da OpenAI mostra como a criatividade da IA ​​pode ser impressionante – se você souber como controlá-la. Um breve tour pelo DALL-E 2.

Já tenho acesso ao DALL-E 2 há quase duas semanas e pude testar extensivamente a inteligência artificial. Minha conclusão provisória: o DALL-E 2 da OpenAI é atualmente o melhor sistema de IA disponível para geração e edição de imagens.

Com DALL-E 2 você pode criar fotos, ilustrações, pinturas ou arte 3D com uma simples entrada de texto. A qualidade das imagens muitas vezes se aproxima ou é até comparável à dos profissionais. Alternativas como Midjourney estão em alta, mas ainda não atingem a qualidade do DALL-E 2.

A seguir, gostaria de fornecer uma breve visão sobre as funções do DALL-E 2 e do alta arte do design imediato.

OpenAI DALL-E 2 pode criar, editar ou modificar imagens

A interface do usuário do DALL-E 2 é o mais simples possível: você pode inserir seu comando de texto, chamado “prompt”, por meio de um campo de entrada e enviá-lo ao sistema AI clicando em “Gerar”. Após um curto tempo de espera, o DALL-E 2 produz quatro imagens.

Abaixo do campo de entrada, você pode alternativamente fazer upload de sua própria foto – desde que não mostre uma pessoa real. A partir de imagens carregadas e recém-criadas, o DALL-E 2 pode gerar variantes. Isso torna relativamente fácil criar imagens inspiradas em temas existentes que podem ser posteriormente editados. Desta forma, o sistema AI pode ser controlado com ainda mais precisão.

1675135160 470 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

Além disso, a função de edição pode ser usada para marcar uma área na imagem, que pode ser alterada pelo DALL-E 2. Para isso, o resultado desejado deve ser simplesmente descrito novamente por meio de prompt de texto.

1675135161 801 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

O DALL-E 2 gera três variantes do original contendo as alterações correspondentes. Aqui eu adicionei um bigode chique à estátua.

1675135162 494 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

OpenAI DALL-E 2 e o design do prompt

Como já fica claro no exemplo do antigo busto do pioneiro grego VR, DALL-E 2 pode ser controlado com detalhes surpreendentes via entrada de texto. A OpenAI treinou o sistema de IA com mais de 650 milhões de imagens – portanto, o DALL-E 2 viu e pode reproduzir vários assuntos, estilos, exposições e outras propriedades de imagem.

Usando o chamado design imediato – o design da descrição de texto apropriada – DALL-E 2 pode, por exemplo, gerar imagens fotorrealistas com diferentes especificações de lentes para simular pequenas distâncias focais ou desfoque de movimento.

1675135163 553 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

Com as descrições certas, você também pode capturar humores, definir estruturas ou proporções, reproduzir estilos como steampunk ou cyberpunk, determinar ângulos de câmera e exposição ou usar o design de séries de TV ou filmes como modelo.

Vários estilos de ilustração podem ser imitados pelo DALL-E 2, bem como arte 3D ou pinturas históricas. Essa capacidade de imitar estilos também é demonstrada pelo DALL-E 2 para vários estilos artísticos, artistas individuais ou obras específicas.

1675135163 696 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de
1675135164 934 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

Se você deseja capturar o estilo de uma determinada obra de arte ou artista, também pode usar a ajuda da IA: no chamado desagregação os primeiros usuários do DALL-E-2 perguntam ao texto AI GPT-3 para descrever as características e o estilo de uma pintura. A resposta abrangente de IA pode então ser usada para design imediato.

Além de bustos antigos, o DALL-E 2 também pode criar outros objetos – de bordados a estátuas, corpos, bichos de pelúcia, arquitetura ou cadeiras de design, está tudo lá.

1675135165 515 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

DALL-E 2: Edição de imagem externa, design de prompt e função de edição

Com a função de edição já introduzida, detalhes na imagem podem ser alterados, como adicionar um bigode, substituir objetos ou todo o plano de fundo.

Como as imagens geradas também podem ser baixadas, um programa externo de edição de imagens pode ser usado para aproveitar ainda mais o DALL-E 2. Na versão mais simples, nosso busto do filósofo grego pode ser reduzido em tamanho e usado como base para uma nova imagem.

1675135166 293 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

As pinturas podem ser adicionadas usando o mesmo método. DALL-E 2 pode dar um corpo a Mona Lisa e nosso filósofo grego de VR recebe companhia.

1675135166 844 OpenAI DALL E 2 Prompt Guide Como controlar a geracao de

Se você repetir esse processo com frequência, poderá diminuir o zoom cada vez mais – alguns artistas já criam jornadas impressionantes pelos mundos DALL-E 2 ou murais gigantes.

Ao combinar processamento de imagem externo, design de prompt inteligente e a função de edição do DALL-E 2, muitas outras aplicações são possíveis.

Se você quiser cavar mais fundo, você deve verificar o DALL-E 2 Prompt Book de Guy Parsons . Isso fornece uma visão geral abrangente de muitos dos designs de prompt descobertos até agora e métodos adicionais para aproveitar ao máximo o DALL-E 2.

Nas próximas semanas, cerca de um milhão de pessoas devem ter acesso ao DALL-E 2. A OpenAI anunciou isso recentemente, juntamente com preços para DALL-E 2 quando entrou na fase beta.