Sumário
O DALL-E 2 da OpenAI mostra como a criatividade da IA pode ser impressionante – se você souber como controlá-la. Um breve tour pelo DALL-E 2.
Já tenho acesso ao DALL-E 2 há quase duas semanas e pude testar extensivamente a inteligência artificial. Minha conclusão provisória: o DALL-E 2 da OpenAI é atualmente o melhor sistema de IA disponível para geração e edição de imagens.
Com DALL-E 2 você pode criar fotos, ilustrações, pinturas ou arte 3D com uma simples entrada de texto. A qualidade das imagens muitas vezes se aproxima ou é até comparável à dos profissionais. Alternativas como Midjourney estão em alta, mas ainda não atingem a qualidade do DALL-E 2.
A seguir, gostaria de fornecer uma breve visão sobre as funções do DALL-E 2 e do alta arte do design imediato.
OpenAI DALL-E 2 pode criar, editar ou modificar imagens
A interface do usuário do DALL-E 2 é o mais simples possível: você pode inserir seu comando de texto, chamado “prompt”, por meio de um campo de entrada e enviá-lo ao sistema AI clicando em “Gerar”. Após um curto tempo de espera, o DALL-E 2 produz quatro imagens.
Abaixo do campo de entrada, você pode alternativamente fazer upload de sua própria foto – desde que não mostre uma pessoa real. A partir de imagens carregadas e recém-criadas, o DALL-E 2 pode gerar variantes. Isso torna relativamente fácil criar imagens inspiradas em temas existentes que podem ser posteriormente editados. Desta forma, o sistema AI pode ser controlado com ainda mais precisão.
Além disso, a função de edição pode ser usada para marcar uma área na imagem, que pode ser alterada pelo DALL-E 2. Para isso, o resultado desejado deve ser simplesmente descrito novamente por meio de prompt de texto.
O DALL-E 2 gera três variantes do original contendo as alterações correspondentes. Aqui eu adicionei um bigode chique à estátua.
OpenAI DALL-E 2 e o design do prompt
Como já fica claro no exemplo do antigo busto do pioneiro grego VR, DALL-E 2 pode ser controlado com detalhes surpreendentes via entrada de texto. A OpenAI treinou o sistema de IA com mais de 650 milhões de imagens – portanto, o DALL-E 2 viu e pode reproduzir vários assuntos, estilos, exposições e outras propriedades de imagem.
Usando o chamado design imediato – o design da descrição de texto apropriada – DALL-E 2 pode, por exemplo, gerar imagens fotorrealistas com diferentes especificações de lentes para simular pequenas distâncias focais ou desfoque de movimento.
Com as descrições certas, você também pode capturar humores, definir estruturas ou proporções, reproduzir estilos como steampunk ou cyberpunk, determinar ângulos de câmera e exposição ou usar o design de séries de TV ou filmes como modelo.
Vários estilos de ilustração podem ser imitados pelo DALL-E 2, bem como arte 3D ou pinturas históricas. Essa capacidade de imitar estilos também é demonstrada pelo DALL-E 2 para vários estilos artísticos, artistas individuais ou obras específicas.
Se você deseja capturar o estilo de uma determinada obra de arte ou artista, também pode usar a ajuda da IA: no chamado desagregação os primeiros usuários do DALL-E-2 perguntam ao texto AI GPT-3 para descrever as características e o estilo de uma pintura. A resposta abrangente de IA pode então ser usada para design imediato.
Além de bustos antigos, o DALL-E 2 também pode criar outros objetos – de bordados a estátuas, corpos, bichos de pelúcia, arquitetura ou cadeiras de design, está tudo lá.
DALL-E 2: Edição de imagem externa, design de prompt e função de edição
Com a função de edição já introduzida, detalhes na imagem podem ser alterados, como adicionar um bigode, substituir objetos ou todo o plano de fundo.
Como as imagens geradas também podem ser baixadas, um programa externo de edição de imagens pode ser usado para aproveitar ainda mais o DALL-E 2. Na versão mais simples, nosso busto do filósofo grego pode ser reduzido em tamanho e usado como base para uma nova imagem.
As pinturas podem ser adicionadas usando o mesmo método. DALL-E 2 pode dar um corpo a Mona Lisa e nosso filósofo grego de VR recebe companhia.
Se você repetir esse processo com frequência, poderá diminuir o zoom cada vez mais – alguns artistas já criam jornadas impressionantes pelos mundos DALL-E 2 ou murais gigantes.
mundos dentro de mundos #aiart #dalle2 #aianimation #animação #dalle #zoominfinito #ciclo #fantasia #scifi pic.twitter.com/LB8eo2GZof
– Michael Carychao (@MichaelCarychao) 22 de maio de 2022
Inpainting com DALL-E 2 é super divertido. Com alguma engenhosidade, você pode criar obras de arte arbitrariamente grandes, como os murais mostrados abaixo – que presumo serem os maiores #dalle-produzido imagens criadas até agora. pic.twitter.com/DDQUMSmgYq
– David Schnurr (@_dschnurr) 19 de abril de 2022
Ao combinar processamento de imagem externo, design de prompt inteligente e a função de edição do DALL-E 2, muitas outras aplicações são possíveis.
Se você quiser cavar mais fundo, você deve verificar o DALL-E 2 Prompt Book de Guy Parsons . Isso fornece uma visão geral abrangente de muitos dos designs de prompt descobertos até agora e métodos adicionais para aproveitar ao máximo o DALL-E 2.
Nas próximas semanas, cerca de um milhão de pessoas devem ter acesso ao DALL-E 2. A OpenAI anunciou isso recentemente, juntamente com preços para DALL-E 2 quando entrou na fase beta.