Sumário
O profissional de TI Kevin Hess usa motivos gerados por IA para ilustrar um clássico de ficção científica em centenas de páginas. Um projeto impressionante que confirma que os geradores de imagens de IA podem transformar mais pessoas em criadores de arte – embora Hess não se considere um artista.
Em 1937, o autor britânico Olaf Stapledon publicou sua novela de ficção científica “Star Maker”. O protagonista principal deixa seu corpo, podendo assim visitar o espaço sideral e outros planetas e fundir sua mente com a de outros seres.
O grupo de viajantes estelares torna-se cada vez maior, espalhando-se por todo o universo. O livro trata de questões filosóficas como a natureza da vida, nascimento, decadência e morte, bem como a relação entre a criação e o Criador.
Star Maker também é o livro favorito do profissional de TI Kevin Hess. Quando ele ouviu falar sobre geradores de imagens de IA como DALL-E ou meio da jornada teve a ideia de ilustrar a extensa novela e apresentá-la de forma mais contemporânea.
“Tenho tentado fazer com que as pessoas leiam este livro há cerca de quinze anos. Então, quando finalmente encontrei uma maneira de dar vida ao romance de uma maneira mais compatível com a maneira como as pessoas consomem mídia hoje em dia, mergulhei nele “, diz Hess.
O Star Maker evita os pontos fracos dos geradores de imagens AI
Uma fraqueza dos atuais geradores de imagens de IA é a falta de consistência: solicitações de imagens semelhantes podem levar a resultados muito diferentes. Isso dificulta o uso dos geradores para histórias coerentes.
Para a narrativa de Star Maker, Hess diz que isso não foi um problema: “Ao contrário da maioria da literatura, Star Maker é único porque quase não há personagens e os detalhes visuais exatos do que você está testemunhando não são exatamente importantes. (….) Portanto, as coisas em que a arte da IA não é boa – repetir personagens, bloqueio de cena, ação – não eram necessárias para o Star Maker.”
Hess usou o sistema de imagem Midjourney no modo padrão, o que já gerou o que ele pensou ser um estilo adequado para Star Maker. Dessa forma, ele não precisou desenvolver seus próprios prompts de imagem e também teve alguma consistência visual nas ilustrações.
Ocasionalmente, ele usava o Photoshop para aprimoramentos, especialmente nas cores para tornar as caixas de texto mais legíveis. Para o layout, ele usou Comic Life 3. Meia página da novela corresponde a cerca de três páginas de quadrinhos. Para cada passagem de texto a ser ilustrada, Hess usou até seis prompts de imagem. No total, ele estima, precisou de até 500 prompts de imagem.
A novela ilustrada finalizada é 706 páginas e foi criado em cerca de 100 horas, que é cerca de 8,5 minutos por página. Uma velocidade insana que só poderia ser alcançada graças à automação de IA.
Geradores de IA separam a ideia do ofício
De qualquer forma, o trabalho não teria sido possível sem geradores de imagens de IA, diz Hess. Isso ocorre em parte porque ele mesmo “não sabe desenhar”, diz. E mesmo que pudesse, uma história em quadrinhos nessa escala seria “o trabalho de uma vida inteira”, diz Hess.
No contexto da atual debates intensos sobre a impacto da IA nos artistas , Hess tira sua história em quadrinhos da linha de fogo, dizendo que nenhuma editora jamais teria investido neste projeto. A esse respeito, nunca teria havido um orçamento para artistas humanos cujo trabalho pudesse substituir a máquina. Do ponto de vista de Hess, a IA foi a única solução para criar este trabalho.
Hess, portanto, não se vê em competição com os artistas. Ele nem se considera um artista, por mais impressionante que seja seu trabalho. “É a máquina. Eu não me consideraria um artista”, diz Hess.
Kevin Hess’ história em quadrinhos de Star Maker será lançado em 20 de setembro em Amazon e Google Play.
Leia a entrevista completa com Kevin Hess
Você visualizou “Star Maker” de Olaf Stapledon com IA. Como você teve esta ideia?
Quando aprendo uma nova ferramenta, uma das primeiras coisas que começo a fazer é pensar em coisas únicas que posso fazer com ela – coisas que ninguém nunca pensou em fazer, ou pelo menos a maioria das pessoas nunca pensou. Afinal, não adianta fazer algo exatamente igual ao que todo mundo está fazendo.
Eu vi muitos escritores aprendendo e usando Midjourney/Stable Diffusion como um meio de escrever as histórias e quadrinhos originais que eles queriam criar, mas não tinham as habilidades artísticas para isso. Em outras palavras, eles tinham uma história para contar e, finalmente, os meios para contá-la. Essas provavelmente eram histórias sobre as quais os escritores estavam sentados há anos, por pessoas desesperadas para escrever algo. Eu não tinha nada disso.
Mas então percebi que esses artistas estavam usando a repentina onipresença da arte para criar histórias em quadrinhos especificamente. O mecanismo que a automação de IA acelerou foi o geração bruta de arte. Na minha opinião, quando se trata de criar arte baseada em histórias envolvendo seres humanos e ação, é uma melhoria modesta no melhor agora sobre os artistas tradicionais (e na maioria das vezes, transforma o trabalho criativo agradável em um ciclo frustrante de mexer com prompts, cortes, edição criativa e GPUs superaquecidas).
Então, enquanto os artistas de quadrinhos recém-formados estavam aprendendo a lidar com prompts para garimpar partículas utilizáveis de ouro digital entre a escória, percebi que os pontos fortes da geração de arte de IA – criação de arte rápida e inespecífica – eram perfeitos para o tipo de história Star Maker é.
Ao contrário da maioria da literatura, Star Maker é único porque quase não há personagens e os detalhes visuais exatos do que você está testemunhando não são exatamente importantes. Em um romance normal, o personagem principal pode pegar uma maleta ou se encontrar com um estranho, e você teria que tornar esse personagem visualmente consistente página a página e fazer com que a ação visual refletisse o roteiro do livro.
Ao contrário disso, a estética e o visual em Star Maker são secundários em relação à mensagem filosófica do livro. A aparência dos Outros Homens não é muito importante, mais ainda porque eles são uma civilização como a nossa, com suas próprias lutas e fracassos pessoais, e seu próprio fim. O mesmo com os Icthyoids, ou os Plant-Men, ou o Star Maker.
A escala do romance é tão inimaginavelmente grande que a arte serve tanto como pano de fundo visual e sensorial para a história quanto como ilustração tradicional. Todo o destino de dois bilhões de anos (história) de evolução humana, que se encaixam em seu outro romance marcante Last And First Men, é resumido em Star Maker em algo como meia página. Portanto, as coisas em que a arte da IA não é boa – personagens repetidos, bloqueio de cena, ação – não eram necessárias para o Star Maker.
Isso, e tenho tentado fazer com que as pessoas leiam este livro por cerca de quinze anos. Então, quando finalmente encontrei uma maneira de dar vida ao romance de uma maneira mais compatível com a maneira como as pessoas consomem mídia hoje em dia, mergulhei nele.
Quais ferramentas você usou principalmente – qual foi o seu fluxo de trabalho?
Para gerar a arte, usei Midjourney. Outra das felizes coincidências com este projeto foi que o estilo de arte ‘padrão’ do Midjourney – o que você obtém se começar a digitar palavras sem nenhuma direção – era perfeito para o Star Maker. Portanto, não precisei gastar tempo tentando desenvolver uma série de prompts exclusiva para manter os visuais semelhantes.
Eu fazia cerca de metade da página de um romance de cada vez, o que se traduzia em cerca de 3 páginas de quadrinhos completas. Depois de reler a parte e ter uma ideia do que eu queria fazer, coloquei uma fila de cerca de 5 a 6 prompts de imagem e deixei o Midjourney trabalhar nisso.
As letras e o layout foram feitos no Comic Life 3. Depois que o ponto de vista do narrador deixou a Terra, mudei principalmente para a arte de página inteira – principalmente porque a arte era tão bonita que parecia uma pena colocá-la em um painel. Enquanto Midjourney trabalhava em meus prompts, organizei os painéis de texto e separei os longos parágrafos em painéis legíveis.
Usei o Photoshop com moderação para pequenos retoques – um pouco de sombreamento ou queimadura aqui ou ali – mas principalmente para aprimorar a cor dos painéis de texto para melhorar a legibilidade. Painéis de texto em branco teriam consumido muito menos tempo, mas não achei que parecessem tão bons. Então foram mais algumas horas de trabalho irracional.
Quanto tempo você investiu por página?
Acho que diminuiu para cerca de 8,5 minutos por página no geral, de zero ao primeiro rascunho. A princípio, pretendia colocar apenas uma ilustração por página e, em seguida, uma página inteira em branco com texto, para criar uma graphic novel pseudo-ilustrada. Pouco depois de começar, percebi que o projeto deveria aproveitar a disposição de Midjourney de criar grandes quantidades de arte realmente bonita sob comando e, subsequentemente, dividi o texto muito mais em um formato de história em quadrinhos completo. Portanto, em virtude de criar muitas páginas e ter o Midjourney responsável pela maior parte do trabalho pesado, ele reduziu bastante o tempo médio.
Novamente, a maioria dos artistas não deve ter nada com que se preocupar no momento – essa taxa não será realista para cerca de 99,9% dos projetos.
Aproximadamente quantos prompts você precisou? Você tem alguma dica para alguém planejando um projeto semelhante?
Talvez 400-500?
Pontas? Não se engane – isso ainda vai dar muito mais trabalho do que parece. Isso é tudo o que posso dizer.
Você também poderia imaginar uma versão impressa além da versão do Google Play?
Não consigo imaginar quanto custaria para imprimir, mas cara, seria um livro de mesa de centro de ótima aparência. Se alguém puder fazer isso acontecer, me avise.
Você sabe desenhar – você poderia ter feito uma peça como esta sem IA?
Este seria um projeto de vida para qualquer um. Não, não sei desenhar de jeito nenhum.
As plataformas de primeira arte estão tirando imagens de IA offline. Você trabalha no setor de TI, então não é um artista ao que parece, pelo menos não de profissão. E, no entanto, você foi capaz de fazer esse projeto artístico acontecer. Pode-se dizer que o seu caso é exatamente o que artistas e designers treinados temem – a ideia conta mais do que a habilidade artística. Como você avalia isso?
Acho que há vários fatores interessantes em jogo aqui. Nesse caso particular, a quantidade de trabalho tirada dos artistas foi precisamente nula – não há como um projeto como esse receber sinal verde de alguém em qualquer indústria editorial, então nunca houve um orçamento lá em primeiro lugar.
Os projetos de muitas pessoas são assim. Usei o Midjourney para criar a arte da capa do próximo álbum da minha banda, mas nunca teria pago a um artista para fazer isso de uma forma ou de outra.
Você sente que esta é sua arte, seu trabalho – ou é a arte da máquina que você está usando?
É a máquina. Eu não me chamaria de artista.
Se você tivesse o orçamento, preferiria trabalhar com ilustradores humanos ou manter seu fluxo de trabalho? Seria ótimo se você justificasse sua resposta.
Depende do projeto. Para este projeto ou qualquer coisa com necessidades semelhantes – precisa de uma enorme quantidade de arte, detalhes não são tão importantes, etc. – eu definitivamente usaria arte de IA. Mas para necessidades como esta, a alternativa do artista seria olhar através de portfólios e escolher arte que pareça relativamente igual, ou oferecer detalhes de ‘exposição’ para artistas que já estão planejando criar alguma obra de arte por conta própria que seja semelhante às minhas necessidades de qualquer maneira . E, nesse caso, não é um negócio tão incrível para os artistas de qualquer maneira.
Se eu estivesse fazendo algo tradicional com um orçamento – uma história em quadrinhos normal com personagens e pontos específicos da trama para atingir e outras coisas – 100% eu preferiria trabalhar com artistas tradicionais. Posso inserir elementos de IA nos fluxos de trabalho para lidar com as coisas chatas – fundos de lugares sem importância, etc., mas artistas reais estariam envolvidos nas partes difíceis. Tenho certeza de que muitos artistas de produção com um prazo ficariam felizes em relegar as partes facilmente replicáveis do desenho para uma IA e terminar às 15h, em vez de fazer horas extras desenhando florestas indefinidas e coisas assim.
E não é esse o objetivo da automação de IA em primeiro lugar?