Deepfakes: como tudo começou – e onde isso pode nos levar

Imagens e vídeos falsificados por IA – os chamados deepfakes – desenvolveram-se rapidamente nos últimos anos. Aqui, traçamos a história e descrevemos os marcos mais importantes.

O que todas as pessoas na imagem da capa têm em comum? Eles não existem. Uma IA surgiu com eles. Mais precisamente, ele os gerou usando milhões de estruturas de Pixel semelhantes como exemplos.

Eu criei as imagens no site estapessoanãoexiste.com . Qualquer um que pode clicar com um mouse pode fazê-lo. Também funciona para gatos.

Esses falsos retratos realistas são possíveis graças à invenção das chamadas “Redes Geradoras Adversariais” (GAN). Essas redes consistem em dois agentes de IA: um forja uma imagem e o outro tenta detectar a falsificação. Se o agente descobrir a falsificação, a IA do falsificador se adapta e melhora.

Dessa forma, ambos os agentes tornam-se cada vez mais eficientes em suas respectivas disciplinas ao longo do treinamento. E, as imagens geradas tornam-se mais credíveis.

Nem toda GAN é criada igual

Na prática, há uma grande diferença entre os resultados do GAN original e os das variantes atuais do GAN.

Uma postagem no Twitter de Ian Goodfellow, recentemente chefe de IA da Apple , mostra o desenvolvimento ao longo dos últimos anos. Goodfellow é considerado o inventor do primeiro processo GAN.

Uma breve história do GAN

Uma olhada nos trabalhos acadêmicos vinculados por Goodfellow deixa claro como novas arquiteturas de IA combinadas com conjuntos de dados maiores e computadores mais rápidos levaram ao rápido desenvolvimento dos chamados deepfakes:

2014: O nascimento da tecnologia deepfake.

Goodfellow publica um papel científico com colegas que apresenta um GAN pela primeira vez. É o nascimento dos GAN AIs e a base técnica dos deepfakes que discutimos intensamente hoje.

2015: GANs estão melhorando

Os pesquisadores são combinando GANs com redes neurais convolucionais multicamadas (CNNs) otimizadas para reconhecimento de imagem, que podem processar muitos dados em paralelo e funcionar particularmente bem em placas de vídeo. Eles substituem redes mais simples que anteriormente conduziam agentes GAN. Os resultados estão a tornar-se mais credíveis.

2016: óculos deepfake e manipulação facial.

Pesquisadores combinar duas GANs : os agentes das diferentes redes compartilham informações entre si. Desta forma, eles aprendem em paralelo.

Cada agente modifica levemente os dados aprendidos. Por exemplo, é possível gerar uma pessoa com e sem óculos de sol. Os retratos falsos tornam-se novamente mais credíveis, mas ainda são claramente reconhecíveis como falsificações.

GAN acoplado 2016

2017: salto de qualidade da Nvidia e os primeiros vídeos deepfake.

Os pesquisadores da Nvidia alcançam um grande salto de qualidade ao resolver um grande problema dos GANs anteriores:

Os agentes geradores geralmente produziam imagens de baixa resolução porque eram mais difíceis para o agente examinador detectar como falsificações – mais Pixels significa potencialmente mais fontes de erro. Portanto, faz sentido para a IA do falsificador evitar altas resoluções para passar pelo agente examinador.

Solução da Nvidia: treinamento da rede em etapas. Primeiro, a IA do falsificador aprende a criar imagens de baixa resolução. Em seguida, a resolução aumenta gradualmente.

GAN progressiva 1

O GAN, que vem crescendo passo a passo neste caminho, produz falsos retratos de qualidade inédita: As imagens ainda têm falhas, mas com certeza podem enganar quem não olha muito de perto.

GAN progressiva 2

Enquanto a Nvidia ainda está melhorando seus próprios GANs, o usuário do Reddit “deepfakes” está levando a tecnologia para o mainstream: no outono de 2017, apareceu o primeiro pornô deepfake com o nome dele, no qual os rostos de atrizes pornô eram trocados pelos de mulheres proeminentes.

O problema da pornografia

Desde então, o termo deepfake se tornou sinônimo de imagens e vídeos gerados por IA. O “deep” refere-se às redes neurais construídas em muitas camadas (deep learning) que ajudam a gerar as imagens.

A pornografia deepfake ainda é facilmente reconhecida como falsa, mas o esforço de produção é tão baixo que milhares de usuários migram para o Reddit e outras plataformas online em pouco tempo para criar vídeos explícitos. A conhecida atriz norte-americana Scarlett Johansson, cujo rosto foi frequentemente mal utilizado para pornografia de IA, mais tarde se referiu à Internet como um “buraco de minhoca escuro” neste contexto.

2018: Mais controle de GAN e canais deepfake no YouTube.

Mais uma vez, os pesquisadores da Nvidia conseguem controlando deles GAN melhor : eles podem segmentar recursos de imagem individuais, por exemplo, “cabelo escuro” e “sorriso” em retratos.

Dessa forma, as características das imagens de treinamento podem ser especificamente transferidas para imagens geradas por IA. A chamada transferência de estilo (veja o vídeo abaixo) se tornará um componente importante de muitos projetos de IA subsequentes.

Transferência GAN

Obviamente, o princípio GAN não funciona apenas para retratos: a IA não se importa com o tipo de estrutura de Pixel que produz. Ele só precisa de dados de treinamento correspondentes. No final de 2018, a irmã AI do Google mente profunda por exemplo, mostra alimentos, paisagens e animais gerados por IA que parecem incrivelmente verossímeis.

O software Deep Video Portrait melhora a manipulação de vídeo usando GANs, e os primeiros canais do YouTube especializados em deepfakes estão surgindo: não é mais apenas pornografia que está sendo falsificada, mas todos os tipos de vídeos, por exemplo, de políticos ou grandes filmes de Hollywood. Pela primeira vez, está sendo discutido que os processos de IA poderiam ressuscitar digitalmente atores que já morreram.

E a pornografia deepfake está indo por água abaixo: no primeiro trimestre de 2018, Pornhub, Twitter, Gfycat e Reddit baniram a pornografia falsa de suas plataformas. O site do tão usado aplicativo Deepfake fica offline.

2019: Deepfake chega ao mainstream

Pesquisadores da Samsung apresentam um GAN que pode falsificar seres humanos e obras de arte. Por exemplo, os pesquisadores colocaram um sorriso animado no rosto da Mona Lisa. A deepfake AI da Samsung precisa de apenas algumas fotos para obter resultados respeitáveis.

Alguns meses depois, pesquisadores israelenses apresentam o Face Swapping GAN (FSGAN), uma IA que troca rostos em vídeo ao vivo em tempo real. A nova IA aprendeu a trocar qualquer rosto diretamente sem treinamento prévio individual. No entanto, ainda não atinge a qualidade de deepfakes elaboradamente treinados.

Longe dos avanços técnicos, 2019 é o ano em que os deepfakes finalmente atingiram o mainstream. Ferramentas deepfake como DeepFaceLab, lançadas pela primeira vez em 2018, estão acelerando a produção de deepfake. Os canais do YouTube especializados em deepfakes estão alcançando milhões de espectadores e o número de deepfakes na web está dobrando nos primeiros meses. Deepfakes estão se desenvolvendo mais rápido do que o esperado, de acordo com o especialista em deepfake Hao Li, que prevê: “Deepfakes serão perfeitos em dois a três anos”.

Os formuladores de políticas intervêm

A rápida disseminação de vídeos falsos preocupa os formuladores de políticas dos EUA à luz das próximas eleições de 2020 nos EUA. Membros do Congresso dos EUA, do Comitê de Inteligência dos EUA e especialistas jurídicos e de IA estão alertando sobre um excesso de deepfake e pedindo regulamentações. O Twitter é a primeira plataforma social a revelar novas medidas contra deepfakes: o Twitter quer sinalizar tweets suspeitos e mostrar avisos aos usuários.

Políticos fora dos EUA também se posicionam. A China torna as falsificações de IA uma ofensa punível. O governo alemão emite uma declaração sobre a tecnologia dizendo que “Deepfakes podem enfraquecer a confiança da sociedade na autenticidade fundamental de gravações de áudio e vídeo e, portanto, a credibilidade das informações disponíveis publicamente”. Eles poderiam, portanto, representar um “grande risco para a sociedade e a política”. No entanto, o risco também não deve ser exagerado.

2020: regulamentação de deepfake e deepfakes de megaPixels da Disney

O Facebook anuncia no início do ano da campanha eleitoral de 2020 nos EUA que banirá deepfakes em sua própria plataforma – com exceção de deepfakes satíricos ou paródicos. O YouTube segue o exemplo com diretrizes semelhantes e o Twitter começa a aplicar suas regras anti-deepfake introduzidas no ano anterior. Em agosto, o TikTok também baniu deepfakes de sua própria plataforma de vídeo.

Google irmã quebra-cabeça lança o “Assembler”, uma ferramenta com inteligência artificial para jornalistas para ajudá-los a detectar deepfakes. A Qualcomm oferece suporte a uma startup que marca irrevogavelmente fotos e vídeos originais como originais na criação, simplificando assim a identificação de deepfake posteriormente.

Deepfakes continuam a melhorar

Enquanto isso, o desenvolvimento de deepfakes cada vez melhores continua: Microsoft apresenta o FaceShifter , uma IA que gera deepfakes confiáveis ​​mesmo a partir de rostos originais desfocados. O FaceShifter depende de duas redes. Um cria o rosto falso e faz pose de cabeça, expressão facial, iluminação, cor, fundo e outros atributos da foto original para o falso. A segunda rede HEAR-Net compara a foto gerada pela primeira rede com a foto original.

Se o HEAR-Net encontrar partes do rosto obscurecidas por cabelos, óculos de sol ou escrita, por exemplo, ele melhora possíveis erros da primeira rede. Os rostos desaparecem novamente atrás do cabelo, as letras podem ser decifradas e a maquiagem fica onde deve estar.

1675161098 263 Deepfakes como tudo comecou – e onde isso pode nos

Os deepfakes da Disney

A gigante do entretenimento Disney começa a desenvolver deepfakes para a tela grande, revelando o primeiro deepfake de megaPixel: um completo 1.024 por 1.024 Pixels no tamanho. No momento do lançamento da patente da Disney, alternativas como o DeepFaceLab gerenciavam apenas 256 por 256 Pixels e, mesmo no início de 2021, a resolução máxima do DeepFaceLab 2.0 é de 448 por 448 Pixels.

A tecnologia Deepfake da Disney poderia, a longo prazo, substituir os métodos de efeitos especiais tradicionalmente usados, que geralmente exigem meses de trabalho para apenas alguns segundos de filmagem.

Os fãs da Disney ainda estão esperando pelo primeiro uso do megaPixel deepfake – a recente aparição de um personagem lendário de Star Wars em The Mandalorian ainda teve que passar sem a tecnologia. Uma oportunidade perdida: os deepfakes do YouTube da mesma cena se saíram melhor do que os artistas CGI da Disney.

2021: Cruzeiro deepfake, transmissões ao vivo e aluguel de rostos

O ano começa com um deepfake particularmente crível de Tom Cruise. O Deepfaker “Deeptomcruise” carrega vídeos no Tik-Tok que só são reconhecíveis como falsos se você olhar de perto. Os vídeos virais trazem ao canal centenas de milhares de seguidores e a atenção do verdadeiro Tom Cruise – que cria um canal verificado no Tik-Tok. Por trás do Deeptomcruise está o especialista em efeitos visuais Chris Umé, que diz ter trabalhado em cada vídeo por várias semanas.

Logo após as falsificações do Cruise, o aplicativo Wombo AI conquista a web: Com apenas alguns cliques, a foto de qualquer pessoa pode ser transformada em um pequeno videoclipe no qual ela executa músicas conhecidas. A inteligência artificial do Wombo AI é baseada em gravações de vídeo de artistas reais cantando uma das músicas com expressões faciais correspondentes. O Wombo AI, treinado com os dados do vídeo, transfere essas animações para cada foto em que reconhece um rosto.

A Disney contrata um conhecido YouTuber Deepfake, alimentando rumores de que poderia haver mais personagens Deepfake no futuro, digamos, Star Wars. Aliás, a série Boba Fett lançada no final de 2021 confirma essas especulações.

Deepfakes nas mídias sociais e de massa

Longe da Disney, o rosto de Bruce Willis aparece em um comercial russo e uma start-up compra os direitos de licenciamento de rostos reais para usá-los em vídeos de marketing usando tecnologia deepfake. A Nvidia lança o Alias-Free GAN em 2021, uma versão aprimorada do StlyeGAN2 que permite resultados mais consistentes para mudanças de perspectiva. Alguns meses depois, uma versão otimizada é lançada sob o nome de StyleGAN3.

O criador do DeepFaceLab também exibirá o DeepFaceLive pela primeira vez em 2021. O programa pode trocar rostos em vídeos ao vivo após treinamento apropriado ou com modelos de IA pré-treinados fornecidos. Para a troca ao vivo, ele precisa de uma placa gráfica rápida como as encontradas nos PCs de jogos atuais.

Um jovem se torna uma semelhança com Margot Robbie por meio de deepfake ao vivo. | Vídeo: Github

Em 2021, os chamados modelos de difusão também alcançarão a qualidade de imagem dos GANs anteriormente invictos pela primeira vez. A tecnologia ainda não foi usada para deepfakes. Mas, ele forma a base para a ferramenta de geração de imagens GLIDE da OpenAI, lançada no final de 2021.

2022: GANs 3D, DALL-E 2 e um deepfake Selensky

Janeiro traz duas melhorias impressionantes de GAN. Pesquisadores de IA da Universidade de Tel Aviv demonstram uma variante do StyleGAN2 que pode manipular rostos em videoclipes curtos, como adicionar um sorriso ou afunilar um personagem, sem treinamento adicional em vídeo.

Vídeo: Tzaban et al

Pesquisadores da Nvidia e Stanford demonstram o método Efficient Geometry-aware 3D Generative Adversarial Networks (EG3D). Essa abordagem pode gerar consistentemente imagens de uma pessoa (ou gato) de diferentes pontos de vista e uma reconstrução 3D correspondente.

Por outro lado, o 3D GAN também pode gerar uma reconstrução 3D a partir de uma única imagem de uma pessoa real. O EG3D pode, portanto, gerar falsificações muito mais críveis, já que as pessoas geradas também parecem consistentes de diferentes ângulos.

Em 2022, pesquisadores do Stanford Internet Observatory encontram mais de 1.000 perfis falsos suspeitos no Linkedin em um estudo de duas semanas. Mais de 70 empresas identificadas listaram os perfis falsos como funcionários e os usaram principalmente para o contato inicial de potenciais novos clientes. Se o contato inicial for bem-sucedido, o cliente é direcionado a uma pessoa real que faz referência ao perfil falso no decorrer da conversa.

Um deepfake possivelmente histórico aparece na guerra de agressão contra a Ucrânia. No vídeo, um versão falsa do presidente ucraniano Volodymyr Selensky exorta seu povo a depor as armas. Porém, apesar da baixa resolução do vídeo, o falso é fácil de reconhecer e não surte efeito. Se é realmente um deepfake, ou seja, um vídeo falsificado com tecnologia AI, não foi definitivamente provado. Muitos meios de comunicação e numerosos especialistas assumem que sim.

Em abril de 2022, OpenAI presentes DALL-E 2 , um sistema de IA que gera imagens a partir de descrições de texto. O programa está previsto para ser lançado no verão de 2022.

O DALL-E 2 e os modelos de difusão subjacentes não são usados ​​para deepfakes pela OpenAI. A organização proíbe a geração de rostos humanos. No entanto, a tecnologia permitirá imagens sintéticas ainda melhores no futuro.

A década falsa da IA ​​e como lidar com deepfakes

Quando o inventor da GAN, Goodfellow, apresentou seu trabalho em 2014, ele provavelmente não previu o rápido desenvolvimento de imagens falsificadas por IA. Hoje, de qualquer forma, ele alerta: No futuro, as pessoas não devem mais acreditar em imagens e vídeos na internet como algo natural.

Deepfakes, que não são mais reconhecíveis como tal, mesmo por algoritmos anti-deepfake, podem finalmente mudar as regras do jogo – tanto socialmente quanto no entretenimento. O especialista em deepfake, Hao Li, acredita que esse desenvolvimento é possível, já que as imagens nada mais são do que Pixels com cores adequadas – uma cópia perfeita é apenas uma questão de tempo.

Além disso, os deepfakes estão se tornando comuns devido à sua rápida disseminação no YouTube e por meio de aplicativos como Reface ou Impressions. A humanidade viveu no passado sem vídeos e fotos para informar e formar opiniões, disse Goodfellow: “Nesse caso, é mais como se a IA estivesse fechando algumas das portas que nossa geração costumava abrir”.

Leia mais sobre deepfakes:

  • AI Graphics: Desenhe o corpo dos seus sonhos com um controle deslizante
  • Teste deepfake: você consegue detectar deepfakes de IA?
  • LiveStory: ferramenta de IA permite que falecidos contem histórias