A ferramenta de fotos ao vivo baseada em GPT da D-ID dá uma cara para ChatGPT e companhia

O estúdio criativo D-ID desenvolveu uma nova ferramenta de fotos ao vivo. Ele permite que os usuários criem apresentadores gerados por IA para marketing, conteúdo educacional e muito mais.

A ferramenta de fotos ao vivo combina a geração de texto conversacional do GPT-3, animação desenvolvida por Difusão estável e a escolha de um conjunto de vozes AI ou a capacidade dos usuários de fazer upload de seu próprio áudio.

O futuro do podcast?

A ferramenta da D-ID transforma potencialmente a maneira como criadores e empresas podem criar conteúdo, negando em teoria a necessidade de passar horas filmando e gravando. Os usuários podem simplesmente reaproveitar as fotos existentes de si mesmos com uma gravação de voz ou uma voz gerada por IA.

Os criadores que falam mal durante a gravação de um podcast ou esquecem de mencionar um tópico importante não precisam mais regravar, mas podem ter retratos ao vivo preenchendo os espaços em branco.

Na prática, os movimentos dos lábios e da cabeça em sujeitos da vida real ainda são um pouco chocantes e ainda é possível dizer que a imagem foi manipulada por um computador.

Vídeo: DID / Harry Verity

O sonho de um contador de histórias

A ferramenta de retrato ao vivo funciona muito melhor com seus próprios apresentadores gerados por IA. Também funciona com imagens AI geradas usando MidJourney e DALL-E dando aos artistas digitais a capacidade de animar seu trabalho e contar uma história.

Os usuários sem palavras também podem aproveitar a nova ferramenta de geração de texto do D-ID, desenvolvida por GPT-3 a mesma tecnologia que sustenta ChatGPT.

Outros casos de uso da ferramenta Live Portrait incluem chatbots automatizados apresentados por uma imagem animada de uma pessoa real, algo que a empresa capitalizou com sua outra ferramenta de chatbot Chat D-ID.

Histórias de família

A D-ID licenciou anteriormente seu software para o site de história da família My Heritage. Sua ferramenta Deep Nostalgia permite que genealogistas iniciantes carreguem fotos de seus ancestrais e os tragam de volta à vida.

De acordo com o My Heritage, isso já foi usado mais de 100 milhões de vezes. A próxima geração deles Ferramenta LiveStory permite que os usuários não apenas animem seus ancestrais, mas também que contem uma história sobre suas experiências.

Ética e Privacidade

Todas as ferramentas do D-ID impedem que os usuários façam upload de fotos de figuras da vida real para evitar o abuso de deepfakes. Tentei carregar uma fotografia do rei britânico George V e combiná-la com sua transmissão de rádio de Natal da vida real de 1935, sem sucesso. Parece que esta política se aplica até mesmo a figuras públicas, há muito falecidas.

Em sua declaração de ética, o D-ID também se compromete a não ‘licenciar conscientemente o uso de nossa plataforma para partidos políticos. Também não trabalharemos conscientemente com editores de pornografia ou organizações terroristas, armas ou fabricantes de armas.’

A D-ID foi fundada em 2017 pelos cientistas da computação israelenses Gil Perry, Sella Blondheim e Eliran Kuta e é apoiada por capitalistas de risco.