Líder de Stable Diffusion prevê um Holodeck de código aberto

Atualmente, Stable Diffusion é apenas um poderoso gerador de imagem AI. Planos de longo prazo vão muito além disso.

IA generativa tem sido claramente em ascensão ultimamente : De texto para imagem para texto para vídeo HD ou texto para 3D – Os sistemas de IA podem criar cada vez mais formatos de mídia, alguns deles totalmente automatizados. Novos modelos aparecem quase toda semana e estão sendo constantemente aprimorados.

Além disso, as ferramentas generativas de IA estão tornando cada vez mais fácil digitalizar o mundo real. Relativamente aplicativos simples para PCs e smartphones usam a tecnologia NeRF para gerar uma cena 3D volumétrica a partir de fotos individuais de um objeto ou sala.

Com base nas tendências atuais, pode-se argumentar que inteligência artificial generativa será uma driver poderoso para aumentar a digitalização. Pode aumentar significativamente a quantidade e a qualidade do conteúdo digital. A ferramenta definitiva seria um modelo único para a criação de muitos tipos de mídia que podem ser manuseados por profissionais e não profissionais usando linguagem natural.

O líder da Stable Diffusion acredita que um Holodeck gerado por IA é viável em alguns anos

Os comentários feitos por Emad Mostaque, CEO da Stability AI, em um Reddit AMA devem ser vistos no contexto da tese acima. Stability AI é a startup por trás da AI Stable Diffusion de imagem de código aberto mencionada no início deste artigo.

Mostaque cita uma experiência semelhante à Oasis do filme de ficção científica VR Ready Player One ou o famoso Holodeck de Star Trek como a meta para os modelos de IA generativos da empresa.

Esse sistema de IA deve continuar sendo de código aberto para que qualquer pessoa possa “criar tudo o que imaginar”. Isso, disse ele, requer “multimodalidade total” em modelos de IA, ou seja, sistemas de IA generativos que são treinados com muitos conteúdos e formatos de dados.

Mostaque diz que a Stabililty AI já está em negociações com estúdios de jogos e outras empresas que têm acesso a dados 3D para captura de dados. “Sim, faremos algo como o Holodeck em alguns anos”, diz Mostaque quando questionado sobre IA generativa para VR e jogos.

O CEO da Midjourney, David Holz, expressou pensamentos semelhantes não muito tempo atrás. Ele espera Jogos de vídeo em tempo real gerados por IA surgir em dez anos. Recentemente, um desenvolvedor deu uma amostra de como Difusão estável pode ser implementada em mundos de realidade virtual .

Mostaque sugere melhores modelos e possível solução de direitos autorais para Stable Diffusion

Num futuro próximo, a Mostaque anunciou melhorias mais significativas para a Stable Diffusion. A Stability AI está atualmente treinando modelos com bilhões de parâmetros, que serão otimizados.

“Você pode pensar nisso como volume e corte enquanto os otimizamos. Pessoalmente, espero que os modelos funcionem no limite no futuro, muito acima da qualidade MJ v4 ou DALLE 2. O futuro será daqui a um ou dois anos”, diz Mostaque.

O CEO também aborda as críticas ao modelo atual, que usa dados protegidos por direitos autorais para treinamento de IA. Isso permite gerar imagens no estilo de artistas renomados, se seus nomes forem incluídos no prompt. Funciona da mesma forma com os concorrentes DALL-E 2 e Midjourney.

“Estamos trabalhando em conjuntos de dados totalmente licenciados, além de mecanismos de exclusão para o desenvolvimento de modelos futuros que fazemos e apoiamos. Faremos alguns anúncios sobre isso em breve. Deve-se notar que é improvável que esses modelos ‘amadureçam’ para o próximo ano, portanto, serão atualizados regularmente”, diz Mostaque.

De acordo com Mostaque, a Stability AI também está em discussões com governos sobre conjuntos de dados e modelos de código aberto e está trabalhando em iniciativas internacionais de educação em IA.