Nvidia revela estratégia de metaverso e novas ferramentas de IA

A Nvidia revela novas tecnologias para o metaverso industrial e lança ferramentas para gráficos AI no SIGGRAPH.

SIGGRAFO (Special Interest Group on Computer Graphics and Interactive Techniques) é uma conferência anual sobre computação gráfica realizada desde 1974. No evento deste ano, nvidia O fundador e CEO da Jensen Huang mostra como a empresa planeja reunir IA, computação gráfica e o metaverso (industrial).

“A combinação de IA e computação gráfica dará força ao Metaverse, a próxima evolução da Internet”, disse Huang no início da apresentação da Nvidia.

A apresentação da Nvidia apresentou diferentes elementos deste projeto em quatro seções:

  • O novo Nvidia Omniverse Avatar Cloud Engine (ACE)
  • planos de expansão para o padrão Universal Scene Description (EUAD) para servir como a “linguagem do metaverso”,
  • melhorias abrangentes no Omniverse da Nvidia,
  • e ferramentas para gráficos AI.

Nvidia visa permitir que as empresas usem avatares digitais

O Omniverse Avatar Cloud Engine (ACE) da Nvidia inclui um conjunto de modelos de IA projetados para facilitar o desenvolvimento e a personalização de assistentes virtuais realistas ou humanos digitais. Isso inclui modelos para transformar o áudio em movimentos labiais ou tornar as emoções visíveis. Ele também inclui modelos de compreensão de fala, como o Megatron da Nvidia.

Ao mover esses modelos e serviços para a nuvem, a ACE oferece às empresas de todos os tamanhos acesso instantâneo ao enorme poder de computação necessário para desenvolver e implantar assistentes e avatares, disse a Nvidia. Os avatares podem entender vários idiomas, responder a comandos de voz, interagir com o ambiente e fazer recomendações inteligentes, graças aos modelos de IA.

Projetos como o Maxine da Nvidia já usavam o ACE. Espera-se que o Omniverse ACE esteja disponível na próxima primavera e seja executado em sistemas embarcados e em todos os principais serviços de nuvem.

Nvidia quer fazer da Universal Scene Description a linguagem do metaverso

Um metaverso precisa de uma forma padrão para descrever todo o conteúdo dentro dos mundos 3D, disse Rev Lebaredian, vice-presidente de Omniverse e tecnologia de simulação da Nvidia. A empresa considera a Universal Scene Description (EUAD) da Pixar a descrição de cena padrão para a próxima era da Internet, acrescentou Lebaredian. Ele comparou EUAD a HTML no 2D Web.

EUAD é uma estrutura de código aberto desenvolvida pela Pixar para troca de dados gráficos de computador 3D e é usada em muitos setores, como arquitetura, design, robótica e CAD.

Como resultado, a Nvidia disse que trabalhará com a Pixar, bem como com a Adobe, Autodesk, Siemens e várias outras empresas líderes, em uma estratégia plurianual para estender os recursos da EUAD além dos efeitos visuais. Por exemplo, espera-se que o EUAD suporte melhor os aplicativos metaversos industriais em arquitetura, engenharia, manufatura, computação científica, robótica e gêmeos digitais industriais.

“Nossos próximos marcos visam tornar o EUAD eficiente para mundos virtuais em grande escala e em tempo real e gêmeos digitais industriais”, diz Lebaredian. A Nvidia também planeja ajudar a desenvolver suporte para conjuntos de caracteres internacionais, coordenadas geoespaciais e streaming em tempo real de dados IoT.

Nvidia se concentra no Omniverse em rede

A empresa também exibiu inúmeras melhorias no Omniverse da Nvidia. Huang descreveu o Omniverse como “uma plataforma EUAD, um kit de ferramentas para criar aplicativos metaversos e um mecanismo de computação para executar mundos virtuais”. A nova versão inclui várias tecnologias principais atualizadas e mais conexões com ferramentas comuns.

Essas conexões, chamadas Omniverse Connectors, estão atualmente em desenvolvimento para Unity, Blender, Autodesk Alias, Siemens JT, SimScale, Open Geospatial Consortium e outros. Versões beta para PTC Creo, Visual Components e SideFX Houdini já estão disponíveis, disse ele. O Siemens Xcelerator também faz parte da rede Omniverse, disse ele, e espera-se que permita gêmeos digitais para mais clientes industriais.

O Omniverse também obtém recursos gráficos neurais desenvolvidos pela Nvidia. Isso inclui o Instant NeRF para criar rapidamente objetos e cenas 3D a partir de imagens 2D e GauGAN360. O Instant NeRF é uma evolução do GauGAN que gera panoramas de 8K e 360 ​​graus.

Uma extensão para o Modulus da Nvidia, uma estrutura de aprendizado de máquina, também permite que os desenvolvedores acelerem as simulações de física baseadas em IA em até 100.000 vezes, disse ele.

Quase uma dúzia de parceiros mostrará os recursos do Omniverse na SIGGRAPH, incluindo hardware, software e provedores de serviços em nuvem da AWS e Adobe para Dell, Epic e Microsoft. Em uma demonstração, a Industrial Light & Magic, por exemplo, mostrou como o Omniverse DeepSearch AI da empresa pesquisa enormes bancos de dados de ativos usando linguagem natural e obtém resultados mesmo quando os metadados do termo de pesquisa estão ausentes.

Nvidia oferece ferramentas para gráficos AI e melhora a simulação de efeitos visuais OpenVDB

Um dos principais pilares para o metaverso emergente são os gráficos neurais, disse a Nvidia. Em gráficos neurais (ou renderização neural), as redes neurais aceleram e melhoram os gráficos de computador.

“Gráficos neurais entrelaçam IA e gráficos, abrindo caminho para um futuro pipeline de gráficos passível de aprender com dados”, disse Sanja Fidler, vice-presidente de IA da Nvidia. “Os gráficos neurais redefinirão como os mundos virtuais são criados, simulados e experimentados pelos usuários.”

O Instant-NGP pode aprender imagens de gigaPixel, SDFs, NeRFs e volumes neurais em segundos. | Vídeo: Nvidia

A Nvidia está exibindo 16 trabalhos de pesquisa sobre o assunto no SIGGRAPH. Isso inclui o Instant NGP, uma ferramenta para vários aplicativos de renderização neural. Esta e outras ferramentas de IA já estão disponíveis no PyTorch Libary Kaolin Wisp para pesquisa de Campos Neurais.

A Nvidia também anunciou NeuralVDBGenericName , uma evolução do padrão OpenVDB de software livre. Na última década, o OpenVDB ganhou o Oscar como tecnologia principal usada na indústria de efeitos visuais, disse a Nvidia.

Desde então, expandiu-se além da indústria do entretenimento para casos de uso industrial e científico envolvendo dados volumétricos esparsos, como design industrial e robótica, afirmou.

No ano passado, a Nvidia já exibiu o NanoVDB, um suporte para GPUs que aceleram os cálculos muitas vezes. O NeuralVDB se baseia nesse trabalho, usando aprendizado de máquina para representações neurais compactas que reduzem os requisitos de memória em até 100 vezes. Isso, dizem eles, permite que eles interajam com conjuntos de dados extremamente grandes e complexos em tempo real.