Meta quer que a IA aprenda e pense como humanos

O cientista-chefe de IA da Meta, Yann LeCun, revela os planos da Meta para uma IA que aprenderá e pensará como animais e humanos.

Em janeiro, o cientista-chefe de IA da Meta, Yann LeCun, conversou com o podcaster Lex Fridman sobre o estado atual da inteligência artificial e os três principais desafios no caminho para a próxima geração de IA . Os atuais sistemas de IA ainda estão muito atrás das habilidades cognitivas de, digamos, um gato, apesar de muitos bilhões de parâmetros, disse o vencedor do Prêmio Turing.

LeCun vê a razão dessa vantagem da inteligência biológica principalmente em sua compreensão altamente desenvolvida do mundo. Esse entendimento é baseado em representações abstratas do ambiente, o que dá a humanos e animais a capacidade de formar modelos que predizem ações e suas consequências. A capacidade de aprender tais modelos do ambiente é, portanto, fundamental para a próxima geração de IA.

LeCun desenvolve a arquitetura da IA ​​autônoma

Em uma postagem no blog, Meta agora apresenta novos detalhes sobre a visão de LeCun, incluindo um vislumbre de uma possível arquitetura de um “autônomo” inteligência artificial . Este percebe seu ambiente, planeja de acordo e executa ações.

A arquitetura é composta por seis módulos:

  • o módulo configurador configura os outros módulos para a tarefa desejada. Por exemplo, pode ajustar os parâmetros dos outros módulos.
  • o módulo de percepção processa os sinais do sensor e, portanto, deve avaliar o estado atual do mundo. Como apenas um subconjunto das informações disponíveis do sensor é relevante para determinadas tarefas, o módulo configurador deve adaptar o módulo de percepção de acordo para extrair as informações necessárias.
  • o módulo modelo mundial tem duas tarefas: deve fornecer informações sobre o estado do mundo que são necessárias para resolver a tarefa e que o módulo perceptivo não fornece e deve prever estados futuros plausíveis do mundo. Assim, o modelo mundial deve servir como uma espécie de simulador para as partes relevantes do mundo. É a parte mais complexa da arquitetura.
  • o módulo de custo calcula os custos que a IA enfrenta para certas ações planejadas, por exemplo, danos a um robô, consumo de energia ou violações de certas regras de comportamento. O objetivo da IA ​​é manter os custos o mais baixo possível. De acordo com LeCun, o módulo fornece os impulsos comportamentais básicos e as motivações intrínsecas.
  • o módulo ator calcula propostas de ações e busca uma sequência ótima que minimize os custos estimados. O resultado é uma sequência ideal de ações que realiza a tarefa e mantém os custos baixos.
  • o módulo de memória de curto prazo armazena o estado atual e previsto do mundo e os custos associados.

Cada módulo destina-se a ser compatível com o aprendizado baseado em gradiente – o método que permite o aprendizado profundo atual.

Modelo mundial através de abstrações de abstrações

No centro da arquitetura apresentada está o módulo de modelo mundial, que é projetado para prever o mundo com base nas informações do módulo de percepção. Para onde uma pessoa percebida está se movendo? Um carro vira – ou continua em frente?

No entanto, o mundo real é apenas parcialmente previsível. Cada situação pode assumir inúmeras formas, e muitos detalhes percebidos são irrelevantes para a tarefa em questão. Por exemplo, um carro autônomo não precisa saber para onde centenas de folhas de uma árvore estão se movendo, mas precisa saber para onde os carros ao redor estão se movendo.

O modelo de mundo deve, portanto, aprender representações abstratas do mundo que preservam detalhes importantes e ignoram detalhes sem importância. Em seguida, deve fornecer previsões no nível de abstração apropriado para a tarefa.

LeCun sugere que a chamada “Arquitetura preditiva de incorporação conjunta (JEPA)” pode ajudar a resolver esse desafio. O JEPA permite o aprendizado não supervisionado com grandes quantidades de dados complexos enquanto gera representações abstratas.

Em sua essência, o JEPA aprende as dependências entre duas entradas, x e y, como um videoclipe e imagens subsequentes. Novos métodos de aprendizagem combinados com JEPA permitem o treinamento com conjuntos de dados de alta dimensão, como vídeos, de acordo com a Meta.

Uma grande vantagem do JEPA é que o método permite que vários módulos sejam colocados em camadas uns sobre os outros, fazendo previsões em um nível mais alto de abstração com base na previsão de módulos de nível inferior. Por exemplo, o cenário “Um cozinheiro prepara crepes” pode ser descrito em vários níveis de abstração.

  • Em um alto nível de abstração, o cozinheiro mistura farinha, leite, ovos, coloca a massa na panela, deixa a massa fritar, vira e frita novamente.
  • Em um nível mais baixo, “colocar a massa na frigideira” significa que o cozinheiro pega um pouco da massa e espalha na frigideira.

Assim, as descrições abstratas podem ser divididas em níveis cada vez mais baixos, até movimentos precisos das mãos de milissegundos a milissegundos. Nesse nível baixo, o modelo mundial destina-se a fazer previsões de curto prazo, enquanto em níveis mais altos de abstração ele faz previsões de longo prazo.

Modelo mundial deve aproximar IA da inteligência humana

Se a estrutura hierárquica do JEPA permitir um modelo mundial suficientemente abrangente, isso pode ajudar um agente de IA a planejar ações complexas hierarquicamente, dividindo tarefas complexas em subtarefas menos complexas e abstratas. No nível mais baixo, essas ações poderiam controlar os efetores de um robô, por exemplo.

A visão de alto nível de LeCun deixa muitas perguntas sem resposta, como detalhes sobre a arquitetura e o método de treinamento do modelo mundial. Meta, portanto, também descreve o treinamento do modelo mundial como o desafio essencial para o progresso real na pesquisa de IA nas próximas décadas. Outros aspectos da arquitetura também precisam ser definidos com mais precisão, diz Meta.

Desenvolver máquinas que aprendam e compreendam tão eficientemente quanto os humanos é um esforço científico de longo prazo sem garantia de sucesso, de acordo com Meta. No entanto, a pesquisa básica apresentada aqui continuará a levar a uma compreensão mais profunda da mente e da máquina e aos avanços da IA ​​que beneficiarão a inteligência artificial e, por sua vez, a humanidade.

Leia mais sobre Inteligência Artificial:

  • Chega de barreiras linguísticas: Meta quer realizar “o sonho da humanidade
  • Deepmind: AI para melhorar a fusão nuclear
  • Inteligência artificial para pilotar caças americanos em 2024