Assistente de IA do mundo real: o Google combina um grande modelo de linguagem com um robô comum

No projeto PaLM-SayCan, o Google está combinando a tecnologia de robótica atual com avanços em grandes modelos de linguagem.

Até agora, os avanços nos modelos de linguagem AI em larga escala chegaram principalmente em nossas vidas digitais, como tradução de texto, geração de texto e imagem, ou nos bastidores, quando plataformas de tecnologia usam IA de linguagem para moderar o conteúdo.

No projeto PaLM-SayCan, várias divisões do Google agora estão combinando o modelo de fala em larga escala mais avançado da empresa até hoje com um robô comum que um dia poderá ajudar em casa – um assistente para o mundo real. Mas isso ainda vai demorar.

Modelo de linguagem grande encontra robô cotidiano

Google revelou o modelo gigante de linguagem AI PaLM no início de abril, creditando ao modelo “capacidades inovadoras” na compreensão da linguagem e, especificamente, no raciocínio. PaLM significa “Pathways Language Model” – tornando-o um bloco de construção em A grande estratégia Pathways AI do Google para IA de próxima geração que podem lidar eficientemente com milhares ou milhões de tarefas.

O PaLM tem um entendimento de causa e efeito, então ele pode resolver tarefas de texto fáceis e até mesmo explicar piadas simples. O grupo alcançou esse novo nível de desempenho principalmente por meio de um treinamento de IA particularmente extenso: com 540 bilhões de parâmetros, o modelo é um dos maiores de seu tipo. Quanto maior o modelo, mais diversamente ele processa a linguagem, de acordo com os pesquisadores.

O Google tem pesquisado robôs em combinação com IA de forma mais intensa desde 2019. No final de 2021, a empresa revelou o robô doméstico que agora está sendo usado como parte do projeto PaLM SayCan. Ele percorre os escritórios do Google e pode, por exemplo, separar o lixo, limpar mesas, mover cadeiras e trazer itens. Ele se orienta com a ajuda da visão computacional e de um sistema de radar.

PaLM pode dividir e priorizar tarefas

Para a combinação de IA de fala e robôs do dia-a-dia, a equipe de pesquisa do Google conta principalmente com a “cadeia de sugestões de pensamento” do PaLM. Nesse processo, o modelo interpreta uma instrução, gera possíveis etapas para executar a instrução e avalia a probabilidade de concluir a tarefa geral por meio dessa ação. O robô executa a ação que é classificada como a mais alta pelo modelo de linguagem.

No dia a dia, as instruções para o robô poderiam ser redigidas de forma mais descontraída e as conversas seriam mais naturais: por exemplo, se você pedir um lanche energizante, o robô prefere trazer uma barra energética, mas em alternativa tem uma maçã, um açúcar artificial bebida com ácido aminossulfônico, ou uma limonada no cardápio.

Um robô do Google baseado em modelo de linguagem que um dia ajude nas tarefas diárias em nossas casas é um futuro possível. Segundo a equipe de pesquisa, no entanto, ainda há muitos problemas mecânicos e de inteligência a serem resolvidos antes disso.

O robô inteligente PaLM permanecerá, portanto, um projeto de teste no escritório do Google por enquanto. No entanto, a combinação de modelos de linguagem em larga escala e robótica tem “enorme potencial” para futuros robôs adaptados às necessidades humanas, escreve a equipe do projeto.

Google mostra mais cenários de demonstração no site oficial site para PaLM-SayCan .