Sumário
O SayCan do Google controla robôs por meio de um grande modelo de linguagem. O desenvolvedor da IBM, James Weaver, agora está aplicando essa abordagem a personagens não-jogadores no jogo sandbox Roblox.
Grandes modelos de linguagem, como OpenAI’s GPT-3 ou PaLM do Google pode traduzir e completar textos, conduzir diálogos ou gerar código. Embora longe de todas as habilidades emergentes dos modelos foram explorados, os pesquisadores de IA já estão combinando-os com módulos externos para acessando Python com simuladores de física, e usando-os em CICERO para jogos de diplomacia ou para monólogo interior em robôs .
A divisão de IA do Google combinou a tecnologia robótica atual com PaLM no verão de 2022. Em PaLM-SayCan um modelo de linguagem converte entrada de texto de usuários em instruções de robô, permitindo perguntas de acompanhamento e promovendo um comportamento de robô mais flexível.
SayCan do Google usa um modelo de linguagem para maior flexibilidade do robô
SayCan do Google usa cadeia de pensamento instigante para gerar etapas potenciais para a execução de uma instrução e, em seguida, avalia sua probabilidade de sucesso. O robô executa a cadeia de ações que o modelo de linguagem atribui a maior probabilidade de sucesso.
A vantagem aqui é que o robô aceita instruções em linguagem natural. Se alguém pedir um lanche rico em energia, o robô dará preferencialmente a essa pessoa uma barra energética. Se não estiver disponível, o robô reconhecerá uma maçã ou uma bebida açucarada como uma alternativa adequada.
A demonstração do Roblox é o SayCan do Google para NPCs
O desenvolvedor da IBM, James Weaver, agora mostra em uma demonstração do Roblox como o conceito por trás do SayCan pode ser usado para NPCs mais flexíveis. Weaver usa GPT-3 para sua implementação, então quem quiser testar a demonstração deve ter uma chave de API OpenAI pronta.
Na caixa de areia, os jogadores podem usar uma janela de bate-papo para dar instruções a um NPC, como: “Coloque os chips de arroz na tigela e coloque o chá na mesa.
Todos os objetos na demonstração são caixas simples ou mesas redondas, nomeadas de acordo com sua função. O NPC segue os nomes dos objetos e executa os comandos. Para isso, o GPT-3 converte os comandos de linguagem natural em comandos de robô em segundo plano, por exemplo, em
find(arroz chips), pick(arroz chips), find(tigela), put(arroz chips), find(chá), pick(chá), find(mesa), put(chá), done() .
A demonstração está disponível no Site Roblox . Você pode encontrar informações adicionais em GitHub de Weaver .