O treinamento em vídeo para a mão do robô permite que ele aprenda os movimentos humanos

Os pesquisadores demonstram o VideoDex, um método de aprendizado de robôs que pode aprender com vídeos da Internet sobre interações humanas.

Entre os principais objetivos da pesquisa robótica estão os robôs que podem realizar diversas tarefas de forma autônoma em diversos ambientes. Para atingir esse objetivo, muitos métodos de desenvolvimento usam interações bem-sucedidas de robôs como dados de treinamento.

No entanto, esses dados são raros porque o uso de robôs não treinados no mundo real geralmente requer supervisão constante.

Para o aprendizado de robôs, este é um problema do ovo e da galinha: para ganhar experiência de forma confiável, o robô já deve ter experiência, escrevem os pesquisadores da Carnegie Mellon University (CMU) em um novo artigo.

Uma solução poderia ser treinar em uma simulação. No entanto, existem inúmeros problemas na transferência da experiência de simulação para o mundo real.

VideoDex aprende com as interações humanas

A equipe da CMU propõe uma abordagem alternativa: Aprender com vídeos da Internet nos quais as pessoas interagem no mundo real.

“Esses dados podem potencialmente ajudar a iniciar o aprendizado do robô, evitando o ciclo de treinamento de coleta de dados”, diz o artigo.

Exemplos de vídeo do conjunto de dados Epic Kitchens | Vídeo: Shaw, Bahl et al., Epic Kitchens

A ideia de treinar robôs com vídeos não é nova. Mas a maioria dos treinamentos em vídeo destina-se a ensinar representações visuais de robôs, o que significa que eles servem como uma fonte de pré-treinamento visual.

Isso, eles argumentam, tem vantagens, mas negligencia um desafio fundamental no treinamento de robôs: dominar os espaços de ação muito grandes.

Embora as representações visuais pré-treinamento possam auxiliar na eficiência, acreditamos que grande parte da ineficiência decorre de espaços de ação muito grandes. Para controle contínuo, aprender isso é exponencial no número de ações e etapas de tempo, e ainda mais difícil para robôs com alto grau de liberdade

do papel

É por isso que, além dos aspectos visuais, a equipe do CMU também utiliza vídeos de treinamento para transmitir informações sobre padrões de movimento humano. Para treinar seu sistema “VideoDex”, eles usam vídeos de interações na cozinha filmados de uma perspectiva em primeira pessoa.

VideoDex demonstra destreza

Para permitir que o VideoDex aprenda com os vídeos, a equipe usa algoritmos que rastreiam a mão, o pulso e a posição da câmera no espaço. Os movimentos das mãos são mapeados para a mão robótica de 16 DOF, e os movimentos do pulso e as posições da câmera são mapeados para os movimentos do braço robótico.

Além dessas informações de movimento, o VideoDex usa representações visuais aprendidas e políticas dinâmicas neurais aprendidas que melhoram o controle do robô. Equipado assim, o sistema de IA aprende com centenas ou milhares de vídeos de interações humanas específicas, como pegar, abrir ou cobrir itens.

Após o treinamento, o VideoDex precisa apenas de alguns exemplos do mundo real para superar muitos dos métodos de aprendizado de robôs de última geração em sete diferentes interações do mundo real. Esses exemplos podem ser previamente demonstrados ao braço robótico via controle remoto humano.

Vídeo: Shaw, Bahl et al.

Mais exemplos de seu trabalho estão disponíveis no página do projeto VideoDex . O código será publicado lá em breve.