Startup Adept mostra controle universal de software AI via entrada de texto

Adept está trabalhando no controle de linguagem universal para software de computador. O objetivo: um dia, controlaremos os computadores apenas pela linguagem.

Em abril de 2022, o Adept AI Labs se apresentou ao público global pela primeira vez: a startup é financiada com cerca de 65 milhões de dólares americanos e conta com vários ex-pesquisadores da Deepmind, Meta e Google em sua equipe, que trabalham juntos desde cerca de Dezembro de 2021. See More

Co-fundador da Adept Ashish Vaswani foi o principal autor do trabalho de pesquisa sobre o Transformer, uma rede neural com um mecanismo de atenção especial que lançou as bases para muitos avanços na linguística computacional nos últimos anos.

O objetivo da Adept é desenvolver um assistente de IA que trabalhe com e para humanos em computadores e aprenda por meio de feedback humano. O processamento de linguagem natural servirá como uma interface para um dia operar qualquer software imaginável por meio de palavras, diz a startup.

“Acreditamos que o enquadramento mais claro de inteligência geral é um sistema que pode fazer qualquer coisa que um humano pode fazer na frente de um computador”, escreve a equipe. A próxima era da computação seria definida pela entrada de linguagem direta em vez de executar tarefas manualmente.

ACT-1: Transformador universal para software controlado por linguagem

Agora, a startup está exibindo a primeira demonstração: a Adept anuncia com confiança o modelo de AI baseado em Transformer ACT-1 como a “próxima fronteira de modelos que podem realizar ações no mundo digital”.

Para uma demonstração, o Adept treinou o ACT-1 para operar um navegador tradicional usando entrada de texto. O modelo é integrado através de um Chrome extensão. O vídeo abaixo mostra como ele navega em um site imobiliário com base em um prompt de texto para encontrar uma casa para uma família de quatro pessoas em Houston com um orçamento de até 600.000.

Em outras demonstrações, o Adept mostra como o modelo de IA opera o Salesforce na Web e o Excel ou pesquisa de forma autônoma a Wikipedia para responder às perguntas dos usuários. O modelo também pode ações de link em sites e programas: Por exemplo, a IA procura uma geladeira abaixo de 1.000 no Craigslist e entra em contato com o vendedor via Gmail.

Uma das características mais interessantes do ACT-1 é que o sistema pode aprender e melhorar ações com base no feedback humano. Apenas este mecanismo lhe dá a flexibilidade necessária para ser um assistente digital útil para muitas tarefas.

O vídeo a seguir mostra como o ACT-1 cria uma nova coluna no Excel quando solicitado pelo usuário, mas a coluna contém um erro. Por meio da entrada de texto, o usuário fornece uma dica sobre a função de coluna correta. A AI pega a alteração do texto e corrige a função da coluna.

Vídeo: adepto

De acordo com o Adept, essas demos apenas arranham a superfície dos recursos de um Action Transformer. A startup diz que está “fazendo um grande progresso para que o Adept seja capaz de fazer coisas arbitrárias em um computador”.

Fale com seu computador como se nunca tivesse existido um mouse

Adept prevê que “em alguns anos” a maioria das interações de computador será por meio de linguagem natural, em vez de interfaces gráficas de usuário.

“Diremos ao nosso computador o que fazer e ele fará”, escreve a startup. Os métodos de entrada de hoje pareceriam desatualizados em comparação.

A interface baseada em linguagem também permitiria que muito mais pessoas usassem o software de forma mais eficaz sem ter que passar por treinamento primeiro. A documentação e as instruções seriam processadas por modelos de IA em vez de humanos. As eficiências resultantes podem acelerar o progresso humano em todas as áreas, acredita Adept.