ChatGPT é “um marco na pesquisa de IA”

O Prof. Dr. Volker Tresp é professor de aprendizado de máquina na LMU em Munique, Alemanha, e líder do grupo de trabalho da German Learning Systems Platform. Ele vê o ChatGPT como um marco na pesquisa de IA.

ChatGPT move a multidão. O textbot é um dos chamados grandes modelos de linguagem que são celebrados como avanços na pesquisa de IA.

Esses modelos oferecem progresso real ou são apenas exageros? Como podem ser utilizados os assistentes linguísticos – e que condições precisamos na Europa para que as empresas e a sociedade possam beneficiar do progresso da IA?

O Prof. Dr. Volker Tresp, da Universidade Ludwig Maximilian, em Munique, responde a essas perguntas em uma entrevista. A pesquisa de Tresp se concentra em “Machine Learning in Information Networks” e ele é co-líder do grupo de trabalho “Technological Enablers and Data Science” da Learning Systems Platform.

O que são modelos de linguagem grande e o que os torna especiais?

Volker Tresp: Modelos de linguagem grandes são modelos de IA que usam métodos de aprendizado de máquina para analisar grandes quantidades de texto. Eles usam mais ou menos todo o conhecimento do mundo Webseus sites, mídias sociais, livros e artigos.

Isso permite que eles respondam a perguntas complexas, gerem texto e façam recomendações. Os sistemas de diálogo ou tradução são exemplos de grandes modelos de linguagem, mais recentemente, é claro, o ChatGPT.

Você poderia dizer que a Wikipedia ou o Google Assistant podem fazer muito do mesmo. Mas os novos modelos de linguagem lidam com o conhecimento de forma criativa, suas respostas se assemelham às de autores humanos e podem resolver diferentes tarefas de forma independente.

Eles podem ser estendidos para lidar com quantidades arbitrariamente grandes de dados e são muito mais flexíveis do que os modelos de linguagem anteriores. Modelos de linguagem em grande escala passaram da pesquisa para a prática em poucos anos e, claro, ainda existem deficiências nas quais as melhores mentes do mundo estão trabalhando.

Mas mesmo que os sistemas ocasionalmente dêem respostas erradas ou não consigam entender as perguntas corretamente, os sucessos técnicos alcançados são fenomenais. A pesquisa de IA atingiu um marco importante no caminho para a verdadeira inteligência artificial.

Mas sejamos claros: a tecnologia de que estamos falando não é uma visão de futuro, ela já está aqui. Qualquer pessoa pode usar esses assistentes de idiomas e chatbots por meio de um navegador da web. Os modelos de linguagem de hoje são verdadeiros divisores de águas. Nos próximos anos, eles mudarão significativamente a forma como a sociedade, a ciência e os negócios lidam com a informação e o conhecimento.

Quais aplicativos podem ser construídos com grandes modelos de linguagem – e quais são os requisitos?

Volker Tresp: Os modelos de linguagem podem ser usados ​​para uma variedade de aplicações. Eles podem melhorar os sistemas de informação e os mecanismos de busca. Para engenheiros de serviço, por exemplo, um modelo de linguagem pode analisar milhares de relatórios de erros e mensagens de problemas de casos anteriores.

Para os médicos, pode ajudar no diagnóstico e tratamento. Os modelos de linguagem pertencem à família dos modelos transformadores generativos, que podem gerar não apenas texto, mas também imagens ou vídeo. Modelos de transformadores criam códigos, controlam robôs e preveem estruturas moleculares em pesquisas biomédicas.

Em áreas sensíveis, é claro, sempre será necessário que os humanos revisem os resultados do modelo de linguagem e, finalmente, tomem uma decisão. As respostas dadas pelos modelos de linguagem nem sempre são corretas ou fora do tópico. Como isso pode ser melhorado? Como podemos integrar mais fontes de informação? Como podemos evitar que os modelos de linguagem incorporem vieses nos textos subjacentes em suas respostas?

São questões fundamentais que exigem muita pesquisa. Portanto, há muito trabalho a ser feito. Precisamos cultivar talentos em IA e criar cátedras e cargos de pesquisa para enfrentar esses desafios.

Além disso, se quisermos usar modelos de linguagem para aplicativos dentro e fora da Europa, precisamos de modelos linguísticos europeus que saibam lidar com os idiomas daqui, levando em consideração as necessidades de nossas empresas e os requisitos éticos de nossa sociedade. Atualmente, os modelos de linguagem são criados – e controlados – por gigantes da tecnologia americanos e chineses.

Os grandes modelos de linguagem beneficiam apenas grandes empresas?

Volker Tresp: Empresas de pequeno e médio porte também podem usar modelos de linguagem em seus aplicativos porque eles podem ser muito bem adaptados aos problemas individuais da empresa. Obviamente, empresas de médio porte também precisam de suporte técnico.

Os provedores de serviços, por outro lado, podem incorporar a personalização de modelos de linguagem em seu modelo de negócios. Não há limites para a criatividade das empresas quando se trata de desenvolver soluções.

Semelhante aos mecanismos de pesquisa, os casos de uso se multiplicarão como uma avalanche. No entanto, para garantir que as pequenas e médias empresas não enfrentem obstáculos financeiros, precisamos de grandes modelos de linguagem fundamental sob a liderança europeia que permitam acesso gratuito ou de baixo custo à tecnologia.