Sumário
O OpenChatKit é a Stable Diffusion de modelos de chat? Ainda não, mas provavelmente não vai demorar.
A comunidade de código aberto Together lançou a primeira alternativa de código aberto ao ChatGPT, o OpenChatKit. O chatbot é baseado no modelo de linguagem GPT-NeoX de 20 bilhões de parâmetros da EleutherAI e foi ajustado com 43 milhões de instruções para uso de bate-papo. No benchmark HELM padrão do setor, o modelo de bate-papo supera o modelo básico.
O OpenChatKit vem com um kit de ferramentas
Além do modelo de linguagem especializada GPT-NeoXT-Chat-Base-20B, o kit, que está disponível gratuitamente para desenvolvedores em GitHub sob a licença Apache 2.0, inclui os seguintes componentes:
-
Receitas de personalização para ajustar o modelo para obter alta precisão em suas tarefas.
-
Um sistema de recuperação extensível que permite aumentar as respostas do bot com informações de um repositório de documentos, API ou outra fonte de informações atualizada ao vivo no momento da inferência.
-
Um modelo de moderação, ajustado a partir do GPT-JT-6B, projetado para filtrar a quais perguntas o bot responde.
Ferramentas para que os usuários forneçam feedback sobre as respostas do chatbot e adicionem novos conjuntos de dados também estão integradas.
O OpenChatKit tem apenas recursos limitados
Os desenvolvedores dizem que os pontos fortes do OpenChatKit estão em tarefas como resumir e responder perguntas com contexto, extrair informações e classificar texto.
No entanto, é menos convincente quando se trata de perguntas sem contexto, codificação e escrita criativa – todas as tarefas que ajudaram o ChatGPT a se tornar tão popular – embora O chatbot da OpenAI também alucina regularmente. O OpenChatKit também luta para mudar de assunto no meio de uma conversa e às vezes repete as respostas.
O OpenChatKit teve um desempenho muito melhor depois de ser ajustado para casos de uso específicos. A Together está trabalhando em seus próprios chatbots para aprendizado, aconselhamento financeiro e solicitações de suporte.
No teste curto, o OpenChatKit não foi tão eloquente quanto o ChatGPT, em parte porque as respostas são limitadas a 256 tokens em vez de cerca de 500. As respostas são muito mais curtas, mas o OpenChatKit gera respostas muito mais rapidamente. Alternar entre idiomas não parece causar problemas ao bot. A formatação como uma lista ou tabela também é possível.
O Together também conta com o feedback do usuário para melhorar ainda mais o OpenChatKit.
O treinamento descentralizado de modelos de IA é o futuro?
Seja qual for o resultado, o processo de treinamento é provavelmente o futuro dos projetos de código aberto em larga escala: GPT-JTos desenvolvedores do OpenChatKit adotaram uma abordagem descentralizada, distribuindo o poder de computação necessário de um centro de dados central para muitos computadores.
Embora o OpenChatKit seja o primeiro produto no mundo de código aberto a emular o ChatGPT, certamente não será o único. Com Modelos LLaMa da Meta vazou no início deste mês – o maior dos quais tem três vezes mais parâmetros que o GPT-NeoX-20B – deve ser apenas uma questão de tempo até vermos um chatbot baseado nele.
Você pode experimentar o OpenChatKit para grátis no Hugging Face.