Sumário
O MOSS ainda não está nem perto do nível do ChatGPT, mas é aí que os pesquisadores chineses querem que o chatbot chinês esteja um dia. Lançá-lo como código aberto pode ajudar.
ChatGPT é atualmente a referência no espaço AI chatbot, embora esteja longe de ser perfeitoe os seus integração com o motor de busca Bing da Microsoft foi recebido com tanto entusiasmo e irritação.
Os criadores do chatbot de IA chinês comparam o MOSS ao seu homólogo americano. Como o ChatGPT, o MOSS é capaz de responder perguntas, gerar ou resumir código ou texto. Além disso, o MOSS detectaria alegações falsas e rejeitaria solicitações inapropriadas.
Alta demanda no ChatGPT chinês causa interrupção do serviço
Ao contrário do ChatGPT, cujo código é mantido em sigilo, os cientistas chineses da Universidade Fudan, em Xangai, planejam desenvolver o MOSS em um ambiente de código aberto a partir do final de março.
“Modelos de linguagem em grande escala são quase monopolizados por países estrangeiros. Eles apenas desenvolvem APIs ou não as abrem para nós”, disse Qiu a Diário da China. “Esperamos compartilhar MOSS e códigos de modelo e experiência de desenvolvimento com todos, e esperamos que a China possa estar na vanguarda do mundo em termos de modelos de linguagem em larga escala.”
Em um esforço para melhorar o modelo de linguagem por meio de feedback humano, pesquisadores abriram o acesso ao MOSS em 20 de fevereiro. Assim como no ChatGPT, a infraestrutura técnica não conseguiu atender a demanda e ficou offline.
MOSS fala inglês melhor do que chinês
Capturas de tela no site oficial dão uma impressão do desempenho. Devido aos dados de treinamento usados (“significativamente menos parâmetros que o ChatGPT”), o MOSS ainda não conhece nenhum idioma além do inglês. O próximo passo na lista de tarefas dos pesquisadores seria melhorar o chatbot em chinês.
Embora o MOSS tenha adquirido alguns recursos do ChatGPT, sabemos que muitas limitações permanecem e o MOSS ainda está muito atrás do ChatGPT devido à falta de dados de alta qualidade, recursos de computação e capacidade do modelo.
Tianxiang Sun e Xipeng Qiu
Difusão estável mostrou como modelos de IA de código aberto podem impulsionar o desenvolvimento para geração de imagens – meio da jornada e o DALL-E 2 não pode ser treinado com dados personalizados e personalizados para casos de uso individuais. No entanto, as duas alternativas comerciais oferecem melhores resultados imediatos.