Ajuste fino com instruções: o Google Brain melhora modelos de linguagem grandes

Sumário

Ajuste fino com 1.836 tarefas de idioma
O ajuste fino com escalas de dados instrucionais fortemente no início

O Google Brain mostra que grandes modelos de linguagem se beneficiam do ajuste fino com dados instrucionais.

O chamado ajuste fino significa que grandes modelos de linguagem pré-treinados são treinados com dados adicionais, por exemplo, para especializá-los em cenários de aplicativos específicos. Um grupo de pesquisa do Google agora mostra que o ajuste fino com conjuntos de dados de instrução pode melhorar o desempenho de grandes modelos de linguagem para muitas tarefas.

Ajuste fino com 1.836 tarefas de idioma

o abordagem de ajuste fino com instruções em si não é nova . Em particular, a equipe do Google Brain testou o escalonamento do método e retreinou seus grandes modelos de linguagem Palma , U-PaLM e o modelo T5 de código aberto com um total de 1.836 instruções.

A maioria das tarefas vem do conjunto de dados Natural Instructions v2, que contém instruções para raciocínio lógico, por exemplo. De acordo com a equipe de pesquisa, o ajuste fino com exemplos de raciocínio em cadeia de pensamento também ajuda no senso comum.

Com cadeia de sugestões de pensamento , a IA é solicitada a resolver tarefas de linguagem passo a passo, documentando cada etapa. O treinamento com apenas nove conjuntos de dados CoT forneceu uma melhoria significativa nessa habilidade em comparação com os modelos FLAN anteriores. Além disso, o prompt é simplificado porque o modelo FLAN não requer um exemplo de CoT no prompt. O pedido de raciocínio passo a passo é suficiente.

Sumário

Ajuste fino com 1.836 tarefas de idioma

O ajuste fino com escalas de dados instrucionais fortemente no início

Artigos Relacionados