Como ensinar matemática para um grande modelo de linguagem

Sumário

Raciocínio algorítmico via engenharia de prompt?
Prompting algorítmico em tempos de ChatGPT

A solicitação algorítmica ajuda modelos de linguagem grandes, como GPT-3, a resolver problemas matemáticos de maneira mais confiável.

Grandes modelos de linguagem como o GPT-3 são ruins em matemática – uma descoberta que atraiu muita atenção quando a OpenAI apresentou o modelo. Afinal, o fato de o GPT-3 poder adicionar alguns números foi surpreendente para alguns.

Desde então, os pesquisadores continuaram a desenvolver novos métodos para melhorar as capacidades matemáticas de grandes modelos de linguagem, por exemplo, com várias formas de engenharia imediata ou acesso a um interpretador Python externo .

Raciocínio algorítmico via engenharia de prompt?

Na engenharia de prompt, os pesquisadores experimentam diferentes padrões de entrada e medem seus efeitos na saída de modelos de linguagem. Sugestão de cadeia de pensamento por exemplo, mostra que solicitar uma abordagem passo a passo produz resultados significativamente melhores em algumas tarefas.

Mas, apesar desses avanços, os modelos de linguagem lutam para resolver tarefas algorítmicas simples. Um método de engenharia rápida desenvolvido por pesquisadores da Universite de Montreal e do Google Research, no entanto, aumenta significativamente o desempenho dos modelos em tarefas matemáticas.

A equipe formula entradas de prompt detalhadas que descrevem algoritmos para resolver problemas matemáticos, como para adição. O modelo de linguagem pode usar esse algoritmo como uma ferramenta para resolver problemas matemáticos semelhantes. Os pesquisadores avaliam sua abordagem em uma série de tarefas de raciocínio aritmético e quantitativo.

Por meio de sua abordagem de “prompting algorítmico”, os modelos de linguagem obtêm uma melhoria significativa de desempenho em comparação com outras estratégias de prompting: em particular, para paridade longa, adição, multiplicação e subtração, o método atinge uma redução de erro de até 10x e pode resolver tarefas com significativamente mais números do que outros prompts.

Os pesquisadores também mostram que os modelos de linguagem podem aprender várias habilidades, como adição e subtração, de forma acumulada, aplicar diferentes habilidades juntas e também usar as habilidades aprendidas como ferramentas em tarefas mais complexas.

1675285884 296 Como ensinar matematica para um grande modelo de linguagem

Sumário

Raciocínio algorítmico via engenharia de prompt?

Prompting algorítmico em tempos de ChatGPT

Artigos Relacionados