Revisão do ChatGPT: a IA de texto da OpenAI venceu nossa equipe editorial?

Resumimos nossos artigos para nossos leitores em pontos curtos. Mas como nos comparamos a uma IA?

Quando projetamos O DECODER, nossa equipe decidiu oferecer aos nossos leitores os principais pontos de nossos artigos como um breve resumo. Antes de lançar o site, também testamos como grandes modelos de linguagem como o GPT-3 da OpenAI poderiam fazer o trabalho. Nosso resultado: os resumos de IA estavam corretos, mas faltavam pontos importantes no texto.

Mas a OpenAI continuou a melhorar os modelos GPT com feedback humano nos últimos meses. Os modelos GPT-3.5, como o OpenAI os chama, que estão disponíveis desde o início de 2022, também formam a base para o teste ao vivo do ChatGPT.

No entanto, o modelo também processou dados de diálogo de humanos para treinamento, OpenAI contratou treinadores de IA, que escreveram seu texto e o de um assistente de IA. Esses treinadores de IA tiveram acesso a sugestões que os ajudaram a escrever as respostas.

O ChatGPT escreve resumos melhores do que nós?

O ChatGPT tem atraído muita atenção desde o seu lançamento, como mostramos em nosso artigo sobre algumas das melhores demos do ChatGPT . Parte dessas demonstrações são resumos impressionantes criados pelo ChatGPT. Ferramentas de IA como Bearly.AI ou SumUp trazem esse recurso a apenas um clique de distância para qualquer navegador.

Portanto, é hora de dar outra chance aos resumos de IA. Aqui estão cinco resumos de nossos artigos e o que o ChatGPT faz com o mesmo texto. Para todos os exemplos, o prompt “Resuma o texto em alguns marcadores” foi colocado na frente do artigo e a primeira saída foi usada.

O “Dramatron” da Deepmind pode escrever roteiros de cinema e teatro

Resumo O DECODIFICADOR

  • O Dramatron da Deepmind usa um método de solicitação especial para extrair histórias consistentes de grandes modelos de linguagem.
  • Isso permite que o sistema crie roteiros inteiros e roteiros de teatro.
  • Os testadores humanos veem o Dramatron como uma ferramenta criativa útil.

Resumo ChatGPT

  • A Deepmind desenvolveu um sistema chamado Dramatron que é capaz de gerar roteiros e roteiros coerentes para teatro e cinema
  • O sistema, que é baseado em um breve resumo de uma história chamado log line, usa um método chamado “prompt chaining” para gerar uma lista de personagens, enredo, localizações e diálogos consistentes com o log line.
  • O Dramatron consiste em cinco prompts codificados que se complementam para criar a saída final
  • O sistema foi desenvolvido a partir de um grande modelo de linguagem treinado com 70 bilhões de parâmetros e foi avaliado por 15 profissionais das indústrias de teatro e cinema
  • Os profissionais, em sua maioria, tiveram reações positivas à saída do sistema, mas também houve críticas, incluindo o risco de plágio e o impacto na indústria criativa.

O treinamento em vídeo para a mão do robô permite que ele aprenda os movimentos humanos

Resumo O DECODIFICADOR

  • Os robôs geralmente aprendem as interações do mundo real a partir de dados de amostra dessas mesmas interações. Mas estes são difíceis de encontrar.
  • Com o VideoDex, pesquisadores da Carnegie Mellon University mostram como um robô pode aprender com as interações humanas a partir de vídeos da Internet.
  • O sistema de IA aprende os movimentos humanos, além das representações visuais usuais. Em benchmarks, ele tem um desempenho melhor do que os métodos anteriores.

Resumo ChatGPT

  • Pesquisadores da Carnegie Mellon University desenvolveram o VideoDex, um método para ensinar robôs por meio de vídeos da internet de interações humanas
  • O VideoDex usa algoritmos para rastrear a mão, o pulso e a posição da câmera no espaço e mapeia esses movimentos para uma mão robótica de 16 DOF e um braço robótico
  • Além das representações visuais, o VideoDex usa políticas dinâmicas neurais aprendidas para melhorar o controle do robô
  • Após o treinamento, o VideoDex pode superar os métodos de aprendizado de robôs de última geração em interações do mundo real com apenas alguns exemplos demonstrados por controle remoto humano

A solicitação multimodal é a chave para uma melhor IA generativa

Resumo O DECODIFICADOR

  • Os atuais modelos de IA generativa geram novas imagens baseadas principalmente em texto.
  • A empresa alemã de IA Aleph Alpha está agora introduzindo uma técnica de solicitação de entrada multimodal para geração de imagem de IA.
  • O novo modelo, M-Vader, pode gerar uma nova imagem com base em várias imagens e textos que fazem referência uns aos outros. Os modelos de imagem AI tornam-se assim controláveis ​​com mais precisão.

Resumo ChatGPT

  • Aleph Alpha desenvolveu uma nova técnica para modelos de imagem generativos chamados prompts multimodais
  • O modelo M-VADER pode processar entradas multimodais, como fotos, esboços e descrições textuais para gerar novas ideias de imagens
  • O M-VADER usa um decodificador multimodal chamado S-MAGMA para guiar o processo de geração de imagens usando modelos pré-treinados
  • O M-VADER pode gerar imagens com base no contexto multimodal, mesclar duas imagens ou criar variações de uma imagem
  • A tecnologia se tornará parte da oferta Luminous da Aleph Alpha e é uma inovação mundial na geração de imagens multimodais.

Nvidia entra no setor financeiro com uma parceria de IA de vários anos com o Deutsche Bank

Resumo O DECODIFICADOR

  • A Nvidia e o Deutsche Bank formam uma parceria de IA de vários anos para melhorar os serviços financeiros com IA.
  • As empresas focarão inicialmente em avatares inteligentes, grandes modelos de linguagem para textos financeiros e detecção de fraudes.

Resumo ChatGPT

  • O Deutsche Bank e a Nvidia anunciaram uma parceria de vários anos para melhorar os serviços financeiros usando inteligência artificial (IA)
  • As duas empresas trabalham juntas há 18 meses e estão desenvolvendo uma variedade de aplicativos de IA, incluindo avatares inteligentes e grandes modelos de linguagem para gerenciamento de riscos e detecção de fraudes
  • A parceria também beneficiará a transformação da nuvem do Deutsche Bank e permitirá que o banco extraia dados úteis de informações não estruturadas
  • O Deutsche Bank também está usando o software Nvidia AI Enterprise e está desenvolvendo um avatar virtual 3D usando o Nvidia Omniverse para melhorar seus sistemas internos e a experiência do cliente
  • O CEO da Nvidia, Jensen Huang, disse que a parceria “reimaginará a maneira como os serviços financeiros são operados e entregues”.

ChatGPT é um chatbot GPT-3 da OpenAI que você pode testar agora

Resumo O DECODIFICADOR

  • ChatGPT é um modelo de bate-papo da OpenAI baseado no GPT 3.5 e refinado com diálogos.
  • Agora está disponível gratuitamente online como uma versão de demonstração. A demonstração não é senciente.
  • A OpenAI espera obter insights do feedback do usuário que possam ser usados ​​no desenvolvimento de futuros modelos de linguagem.

Resumo ChatGPT

  • A OpenAI lançou o ChatGPT, um chatbot treinado com feedback humano
  • O ChatGPT destina-se a ajudar a OpenAI a desenvolver melhores sistemas de IA por meio do feedback do usuário
  • O chatbot foi treinado usando aprendizado por reforço com feedback humano (RLHF), o que resultou em textos mais bem avaliados por humanos e reduz o discurso de ódio e a desinformação
  • O ChatGPT foi treinado em dados de diálogo coletados de humanos que escreveram os dois lados de um diálogo, o seu próprio e o do assistente de IA
  • O chatbot tem limitações, incluindo a geração de respostas plausíveis, mas incorretas e sem sentido, reagindo fortemente a pequenas mudanças nas solicitações e sendo muito prolixo, repetitivo e tendencioso para respostas mais detalhadas
  • O ChatGPT está disponível gratuitamente com uma conta OpenAI e é uma “demonstração inicial do que é possível”, de acordo com o cofundador Sam Altman

Resumos do ChatGPT: engenharia de prompt para “principais conclusões”.

ChatGPT é “muito prolixo”? Talvez isso explique a verbosidade dos resumos, o que fica especialmente evidente no artigo sobre a cooperação entre a Nvidia e o Deutsche Bank. Mas, como mostro, meu prompt não faz com que o ChatGPT seja curto.

Usando o prompt “Liste três conclusões principais deste texto”, posso encurtar significativamente a saída do ChatGPT. Aqui está um exemplo do artigo da Nvidia:

Resumo ChatGPT

  1. O Deutsche Bank e a Nvidia anunciaram uma parceria de vários anos para melhorar os serviços financeiros usando inteligência artificial (IA).
  2. A parceria incluirá o desenvolvimento de avatares inteligentes, grandes modelos de linguagem para gerenciamento de riscos e detecção de fraudes, bem como benefícios para a transformação em nuvem do Deutsche Bank.
  3. O Deutsche Bank usará o pacote de software AI Enterprise da Nvidia e a plataforma Omniverse para criar avatares virtuais 3D para navegação interna e atendimento ao cliente e para acelerar a computação para gerenciamento de riscos e cálculos de cenários.

São 78 palavras em vez de 112. Com “Liste duas conclusões importantes deste texto”, cai para 45:

Resumo ChatGPT

  1. O Deutsche Bank e a Nvidia anunciaram uma parceria de inovação plurianual para melhorar os serviços financeiros com IA.
  2. A parceria se concentrará no desenvolvimento de aplicativos, incluindo avatares inteligentes, grandes modelos de linguagem para gerenciamento de riscos e detecção de fraudes, e também beneficiará a transformação da nuvem do Deutsche Bank.

O ChatGPT da OpenAI poderia facilitar meu trabalho, mas no final dá um passo em falso

Então, na minha amostra, o ChatGPT parece funcionar como uma ferramenta para nossa edição. Os resumos nunca perdem nenhum ponto-chave – pelo menos nesta execução. Se o ChatGPT ou outros grandes modelos de linguagem podem facilitar nosso trabalho – e quão econômico isso é – apenas um teste de longo prazo pode mostrar.

Aqui estão os três principais tópicos que o ChatGPT obtém deste artigo:

  1. O modelo de linguagem GPT-3 da OpenAI não foi capaz de fornecer resumos precisos de texto, mas com feedback humano e treinamento adicional em dados de diálogo, o modelo GPT-3.5 aprimorado, também conhecido como ChatGPT, mostrou recursos de resumo impressionantes em demonstrações.
  2. Pesquisadores da Carnegie Mellon University desenvolveram um sistema chamado VideoDex, que permite que robôs aprendam interações do mundo real a partir de vídeos de interações humanas na Internet, em vez de apenas dados de amostra.
  3. O modelo de IA generativa M-Vader da Aleph Alpha é capaz de gerar novas imagens com base em várias imagens e entrada de texto, em vez de apenas entrada de texto sozinha. Essa técnica de solicitação multimodal melhora a qualidade e a variedade das imagens geradas.

Embora essas possam ser as principais conclusões que um ser humano obtém, ao ler este artigo, não é sobre isso que se trata. Que pena, vou escrever o resumo então.