Sumário
- O ChatGPT escreve resumos melhores do que nós?
- O “Dramatron” da Deepmind pode escrever roteiros de cinema e teatro
- O treinamento em vídeo para a mão do robô permite que ele aprenda os movimentos humanos
- A solicitação multimodal é a chave para uma melhor IA generativa
- Nvidia entra no setor financeiro com uma parceria de IA de vários anos com o Deutsche Bank
- ChatGPT é um chatbot GPT-3 da OpenAI que você pode testar agora
- Resumos do ChatGPT: engenharia de prompt para “principais conclusões”.
- O ChatGPT da OpenAI poderia facilitar meu trabalho, mas no final dá um passo em falso
Resumimos nossos artigos para nossos leitores em pontos curtos. Mas como nos comparamos a uma IA?
Quando projetamos O DECODER, nossa equipe decidiu oferecer aos nossos leitores os principais pontos de nossos artigos como um breve resumo. Antes de lançar o site, também testamos como grandes modelos de linguagem como o GPT-3 da OpenAI poderiam fazer o trabalho. Nosso resultado: os resumos de IA estavam corretos, mas faltavam pontos importantes no texto.
Mas a OpenAI continuou a melhorar os modelos GPT com feedback humano nos últimos meses. Os modelos GPT-3.5, como o OpenAI os chama, que estão disponíveis desde o início de 2022, também formam a base para o teste ao vivo do ChatGPT.
No entanto, o modelo também processou dados de diálogo de humanos para treinamento, OpenAI contratou treinadores de IA, que escreveram seu texto e o de um assistente de IA. Esses treinadores de IA tiveram acesso a sugestões que os ajudaram a escrever as respostas.
O ChatGPT escreve resumos melhores do que nós?
O ChatGPT tem atraído muita atenção desde o seu lançamento, como mostramos em nosso artigo sobre algumas das melhores demos do ChatGPT . Parte dessas demonstrações são resumos impressionantes criados pelo ChatGPT. Ferramentas de IA como Bearly.AI ou SumUp trazem esse recurso a apenas um clique de distância para qualquer navegador.
Portanto, é hora de dar outra chance aos resumos de IA. Aqui estão cinco resumos de nossos artigos e o que o ChatGPT faz com o mesmo texto. Para todos os exemplos, o prompt “Resuma o texto em alguns marcadores” foi colocado na frente do artigo e a primeira saída foi usada.
O “Dramatron” da Deepmind pode escrever roteiros de cinema e teatro
Resumo O DECODIFICADOR
- O Dramatron da Deepmind usa um método de solicitação especial para extrair histórias consistentes de grandes modelos de linguagem.
- Isso permite que o sistema crie roteiros inteiros e roteiros de teatro.
- Os testadores humanos veem o Dramatron como uma ferramenta criativa útil.
Resumo ChatGPT
- A Deepmind desenvolveu um sistema chamado Dramatron que é capaz de gerar roteiros e roteiros coerentes para teatro e cinema
- O sistema, que é baseado em um breve resumo de uma história chamado log line, usa um método chamado “prompt chaining” para gerar uma lista de personagens, enredo, localizações e diálogos consistentes com o log line.
- O Dramatron consiste em cinco prompts codificados que se complementam para criar a saída final
- O sistema foi desenvolvido a partir de um grande modelo de linguagem treinado com 70 bilhões de parâmetros e foi avaliado por 15 profissionais das indústrias de teatro e cinema
- Os profissionais, em sua maioria, tiveram reações positivas à saída do sistema, mas também houve críticas, incluindo o risco de plágio e o impacto na indústria criativa.
O treinamento em vídeo para a mão do robô permite que ele aprenda os movimentos humanos
Resumo O DECODIFICADOR
- Os robôs geralmente aprendem as interações do mundo real a partir de dados de amostra dessas mesmas interações. Mas estes são difíceis de encontrar.
- Com o VideoDex, pesquisadores da Carnegie Mellon University mostram como um robô pode aprender com as interações humanas a partir de vídeos da Internet.
- O sistema de IA aprende os movimentos humanos, além das representações visuais usuais. Em benchmarks, ele tem um desempenho melhor do que os métodos anteriores.
Resumo ChatGPT
- Pesquisadores da Carnegie Mellon University desenvolveram o VideoDex, um método para ensinar robôs por meio de vídeos da internet de interações humanas
- O VideoDex usa algoritmos para rastrear a mão, o pulso e a posição da câmera no espaço e mapeia esses movimentos para uma mão robótica de 16 DOF e um braço robótico
- Além das representações visuais, o VideoDex usa políticas dinâmicas neurais aprendidas para melhorar o controle do robô
- Após o treinamento, o VideoDex pode superar os métodos de aprendizado de robôs de última geração em interações do mundo real com apenas alguns exemplos demonstrados por controle remoto humano
A solicitação multimodal é a chave para uma melhor IA generativa
Resumo O DECODIFICADOR
- Os atuais modelos de IA generativa geram novas imagens baseadas principalmente em texto.
- A empresa alemã de IA Aleph Alpha está agora introduzindo uma técnica de solicitação de entrada multimodal para geração de imagem de IA.
- O novo modelo, M-Vader, pode gerar uma nova imagem com base em várias imagens e textos que fazem referência uns aos outros. Os modelos de imagem AI tornam-se assim controláveis com mais precisão.
Resumo ChatGPT
- Aleph Alpha desenvolveu uma nova técnica para modelos de imagem generativos chamados prompts multimodais
- O modelo M-VADER pode processar entradas multimodais, como fotos, esboços e descrições textuais para gerar novas ideias de imagens
- O M-VADER usa um decodificador multimodal chamado S-MAGMA para guiar o processo de geração de imagens usando modelos pré-treinados
- O M-VADER pode gerar imagens com base no contexto multimodal, mesclar duas imagens ou criar variações de uma imagem
- A tecnologia se tornará parte da oferta Luminous da Aleph Alpha e é uma inovação mundial na geração de imagens multimodais.
Nvidia entra no setor financeiro com uma parceria de IA de vários anos com o Deutsche Bank
Resumo O DECODIFICADOR
- A Nvidia e o Deutsche Bank formam uma parceria de IA de vários anos para melhorar os serviços financeiros com IA.
- As empresas focarão inicialmente em avatares inteligentes, grandes modelos de linguagem para textos financeiros e detecção de fraudes.
Resumo ChatGPT
- O Deutsche Bank e a Nvidia anunciaram uma parceria de vários anos para melhorar os serviços financeiros usando inteligência artificial (IA)
- As duas empresas trabalham juntas há 18 meses e estão desenvolvendo uma variedade de aplicativos de IA, incluindo avatares inteligentes e grandes modelos de linguagem para gerenciamento de riscos e detecção de fraudes
- A parceria também beneficiará a transformação da nuvem do Deutsche Bank e permitirá que o banco extraia dados úteis de informações não estruturadas
- O Deutsche Bank também está usando o software Nvidia AI Enterprise e está desenvolvendo um avatar virtual 3D usando o Nvidia Omniverse para melhorar seus sistemas internos e a experiência do cliente
- O CEO da Nvidia, Jensen Huang, disse que a parceria “reimaginará a maneira como os serviços financeiros são operados e entregues”.
ChatGPT é um chatbot GPT-3 da OpenAI que você pode testar agora
Resumo O DECODIFICADOR
- ChatGPT é um modelo de bate-papo da OpenAI baseado no GPT 3.5 e refinado com diálogos.
- Agora está disponível gratuitamente online como uma versão de demonstração. A demonstração não é senciente.
- A OpenAI espera obter insights do feedback do usuário que possam ser usados no desenvolvimento de futuros modelos de linguagem.
Resumo ChatGPT
- A OpenAI lançou o ChatGPT, um chatbot treinado com feedback humano
- O ChatGPT destina-se a ajudar a OpenAI a desenvolver melhores sistemas de IA por meio do feedback do usuário
- O chatbot foi treinado usando aprendizado por reforço com feedback humano (RLHF), o que resultou em textos mais bem avaliados por humanos e reduz o discurso de ódio e a desinformação
- O ChatGPT foi treinado em dados de diálogo coletados de humanos que escreveram os dois lados de um diálogo, o seu próprio e o do assistente de IA
- O chatbot tem limitações, incluindo a geração de respostas plausíveis, mas incorretas e sem sentido, reagindo fortemente a pequenas mudanças nas solicitações e sendo muito prolixo, repetitivo e tendencioso para respostas mais detalhadas
- O ChatGPT está disponível gratuitamente com uma conta OpenAI e é uma “demonstração inicial do que é possível”, de acordo com o cofundador Sam Altman
Resumos do ChatGPT: engenharia de prompt para “principais conclusões”.
ChatGPT é “muito prolixo”? Talvez isso explique a verbosidade dos resumos, o que fica especialmente evidente no artigo sobre a cooperação entre a Nvidia e o Deutsche Bank. Mas, como mostro, meu prompt não faz com que o ChatGPT seja curto.
Usando o prompt “Liste três conclusões principais deste texto”, posso encurtar significativamente a saída do ChatGPT. Aqui está um exemplo do artigo da Nvidia:
Resumo ChatGPT
- O Deutsche Bank e a Nvidia anunciaram uma parceria de vários anos para melhorar os serviços financeiros usando inteligência artificial (IA).
- A parceria incluirá o desenvolvimento de avatares inteligentes, grandes modelos de linguagem para gerenciamento de riscos e detecção de fraudes, bem como benefícios para a transformação em nuvem do Deutsche Bank.
- O Deutsche Bank usará o pacote de software AI Enterprise da Nvidia e a plataforma Omniverse para criar avatares virtuais 3D para navegação interna e atendimento ao cliente e para acelerar a computação para gerenciamento de riscos e cálculos de cenários.
São 78 palavras em vez de 112. Com “Liste duas conclusões importantes deste texto”, cai para 45:
Resumo ChatGPT
- O Deutsche Bank e a Nvidia anunciaram uma parceria de inovação plurianual para melhorar os serviços financeiros com IA.
- A parceria se concentrará no desenvolvimento de aplicativos, incluindo avatares inteligentes, grandes modelos de linguagem para gerenciamento de riscos e detecção de fraudes, e também beneficiará a transformação da nuvem do Deutsche Bank.
O ChatGPT da OpenAI poderia facilitar meu trabalho, mas no final dá um passo em falso
Então, na minha amostra, o ChatGPT parece funcionar como uma ferramenta para nossa edição. Os resumos nunca perdem nenhum ponto-chave – pelo menos nesta execução. Se o ChatGPT ou outros grandes modelos de linguagem podem facilitar nosso trabalho – e quão econômico isso é – apenas um teste de longo prazo pode mostrar.
Aqui estão os três principais tópicos que o ChatGPT obtém deste artigo:
- O modelo de linguagem GPT-3 da OpenAI não foi capaz de fornecer resumos precisos de texto, mas com feedback humano e treinamento adicional em dados de diálogo, o modelo GPT-3.5 aprimorado, também conhecido como ChatGPT, mostrou recursos de resumo impressionantes em demonstrações.
- Pesquisadores da Carnegie Mellon University desenvolveram um sistema chamado VideoDex, que permite que robôs aprendam interações do mundo real a partir de vídeos de interações humanas na Internet, em vez de apenas dados de amostra.
- O modelo de IA generativa M-Vader da Aleph Alpha é capaz de gerar novas imagens com base em várias imagens e entrada de texto, em vez de apenas entrada de texto sozinha. Essa técnica de solicitação multimodal melhora a qualidade e a variedade das imagens geradas.
Embora essas possam ser as principais conclusões que um ser humano obtém, ao ler este artigo, não é sobre isso que se trata. Que pena, vou escrever o resumo então.