Uma startup de IA alemã pode ter um concorrente GPT-4 este ano

Os benchmarks da startup alemã de IA Aleph Alpha mostram que os mais recentes modelos de IA da startup podem acompanhar o GPT-3 da OpenAI. Um sucesso que não deve acalmar a Europa com uma falsa sensação de segurança.

O ChatGPT catapultou a inteligência artificial para a discussão pública como nenhum outro produto antes dele. Por trás do chatbot está a empresa americana OpenAI, que ganhou as manchetes com o modelo de linguagem em grande escala GPT-3 e mais tarde com o modelo de texto para imagem DALL-E 2 . O impacto de sistemas como ChatGPT ou meio da jornada na educação e no trabalho, que hoje se sente, era previsível já então.

Os modelos de linguagem subjacentes são frequentemente referidos na pesquisa como modelos de fundação: um grande modelo de IA que, devido ao seu treinamento generalista com grandes conjuntos de dados, pode posteriormente assumir muitas tarefas para as quais não foi explicitamente treinado.

Na Alemanha, por exemplo, houve pedidos iniciais da Associação Alemã de IA para uma iniciativa europeia para construir a infraestrutura necessária para grandes modelos europeus de IA. Essa era a única maneira de garantir a soberania digital, a proteção de dados e possivelmente até o futuro econômico da Europa. Desde então, o LEAM projeto tem sido impulsionado por várias empresas do setor.

Aleph Alpha: modelos de fundação da Alemanha

O termo modelo de fundação é controverso porque pode ser interpretado como um precursor da inteligência artificial geral, dizem os críticos. Mas além dessas discussões mais filosóficas, os grandes modelos de IA da OpenAI e outros formam a base para tecnologias potencialmente transformadoras como ChatGPT ou Pesquisa do Bing com uma personalidade instável .

A OpenAI revelou o GPT-3 em maio de 2020 e abriu o acesso por meio de uma API um mês depois. Pouco mais de um ano depois, jurássico-1 jumbo da startup israelense AI AI21-Labs lançou seu primeiro produto concorrente. Na China, existem várias alternativas, entre as primeiras em 2021 foram Wu Dao e PanGu-Alpha.

E na Alemanha? Aqui, é a startup Aleph Alpha, com sede em Heidelberg, que quer competir com a OpenAI. A Aleph Alpha lançou os modelos de primeira linguagem da família Luminous em abril de 2022. O maior modelo até hoje, Luminous-Supreme, com 70 bilhões de parâmetros, está disponível desde agosto de 2022.

Agora a Aleph Alpha está lançando resultados de benchmark comparando o maior modelo Luminous com o GPT-3 da OpenAI (“davinci” – 175 bilhões de parâmetros), o modelo da BigScience FLORESCER (176 bilhões de parâmetros) e Meta’s OPTAR (175 bilhões de parâmetros).

Com Luminous, Aleph Alpha fecha a lacuna para GPT-3

Os modelos competiram em uma variedade de tarefas, incluindo classificação, raciocínio de senso comum e inferência de linguagem natural. Aleph Alpha usa o Evaluation Harness do coletivo de pesquisa aberta Eleuther AI.

Para quase todas as tarefas, o Luminous iguala o desempenho do GPT-3 e, em uma categoria, até o supera, com menos da metade dos parâmetros. Na prática, isso significa melhor escalabilidade e menor consumo de recursos para o Luminous-Supreme. Meta OPT e BigScience Bloom, lançados no ano passado, estão em média alguns pontos percentuais atrás.

Não há tempo para complacência: a Europa deve continuar financiando a IA

O sucesso do Aleph Alpha é uma boa notícia para a startup e uma boa notícia para a Europa, pois é o primeiro modelo europeu de IA no nível GPT-3.

“O que nossos clientes e parceiros estão nos dizendo em seus casos de uso também se reflete na soma dos testes que realizamos: Luminous é uma forte alternativa em muitos ambientes e, portanto, um passo importante em direção à soberania tecnológica da Europa”, Jonas Andrulis, fundador e CEO da Aleph Alpha, classifica os resultados.

Mas os resultados também fornecem outra perspectiva: demorou mais de dois anos para que uma alternativa europeia ao modelo davinci GPT-3 da OpenAI se tornasse disponível. O Jurassic-1 Jumbo também alcança resultados de referência comparáveis ​​e está no mercado há mais de um ano e meio.

Enquanto isso, a OpenAI lançou outras iterações do modelo davinci, mais recentemente text-davinci-003 que foi treinado com feedback humano e é a base do ChatGPT.

Além disso, no início de abril de 2022, o Google revelou os 540 bilhões de parâmetros Palma que superou significativamente o GPT-3 davinci em quase todos os benchmarks.

Isso não diminui o sucesso do Aleph Alpha: nenhuma outra empresa européia ou iniciativa pública produziu um modelo tão poderoso. Mas o exemplo também mostra que a Europa e a Alemanha precisam levar o desenvolvimento e o financiamento da IA ​​ainda mais a sério.

Aleph Alpha já está testando seu novo modelo, e pode competir com o GPT-4

Graças ao Aleph Alpha e ao Luminous-Supreme, a Europa está agora melhor posicionada na corrida da IA. Com seu modelo de 70 bilhões de parâmetros, a empresa saltou para a vanguarda do setor e demonstrou que mais pode ser alcançado com menos parâmetros.

A Aleph Alpha também lançou uma nova oferta este mês, o modelo Luminous Supreme Control, que se posiciona como uma alternativa aos modelos mais recentes da OpenAI.

Outro sistema de IA está atualmente em teste: com 300 bilhões de parâmetros, o Luminous-World é o maior modelo de IA da Aleph Alpha até hoje e oferece novos recursos para “aplicações altamente complexas e críticas”. Espera-se que seja lançado ainda este ano.

O modelo de 300 bilhões de parâmetros provavelmente competirá diretamente com o da OpenAI GPT-4 e poderia posicionar a startup alemã como um jogador-chave na competição internacional.

Ao mesmo tempo, a empresa deseja desenvolver ainda mais sua própria tecnologia na área de transparência e explicabilidade: “Esta é a única maneira de garantir um desenvolvimento sustentável e ético de acordo com nossos valores e padrões – trata-se de mais do que privacidade, ” diz Andrulis.

Os modelos Aleph Alphas Luminous estão disponíveis através de seus Aplicativo Luminous e API .