Sumário
A Meta AI lança um banco de dados de proteínas com a estrutura de centenas de milhões de proteínas. Ele é alimentado por um novo modelo de IA que computa significativamente mais rápido que o AlphaFold da Deepmind.
Em dezembro de 2020, a Deepmind revelou o AlphaFold, um sistema de IA para prever dobras de proteínas. O sistema de IA é tão mais rápido que os métodos alternativos que é considerado por alguns cientistas como uma solução para o problema de dobramento de proteínas de quase 50 anos. Em julho de 2021, a Deepmind lançou o AlphaFold 2 como código aberto e um banco de dados de proteínas abrangente.
Agora, os pesquisadores da Meta também estão demonstrando seu progresso no uso de modelos de IA para prever estruturas de proteínas.
O banco de dados do ESM Metagenômica Alta inclui centenas de milhões de previsões de estrutura
O ESM Metagenomic Atlas publicado pela Meta inclui previsões de estrutura para 617 milhões de proteínas encontradas em micróbios no solo, no oceano ou no corpo humano. O número dessas proteínas excede em muito o encontrado na vida animal e vegetal. No entanto, eles estão entre as proteínas menos compreendidas.
“Essas são as estruturas que menos conhecemos. Estas são proteínas incrivelmente misteriosas. Acho que eles oferecem o potencial para uma grande compreensão da biologia”, diz Alexander Rives, líder de pesquisa da equipe de proteínas da Meta AI.
As previsões de estrutura vêm do ESMFold da Meta, um modelo de IA que se baseia em um grande modelo de linguagem treinado com sequências de aminoácidos de proteínas conhecidas. O ESMFold pode completar sequências após o treinamento e prever suas estruturas em uma segunda etapa.
O ESMFold da Meta é menos preciso que o AlphaFold, mas significativamente mais rápido
De acordo com a Meta, o ESMFold não atinge a precisão do AlphaFold da Deepmind, mas é 60 vezes mais rápido. Isso torna a abordagem da Meta muito mais fácil de escalar para grandes bancos de dados, como no caso do agora publicado banco de dados de DNA metagenômico. A grande maioria das entradas no banco de dados vem de organismos que nunca foram estudados em laboratório.
Anunciando o ESM Metagenomic Atlas – a primeira visão abrangente da ‘matéria escura’ do universo das proteínas. Possibilitado pelo ESMFold, um novo modelo inovador para dobramento de proteínas da Meta AI.
Mais em nosso novo blog ➡️ https://t.co/LsUhSjzqCf
1/3 pic.twitter.com/5lq48rPv5A
– Meta AI (@MetaAI) 1º de novembro de 2022
As 617 milhões de previsões levaram o ESMFold da Meta duas semanas para serem concluídas. O modelo classificou um terço das previsões como de alta qualidade. Nesses casos, os pesquisadores podem assumir que a forma da proteína está correta e, em alguns casos, detalhes mais finos em nível atômico são discerníveis.
Meta está publicando o Modelos ESMFold e um papel pré-impressão em adição a ESM Atlas metagenómico .