Sumário
Dois anos após o AlphaFold, os pesquisadores do CASP15 revelam as capacidades e limitações do sistema de IA.
Em 1994, os professores John Moult e Krzysztof Fidelis fundaram a Critical Assessment of Protein Structure Prediction (CASP), uma competição bienal para prever dobras de proteínas.
Grupos de pesquisa participantes usam uma variedade de métodos para tentar prever estruturas de proteínas que já foram descobertas empiricamente por outros cientistas, mas ainda não foram publicadas.
Em dezembro de 2020, a equipe publicou os resultados do CASP14: o AlphaFold 2.0 da Deepmind previu a estrutura de 70 das quase 100 sequências de proteínas a serem resolvidas na competição com a mesma precisão dos métodos experimentais. Essa conquista foi um avanço. Alguns pesquisadores chamaram a inteligência artificial de uma solução para o problema de dobramento de proteínas de 50 anos.
CASP15 apresenta novos desafios para a inteligência artificial
O impressionante sucesso de 2020 representou um desafio para o biólogo John Moult, da equipe CASP, e seus colegas. “As pessoas dizem: ‘Ah, não precisamos mais do CASP, o problema foi resolvido.’ E acho que é exatamente o caminho errado”, disse Moult, de acordo com um relatório da Nature.
Em vez de simplesmente continuar coletando as melhores pontuações para um problema já resolvido, a equipe adicionou novos desafios e modificações aos antigos. Isso inclui, por exemplo, previsões sobre as interações entre proteínas e outras moléculas, como drogas, ou sobre as diferentes formas que algumas proteínas podem assumir.
AlphaFold domina CASP15 mesmo sem Deepmind
Os resultados do CASP15 já foram publicados. Dois anos depois, AlphaFold ainda domina a competição.
O próprio Deepmind não participou desta rodada, mas o AlphaFold é de código aberto desde 2021 e os participantes mais bem-sucedidos integraram o sistema de IA do Deepmind em suas abordagens.
Ao prever a forma de proteínas individuais, as equipes participantes obtiveram melhorias moderadas na precisão. “A precisão já é tão alta que é difícil melhorá-la”, disse Moult.
Além dos recursos comprovados do AlphaFold, várias equipes neste ano também demonstraram como o sistema de IA pode ser usado com modificações para prever interações de proteínas. Em comparação com o CASP14, os sistemas que usam essas variantes do AlphaFold fizeram melhorias significativas e estão se aproximando lentamente da precisão dos métodos experimentais.
O AlphaFold precisa melhorar e os modelos de linguagem podem ajudar
Mas, para alcançar a precisão dos métodos experimentais demorados, são necessários mais refinamentos, dizem os pesquisadores envolvidos. Uma possibilidade de inovação são os modelos de linguagem como Meta’s ESMFold que prevêem estruturas de proteínas em vez de palavras.
Em comparação direta com o AlphaFold, esses métodos estavam bem atrasados, mas poderiam ser úteis para prever como as mutações alteram a estrutura de uma proteína, de acordo com os pesquisadores.
“A fruta mais baixa foi colhida”, diz Mohammed AlQuraishi, biólogo computacional da Universidade de Columbia, em Nova York. “Alguns dos próximos problemas serão mais difíceis.”