Sumário
A inteligência artificial pode acelerar processos em diagnósticos. O Dr. Ansgar Lange explica o papel que a IA desempenha na genômica e no sequenciamento.
O custo de sequenciar um genoma está caindo rapidamente. Tão rápido que, nos últimos anos, o equilíbrio na genômica mudou: embora por muito tempo tenha sido o hardware e o custo real do sequenciamento que impulsionou o preço de um genoma sequenciado, está rapidamente se tornando o custo dos recursos humanos.
Neste artigo, estamos mergulhando nos desenvolvimentos em IA e genética e em uma nova geração de software usando IA e aprendizado de máquina para resolver esse gargalo na genômica. Além disso, realizamos recentemente um estudo destinado a validar o desempenho do AION, nossa plataforma para a chamada interpretação de variantes.
Alguns antecedentes: desenvolvimentos recentes em testes genéticos e a necessidade de IA
As doenças genéticas são “causadas” por mutações ou variantes no genoma humano. Um geneticista deve encontrar a variante causativa (ou patogênica) para diagnosticar uma doença genética. O genoma humano consiste em cerca de 3 bilhões de pares de bases, e essas variantes causadoras podem ser encontradas em qualquer parte do genoma humano. Por muito tempo, o sequenciamento de genomas foi um processo caro: o primeiro rascunho de um genoma humano como parte do Projeto Genoma Humano custou 300 milhões de dólares.
Em 2006, o custo do sequenciamento de um genoma humano foi estimado em 20-25 milhões de dólares, embora este fosse um custo hipoteticamente calculado. Felizmente, o custo do sequenciamento do genoma diminuiu constantemente desde o rascunho do genoma humano de 150 milhões em 2003 – com o preço mais recente em 2022 em 200. Não é difícil imaginar o que isso significa para a demanda do mercado: os custos em queda acentuada levaram a um forte crescimento do mercado de sequenciamento de próxima geração (NGS), com um crescimento anual composto estimado de mais de 18% entre 2022 e 2030. Em outras palavras, os testes genéticos estão se tornando mais amplamente disponíveis.
Esses desenvolvimentos significam que o fator de custo do sequenciamento genético não é mais o próprio sequenciamento. Cada vez mais a análise de todos esses dados está se tornando um gargalo para os laboratórios. O sequenciamento de um genoma ou exoma gera uma longa lista de variantes que precisam ser interpretadas por um especialista, pois muitas dessas variantes são benignas (não prejudiciais). Então, em termos simples, gerar os dados está ficando mais barato a cada ano, enquanto a interpretação desses dados – encontrar a variante patogênica – ainda é trabalhosa e custosa.
É aqui que entra uma nova geração de software orientado por IA, apoiando aqueles que interpretam os dados, cientistas variantes, na aceleração do processo de análise de genomas ou exomas sequenciados. À medida que mais e mais países introduzem testes genéticos em escala, por exemplo, por meio de programas de triagem neonatal, são necessárias ferramentas orientadas por IA que se concentrem no atual gargalo de interpretação.
A validação clínica de ferramentas de interpretação de variantes orientadas por IA: nosso estudo
AION é uma dessas plataformas: uma plataforma de interpretação variante para doenças raras suportada por algoritmos de aprendizado de máquina. Antes de mergulhar em seu estudo de validação – vamos ver rapidamente como ele funciona. O objetivo é apoiar cientistas variantes nesse processo de interpretação que atualmente é o gargalo no mercado de sequenciamento em rápido crescimento.
AION compreende dois componentes principais: em primeiro lugar, todas as mutações ou variantes são classificadas em patogênicas ou benignas – mas o impacto causal de menos de 1% de todas as mutações é conhecido. Um número maior de variantes é chamado de VEUA: variantes de significado incerto. Esse algoritmo oferece suporte à categorização extrapolando o conhecimento com base em conjuntos de dados públicos e nas pesquisas mais recentes, identificando variantes potencialmente patogênicas.
Em segundo lugar, um segundo algoritmo combina essas variantes potencialmente prejudiciais com os sintomas que um paciente experimenta para classificar as variantes mais relevantes para o especialista humano examinar. Isso é particularmente interessante, lembrando que a grande maioria das variantes são VEUA, o que fornece uma direção para investigação clínica posterior por um especialista humano.
O estudo visa validar o desempenho clínico da nossa plataforma. Para fazer isso, analisamos os dados de pacientes com doenças raras do Genomics England 100.000 Genomes Project. A equipe de genômica computacional da Nostos Genomics executou casos de doenças raras do Projeto 100.000 Genomas no AION e analisou seu desempenho. Aqui, o objetivo não era encontrar novos diagnósticos, mas medir o desempenho da ferramenta com base em casos já diagnosticados, para ver o desempenho de uma ferramenta orientada por IA em comparação com um especialista humano.
Os resultados são impressionantes: AION identificou as variantes patogênicas causadoras em mais de 91% dos casos e mais de 93% se os dados dos pais estiverem disponíveis. Isso significa que em mais de 9 de 10 casos, a variante causadora foi encontrada na classificação de variantes priorizadas em idades e etnias. A interpretação variante automatizada orientada por IA oferece desempenho clínico comparável ao de um especialista humano. Ele pode apoiar a análise de testes genéticos clínicos, o que pode diminuir o tempo e os custos associados a esse processo crucial devido ao gargalo de interpretação descrito anteriormente.
Potencial futuro para IA em genética
Nos parágrafos anteriores, abordamos a necessidade de ferramentas de suporte à decisão orientadas por IA com o rápido crescimento do setor de sequenciamento e a validação de seu desempenho. A adoção adicional dessas ferramentas pode levar a uma maior disponibilidade de testes genéticos globalmente. A redução dos custos de sequenciamento pode abrir as portas para os mercados globais de saúde investirem em diagnósticos de doenças raras.
No entanto, muitos países de baixa e média renda ainda não possuem experiência em genética clínica para analisar a multiplicidade de variantes que resultariam do sequenciamento de suas populações. As ferramentas orientadas por IA devem ser simples de integrar, visto que muitos laboratórios não possuem o conhecimento técnico para implementar pipelines e interfaces computacionais complexos. Em outras palavras: as ferramentas de IA de apoio à decisão democratizam a especialização em genética, apoiando laboratórios em todo o mundo com acesso equitativo à interpretação do genoma de alta qualidade.
Em segundo lugar, os algoritmos de IA permitem que os laboratórios ultrapassem os limites de sua prática de diagnóstico, concedendo aos cientistas variantes mais tempo para se concentrar em casos complexos. Embora os cientistas variantes apoiados pela interpretação orientada por IA possam resolver casos de doenças raras mais rapidamente, vários pacientes podem não apresentar uma variante causativa clara.
Esses casos complexos são frequentemente caracterizados por terem muitas variantes de significado incerto (VEUA). Investigações aprofundadas sobre esses VEUA são realizadas usando telas funcionais ou sequenciamento familiar adicional, o que pode fornecer evidências suficientes para a reclassificação. Ao priorizar esses VEUA com uma pontuação de patogenicidade, as ferramentas de IA adicionam nuances à categoria VEUA e indicam as variantes mais valiosas para investigações aprofundadas, permitindo que os departamentos de genética façam o melhor uso dos recursos. Quanto mais bem treinado e sofisticado for o algoritmo, melhores serão essas classificações, permitindo que os cientistas variantes façam ainda mais diagnósticos no futuro – apoiados pela IA.
Referências:
- Berger, Bonnie e Yun William Yu. 2022. “Navigating Bottlenecks and Trade-Offs in Genomic Data Analysis.” Avaliações da natureza. Genética, dezembro, 1-16.
- Kris A. Wetterstrand, MS 2019. “O custo de sequenciar um genoma humano.” Genome.gov. NHGRI. 13 de março de 2019. https://www.genome.gov/about-genomics/fact-sheets/Sequencing-Human-Genome-cost.
- “Relatório de Mercado de Serviços de Sequenciamento de Próxima Geração, 2030.” Acessado em 9 de janeiro de 2023. https://www.grandviewresearch.com/industry-analysis/next-generation-sequencing-ngs-services-market.
- “Comunicado de imprensa.” Acessado em 9 de janeiro de 2023. https://www.illumina.com/company/news-center/press-releases/press-release-details.html?newsid=8d04df3f-d9c1-4c85-8177-6ea604627ccd.
- Richards, S., N. Aziz, S. Bale, D. Bick, S. Das, J. Gastier-Foster, WW Grody, et al. 2015. “Standards and Guidelines for the Interpretation of Sequence Variants: A Joint Consensus Recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology.” Genética em Medicina: Jornal Oficial do Colégio Americano de Genética Médica 17 (5). https://doi.org/10.1038/gim.2015.30.