Sumário
Sistemas confiáveis de IA para medicina precisam de dados de alta qualidade. Mas esses dados ainda são raros. Um novo modelo poderia contornar o problema.
A inteligência artificial para diagnósticos médicos promete melhorar o atendimento ao paciente. Isso seria particularmente útil em áreas onde os especialistas são escassos e os tempos de espera são longos. Os primeiros sistemas de análise de imagem para diagnóstico já foram aprovados.
Mas o desenvolvimento de sistemas de IA requer os chamados “dados rotulados” de especialistas humanos, como imagens de raios-X dos pulmões nos quais o tecido canceroso suspeito e identificado já está marcado para que possa ser lido por computadores. Esses dados de treinamento ainda são raros e caros porque, ao contrário de outros casos de uso de análise de imagens de IA, apenas especialistas designados podem processar os dados.
IA na medicina: modelos pré-treinados aprendem mais rápido
Uma solução possível é usar massas de dados não rotulados para pré-treinar modelos de IA – supervisionados por especialistas – e depois especializá-los para sua tarefa usando os dados limitados disponíveis. Durante o treinamento de IA, os modelos aprendem padrões presentes nos dados, que podem ser usados com treinamento supervisionado.
Essa abordagem tem sido usada com sucesso por algum tempo em sistemas de fala como o GPT-3. A abordagem também provou ser bem-sucedida na análise de imagens. Em meados de 2020, um sistema de IA do Google pré-treinado com três bilhões de imagens quebrou os melhores valores no benchmark ImageNet.
Os pesquisadores já apresentaram modelos pré-treinados para sistemas de diagnóstico. Um modelo de IA foi treinado com quase 105 milhões de imagens de várias anatomias (cabeça, abdômen, tórax, pernas, etc.).
As imagens são compostas por tomografia computadorizada (TC), ressonância magnética (MRI), raios-X e ultrassonografia. Além disso, nenhum dos conjuntos de dados foi rotulado. Um segundo modelo também foi treinado com aproximadamente 24.500 imagens cerebrais 3D.
Dependendo do modelo de IA, o treinamento levava até duas semanas em quatro nós de servidor, cada um com oito GPUs Nvidia Volta de 16 gigabytes, 80 núcleos de CPU e 512 gigabytes de memória. A equipe também experimentou diferentes arquiteturas.
Com 100 milhões de imagens para o melhor sistema AI
Os pesquisadores então treinaram os modelos já pré-treinados com conjuntos de dados rotulados por especialistas. O primeiro modelo aprendeu a reconhecer lesões pulmonares e pneumotórax usando cerca de 300 radiografias de tórax marcadas. Uma versão deste primeiro modelo aprendeu a identificar metástases no cérebro em exames de ressonância magnética 3D usando 341 exames adicionais. Uma variante do segundo modelo aprendeu a detectar hemorragias cerebrais em tomografias 3D usando 3.000 varreduras adicionais.
Em todos os casos, esses sistemas, baseados nos modelos pré-treinados, demonstraram maior precisão do que as alternativas atuais treinadas usando apenas dados rotulados: A precisão aumentou de seis a oito por cento. Esta é uma conquista notável, especialmente sem dados rotulados adicionais.
Os sistemas também eram mais robustos e aprendiam suas tarefas até 85% mais rápido, escrevem os pesquisadores. As melhorias no futuro devem permitir um treinamento de IA mais rápido e, portanto, iterações mais rápidas dos modelos pré-treinados, bem como modelos mais diversos para outras tarefas de diagnóstico.