Deepmind: Nova IA decifra, localiza e data textos antigos

O software Ithaca AI ajudará os historiadores a decifrar, localizar e datar melhor os textos antigos.

O novo modelo de IA se baseia em um artigo de pesquisa da Deepmind de 2019: The decifrando IA Pythia” nomeado após o oráculo de Delfos, traduz textos gregos antigos e faz sugestões de tradução classificadas por probabilidade.

o IA foi treinado com um conjunto de dados digitais de inscrições gregas e foi capaz de superar significativamente os humanos nos testes da época. As traduções de IA estavam cerca de 70% corretas, enquanto as epígrafes alcançaram 43%.

Mesmo assim, porém, o modelo de IA é uma ferramenta para profissionais humanos. Não se destina a substituí-los.

Ithaca expande Pythia e busca transparência

Isso também se aplica ao novo modelo de IA baseado em transformador, nomeado após a ilha grega de Ithaca da Odisseia de Homero. Amplia as possibilidades de análise dos historiadores pelo espaço e pelo tempo:

  • Além de ajudar com traduções de inscrições gregas históricas,
  • o novo modelo hipotetiza quando os textos foram escritos dentro do intervalo de tempo entre 800 aC a 800 dC,
  • e onde foram anotados, distribuídos por 84 regiões antigas, incluindo visualização em mapa.

Ithaca é treinada com um conjunto de dados de 78.608 inscrições gregas antigas . Cada inscrição é marcada por historiadores com metadados sobre tempo e lugar. Com base nos padrões desse conjunto de dados, Ithaca analisa novas inscrições.

O Ithaca leva em consideração palavras inteiras e caracteres individuais na análise de texto, para que sequências de palavras como “Era uma vez”, que em seu contexto significam mais do que palavras individuais, possam ser traduzidas corretamente.

O modelo AI cria transparência por meio do chamado mapa de saliência: a tecnologia de visão computacional visualiza com diferentes intensidades de cores quais sequências desempenham um papel mais ou menos forte na previsão de texto, local e data.

Decodificando conhecimento antigo mais rápido

De acordo com a Deepmind, a Ithaca alcançou 62% de precisão na recuperação de textos históricos em testes. Os historiadores conseguiram uma precisão de apenas 25% sem a ajuda da máquina. Trabalhando com os modelos de IA, eles alcançaram 72% de precisão.

Ithaca alcançou uma precisão de 71% para o local, e a IA foi capaz de atribuir corretamente o tempo em um período de menos de 30 anos. Textos importantes da Atenas clássica poderiam, assim, ser re-datados, o que é uma contribuição significativa para o debate científico na história antiga, escrevem os pesquisadores do Deepmind.

Além disso, os pesquisadores da Deepmind veem Ithaca como um forte exemplo do potencial de uma colaboração humano-IA e do uso inteligência artificial para acelerar o progresso em outras ciências. Outros exemplos desse impulso científico por meio da IA ​​existem nos campos de ciência de materiais, matemática e fusão nuclear .

“Acreditamos que este é apenas o começo para ferramentas como Ithaca e o potencial de colaboração entre aprendizado de máquina e humanidades”, escreve a equipe Deepmind.

Já está planejando expandir o modelo de IA para incluir outras línguas antigas, como latim e maia. Além das inscrições, outras mídias escritas, como papiros e manuscritos, também poderiam ser analisadas.

O modelo treinado até agora e os resultados da pesquisa estão disponíveis publicamente: Ithaca está disponível como um modelo de código aberto e como um versão interativa no navegador .

Leia mais sobre Inteligência Artificial:

  • Inteligência artificial: análise de grunhidos para detectar porcos felizes
  • Meta quer desenvolver inteligência artificial autônoma
  • Treinamento de IA: a inteligência artificial se torna mais flexível