A Microsoft divulgou nesta terça, 1º, que um novo sistema de inteligência artificial superou médicos humanos na precisão de diagnósticos em testes clínicos simulados.
Batizado de MAI-DxO, o sistema atingiu uma taxa de acerto de 85,5% ao analisar 304 estudos de casos publicados pelo New England Journal of Medicine. Médicos experientes do Reino Unido e dos Estados Unidos, sob as mesmas condições, acertaram em apenas 20% dos casos
O desempenho do MAI-DxO foi possível por meio da integração de diferentes modelos de inteligência artificial desenvolvidos por empresas como OpenAI, Google, Anthropic, Meta e xAI.
Cada modelo atuou como um agente especializado, colaborando entre si para simular o raciocínio clínico de uma equipe médica real.
A abordagem, descrita como “cadeia de debate”, permite que as IAs peçam exames, eliminem hipóteses e cheguem a um diagnóstico final de maneira estruturada.
Além da precisão, o sistema também apresentou ganhos econômicos.
O MAI-DxO reduziu em cerca de 20% os custos dos exames e procedimentos solicitados nos casos testados. A economia foi alcançada ao priorizar exames mais baratos, sem comprometer a qualidade do diagnóstico.
Mustafa Suleyman, diretor da divisão de IA da Microsoft e cofundador da DeepMind, afirmou que a tecnologia representa “um passo genuíno rumo à superinteligência médica”.
Segundo ele, o uso coordenado de múltiplos agentes de IA será essencial para que a inteligência artificial alcance capacidades superiores à de especialistas humanos.
Apesar dos resultados, pesquisadores alertam para limitações do estudo.
David Sontag, cientista do Instituto de Tecnologia de Massachusetts (MIT), observou que os médicos participantes não tiveram acesso a colegas, manuais ou ferramentas digitais durante os testes.
Para Eric Topol, da Scripps Research, os resultados são “impressionantes”, mas é necessário observar o desempenho da IA em condições reais de atendimento.
O sistema ainda não está disponível para uso clínico.
A Microsoft pretende realizar novos testes em ambiente hospitalar e buscar aprovação de órgãos reguladores antes de qualquer lançamento.
Entre as possibilidades estudadas, está a integração da ferramenta a mecanismos como o Bing e o Copilot, para fornecer diagnósticos preliminares a usuários e apoiar médicos na rotina hospitalar.