Pular para o conteúdo principal

Anthropic surpreende ao exigir documento de identidade para usar o Claude — e a reação não foi positiva

Chatbots de IA erram diagnóstico em mais de 80% dos casos médicos iniciais, aponta estudo

 


Um novo estudo conduzido por pesquisadores do Mass General Brigham (MGB), um dos maiores sistemas de saúde acadêmicos dos Estados Unidos, revelou que modelos de inteligência artificial generativa apresentam falhas graves na fase inicial do raciocínio clínico. Ao submeter 21 modelos de linguagem a uma série de cenários clínicos, os pesquisadores constataram que os sistemas frequentemente falham em elaborar diagnósticos diferenciais — ou seja, a lista inicial de possíveis causas para um conjunto de sintomas.

O estudo identificou que os chatbots não conseguiram produzir a lista correta de possíveis causas dos sintomas em mais de 80% das vezes quando analisaram apenas as informações básicas de casos reais de pacientes. O diagnóstico diferencial é a etapa em que um médico, com dados ainda limitados, precisa levantar hipóteses e definir os próximos passos da investigação — um momento crítico no atendimento real.

O desempenho melhora significativamente quando os modelos recebem o quadro clínico completo do paciente. Quando fornecidas com informações abrangentes, as IAs conseguiram chegar ao diagnóstico correto em mais de 90% dos casos. O problema, alertam os pesquisadores, é que na prática clínica as informações raramente chegam completas de uma só vez.

Segundo o Dr. Marc Succi, diretor executivo do MESH Incubator do MGB, pacientes que tomam decisões com base nas respostas geradas na fase inicial podem buscar biópsias desnecessárias ou, em situações mais graves, atrasar o tratamento de sintomas que são sinais de um AVC. O pesquisador foi categórico: "Você não pode simplesmente confiar no que o chatbot diz."

Para os autores, a avaliação dos LLMs de forma sequencial — imitando o processo real de um médico, e não apenas como "respondedores de provas" — é o que revela a lacuna mais preocupante: esses modelos são bons em nomear um diagnóstico final quando os dados estão completos, mas têm dificuldades na fase aberta e inicial de um caso, quando há poucas informações disponíveis.

O estudo, publicado no JAMA Network Open, reforça a necessidade de manter um médico humano no centro das decisões clínicas. Os pesquisadores desenvolveram uma nova métrica chamada PrIME-LLM para avaliar a competência clínica dos modelos de IA, e os resultados indicam que, apesar dos avanços, a tecnologia ainda não está pronta para substituir o julgamento médico — especialmente nos momentos mais delicados do diagnóstico.

Fontes:

Mass General Brigham: https://www.massgeneralbrigham.org/en/about/newsroom/press-releases/ai-chatbot-lacks-clinical-reasoning

The Boston Globe: https://www.bostonglobe.com/2026/04/13/business/chatgpt-medical-advice-mass-general-brigham/

Estudo original (JAMA Network Open): DOI 10.1001/jamanetworkopen.2026.4003

Comentários

Mais populares da semana

África do Sul impõe metas raciais por setor a empregadores com mais de 50 funcionários

  A Lei de Emenda à Equidade no Emprego (Employment Equity Amendment Act — EEAA), em vigor desde janeiro de 2025, estabelece metas numéricas por raça e gênero em 18 setores econômicos sul-africanos, distribuídas em quatro níveis ocupacionais: técnico qualificado, gestão profissional e intermediária, gestão sênior e alta gestão. As metas, formalmente publicadas em abril de 2025, exigem que empregadores com 50 ou mais funcionários reestruturem sua força de trabalho para refletir os dados demográficos nacionais de gênero e raça do país. Conforme os dados oficiais divulgados pelo Departamento de Emprego e Trabalho, os tetos para homens brancos variam significativamente entre setores e níveis hierárquicos. Na categoria de técnico qualificado, o limite é de 4,1% na maioria dos setores, chegando a 15,6% em atividades imobiliárias e 13,3% em mineração. Na alta gestão, os percentuais são mais elevados: 66% no setor de agricultura, silvicultura e pesca, 50,9% em manufatura e 8,3% em administ...

R$ 260 bilhões lavados: o país que bloqueia o investidor honesto e deixa o crime passar

 Enquanto brasileiros no exterior enfrentam burocracia kafkiana para investir na bolsa de sua própria terra natal, organização criminosa movimentou valor equivalente a 10% do PIB nacional. A Operação Narco Fluxo, deflagrada pela Polícia Federal nesta quarta-feira (15/4), revelou um número que deveria provocar constrangimento institucional: o grupo liderado pelo funkeiro MC Ryan SP movimentou mais de R$ 260 bilhões por meio de uma estrutura que a própria investigação descreve como uma "instituição financeira clandestina". Para efeito de comparação, esse montante supera o PIB de países inteiros e equivale a cerca de 10% de toda a riqueza gerada pelo Brasil em um ano. O paradoxo é brutal. O mesmo sistema financeiro brasileiro que exige de um engenheiro paulistano residente em Lisboa uma avalanche de documentos, declarações à Receita Federal, retenções na fonte e taxas extras apenas para comprar ações da Petrobras — sua própria empresa nacional — foi atravessado de ponta a ponta ...

A Noruega trocou livros por tablets — e se arrependeu

  A Noruega enfrenta uma crise educacional que ela mesma reconhece ter contribuído para criar. Em 2016, o município de Oslo decidiu distribuir iPads a crianças a partir dos 5 anos ao entrarem na escola — sem controles parentais e com pouca estrutura pedagógica para o uso dos dispositivos. Livros foram gradualmente substituídos nas salas de aula, e o engajamento dos alunos com a leitura passou a cair de forma consistente. Os dados do PISA, exame internacional da OCDE aplicado a estudantes de 15 anos, revelam o impacto. A nota norueguesa em leitura caiu de 513 pontos em 2015 — seu pico histórico — para 477 pontos em 2022, ficando praticamente na média da OCDE (476 pontos). A queda foi severa, mas está longe de ser a pior do ranking: o país ficou em torno da 22ª posição entre os 81 países participantes do PISA 2022, bem distante do último lugar. Pesquisadores da Universidade de Oslo alertam ainda que o engajamento com a leitura de livros foi substituído por leitura de telas — e os dad...