ARTIGO CIENTÍFICO

APLICAÇÕES DE INTELIGÊNCIA ARTIFICIAL NO DIAGNÓSTICO PRECOCE DO CÂNCER: UMA REVISÃO SISTEMÁTICA Volume 6. Número 1. 2026 – ISSN 2764-4006 | DOI 1055703
Chamada para Submissão de Artigos

A RCI está com submissões abertas em regime de publicação contínua para artigos científicos na área da saúde.

Convidamos pesquisadores, docentes e profissionais da saúde a submeterem artigos multidisciplinares, originais ou de revisão, que contribuam para o avanço científico, a inovação e a formação profissional em saúde, com especial atenção às transformações tecnológicas aplicadas à pesquisa e à educação em saúde.

Todos os manuscritos passam por revisão por pares, recebem DOI e seguem padrões editoriais internacionais.

Veja as normas

APLICAÇÕES DE INTELIGÊNCIA ARTIFICIAL NO DIAGNÓSTICO PRECOCE DO CÂNCER: UMA REVISÃO SISTEMÁTICA

Applications of Artificial Intelligence in Early Cancer Diagnosis: A Systematic Review


  • Thaiz Ferraz Borin1
  • José Songlei da Silva Rocha2
  • Daniel da Silva Lima3
  • Valéria Pereira de Oliveira4
  • Lismeia Raimundo Soares5

E-mail correspondente: thaiz.borin@gmail.com

Data de publicação: 08 de abril de 2026

10.55703/27644006060115

Download do Artigo em PDF – Português


 

RESUMO

Objetivo: Analisar as aplicações da Inteligência Artificial no diagnóstico precoce do câncer, com ênfase na acurácia diagnóstica, na comparação entre sistemas algorítmicos e especialistas humanos e no impacto clínico potencial dessas ferramentas em diferentes cenários oncológicos. Metodologia: Trata-se de uma revisão sistemática, qualitativa e descritiva, desenvolvida a partir da seleção de 25 estudos originais, reais e rastreáveis, publicados em periódicos científicos indexados. A busca concentrou-se em estudos sobre câncer de mama, colorretal, colo do útero, pulmão, pele, pâncreas, próstata e testes multicâncer, com foco em aplicações de machine learning e deep learning voltadas ao rastreamento, triagem diagnóstica e apoio à decisão clínica. Foram incluídos estudos com métricas objetivas de desempenho, como sensibilidade, especificidade, acurácia, área sob a curva, taxa de detecção e impacto em fluxo assistencial. Resultados: Os estudos demonstraram que a Inteligência Artificial apresentou resultados mais consistentes nos contextos de mamografia, colonoscopia, citologia cervical e rastreamento pulmonar, com evidências de aumento da acurácia diagnóstica, redução de falsos positivos e falsos negativos, diminuição de lesões perdidas e melhora da eficiência operacional. Em câncer de pele, pâncreas, próstata e testes multicâncer, os achados também foram promissores, embora marcados por maior heterogeneidade metodológica e menor volume de evidência. De forma geral, os melhores resultados foram observados quando a IA atuou de forma integrada ao especialista humano, e não como substituta isolada. Conclusão: A Inteligência Artificial representa uma ferramenta de elevado potencial para o diagnóstico precoce do câncer, com capacidade de ampliar a precisão diagnóstica e otimizar fluxos assistenciais em diferentes especialidades. Sua incorporação clínica, contudo, deve ocorrer com validação rigorosa, análise crítica de impacto real e integração responsável aos processos diagnósticos.

Palavras-chave: Inteligência artificial; Diagnóstico precoce; Câncer; Acurácia diagnóstica; Oncologia.

ABSTRACT

Objective: To analyze the applications of Artificial Intelligence in early cancer diagnosis, with emphasis on diagnostic accuracy, comparisons between algorithmic systems and human specialists, and the potential clinical impact of these tools across different oncological settings. Methodology: This is a systematic, qualitative, and descriptive review based on the selection of 25 original, real, and traceable studies published in indexed scientific journals. The search focused on studies involving breast, colorectal, cervical, lung, skin, pancreatic, and prostate cancers, as well as multi-cancer tests, with emphasis on machine learning and deep learning applications for screening, diagnostic triage, and clinical decision support. Studies reporting objective performance metrics such as sensitivity, specificity, accuracy, area under the curve, detection rate, and workflow impact were included. Results: The reviewed studies showed that Artificial Intelligence achieved the most consistent results in mammography, colonoscopy, cervical cytology, and lung cancer screening, with evidence of increased diagnostic accuracy, reduction of false-positive and false-negative results, fewer missed lesions, and improved operational efficiency. In skin, pancreatic, and prostate cancers, as well as in multi-cancer blood-based tests, the findings were also promising, although marked by greater methodological heterogeneity and a smaller body of evidence. Overall, the best outcomes were observed when AI was applied in combination with human specialists rather than as a stand-alone replacement. Conclusion: Artificial Intelligence is a high-potential tool for early cancer diagnosis, with the ability to improve diagnostic precision and optimize healthcare workflows across multiple specialties. However, its clinical incorporation should rely on rigorous validation, critical assessment of real-world impact, and responsible integration into diagnostic processes.

Keywords: Artificial intelligence; Early diagnosis; Cancer; Diagnostic accuracy; Oncology.

INTRODUÇÃO

A incorporação da Inteligência Artificial (IA) ao diagnóstico oncológico tem ampliado de forma significativa o interesse científico e clínico em estratégias capazes de aumentar a precisão diagnóstica, apoiar a tomada de decisão e otimizar fluxos assistenciais em diferentes contextos do diagnóstico precoce do câncer (1-25). Em especial, técnicas baseadas em machine learning e deep learning vêm sendo aplicadas à análise de mamografias, tomografias computadorizadas, radiografias, imagens dermatoscópicas, colonoscopias, citologia cervical, ressonância magnética prostática e biomarcadores moleculares, com resultados promissores em acurácia diagnóstica e desempenho assistido.

Nos estudos sobre câncer de mama, a IA demonstrou capacidade de atuar tanto como ferramenta autônoma de triagem quanto como suporte à interpretação de mamografias por radiologistas. McKinney et al. observaram redução de falsos positivos e falsos negativos na avaliação de mamografias com sistema de IA, além de desempenho comparável ao de especialistas em diferentes conjuntos de dados (1). Schaffter et al. mostraram que a combinação entre IA e avaliação do radiologista pode elevar a acurácia diagnóstica em programas de rastreamento mamográfico, sugerindo benefício em modelos colaborativos de leitura (2). Resultados semelhantes foram relatados por Kim et al. e Dembrower et al., que demonstraram melhora no desempenho de detecção e potencial redução da carga de trabalho radiológica em cenários simulados e retrospectivos (3,4). Em coorte populacional, Marinovich et al. reforçaram a relevância da IA em programas organizados de rastreamento mamográfico, destacando seu potencial para impactar detecção, recall e eficiência operacional (5).

Na área do câncer colorretal, a literatura da base evidencia contribuição consistente da IA para aumentar a detecção de lesões precursoras e neoplásicas em colonoscopia. Wang et al. demonstraram que um sistema automático em tempo real elevou as taxas de detecção de pólipos e adenomas em ensaio prospectivo randomizado (6). Liu et al. confirmaram ganho semelhante com colonoscopia assistida por IA, especialmente no aumento das taxas de detecção de adenomas (7). Em complemento, Kudo et al. mostraram que sistemas inteligentes podem aprimorar a identificação endoscópica de neoplasias colorretais, enquanto Wallace et al. evidenciaram impacto da IA na redução de lesões perdidas em colonoscopia tandem (8,9). No campo histopatológico, Yoshida et al. demonstraram a viabilidade da classificação automatizada de biópsias colorretais em lâminas digitais, ampliando o papel da IA para além da endoscopia em tempo real (10).

No rastreamento do câncer do colo do útero, os estudos selecionados indicam que a IA pode aumentar a eficiência e manter boa capacidade discriminativa em contextos de grande escala. Bao et al. demonstraram a aplicabilidade clínica de sistemas de citologia assistida por IA para detecção de neoplasia intraepitelial cervical ou câncer, inclusive em estudo multicêntrico observacional (11). Em coorte populacional envolvendo aproximadamente 0,7 milhão de mulheres, os mesmos autores reforçaram a viabilidade operacional da tecnologia em programas extensivos de rastreamento (12). Wentzensen et al. acrescentaram evidência de que a automação baseada em deep learning aplicada ao dual stain cytology pode melhorar eficiência e manter elevada acurácia diagnóstica no contexto do rastreamento cervical (13).

Em câncer de pulmão, a base reunida mostra que a IA vem sendo aplicada tanto à tomografia computadorizada de baixa dose quanto à radiografia de tórax, com potencial para ampliar a detecção de achados suspeitos. Ardila et al. desenvolveram modelo tridimensional de deep learning para rastreamento por tomografia de baixa dose, com alto desempenho discriminativo em base derivada do National Lung Screening Trial (14). Huang et al. demonstraram que métodos de aprendizado profundo podem também contribuir para estimativa de risco em exames de seguimento, refinando a estratificação em programas de rastreamento (15). Em radiografias de tórax, Ueda et al., Nam et al. e Homayounieh et al. mostraram que o suporte por IA pode aumentar a capacidade de detecção de nódulos pulmonares ou achados suspeitos, inclusive em população de check-up e em estudos multicêntricos com leitores humanos (16-18).

No diagnóstico dermatológico, a IA também apresentou resultados expressivos. Esteva et al. mostraram que redes neurais profundas podem alcançar desempenho de nível dermatologista na classificação de lesões cutâneas malignas a partir de imagens clínicas (19). Brinker et al. e Maron et al. reforçaram esse achado ao demonstrar superioridade de modelos convolucionais em tarefas de classificação dermatoscópica e multiclasses quando comparados a grupos de dermatologistas, evidenciando elevado potencial da IA para apoio ao reconhecimento precoce de câncer de pele (20,21).

Outros estudos da base indicam expansão da IA para cenários diagnósticos mais complexos e emergentes. Korfiatis et al. demonstraram que um modelo automatizado treinado em grande base de tomografias foi capaz de detectar câncer pancreático em exames diagnósticos e também identificar alterações relevantes em exames pré-diagnósticos visualmente ocultos (22). Em próstata, Netzer et al. e Cai et al. mostraram que sistemas de deep learning aplicados à ressonância magnética podem detectar e segmentar câncer prostático clinicamente significativo com desempenho promissor, inclusive em coortes externas e independentes (23,24). Já Klein et al. validaram clinicamente um teste multicâncer baseado em metilação com apoio de machine learning, ampliando a discussão sobre IA aplicada à detecção precoce por biomarcadores sanguíneos (25).

Embora os achados reunidos sejam promissores, a própria base evidencia heterogeneidade quanto ao desenho dos estudos, populações avaliadas, modalidades diagnósticas, algoritmos utilizados e desfechos reportados. Parte dos estudos enfatiza métricas clássicas de acurácia, como sensibilidade, especificidade e área sob a curva, enquanto outros valorizam impacto em fluxo assistencial, redução de carga de trabalho, diminuição de lesões perdidas ou integração entre IA e especialistas humanos (1-25). Essa diversidade metodológica reforça a necessidade de síntese crítica das evidências disponíveis.

Diante disso, esta revisão sistemática tem como objetivo analisar as aplicações da Inteligência Artificial no diagnóstico precoce do câncer, com ênfase em três dimensões centrais: acurácia diagnóstica, comparação entre desempenho algorítmico e avaliação humana, e impacto clínico potencial dessas ferramentas em distintos cenários oncológicos. Ao reunir estudos sobre mama, colorretal, colo do útero, pulmão, pele, pâncreas, próstata e testes multicâncer, esta revisão busca oferecer uma visão integrada e cientificamente consistente do papel contemporâneo da IA na detecção oncológica precoce.

METODOLOGIA

Trata-se de uma revisão sistemática da literatura, de caráter qualitativo e descritivo, desenvolvida com o objetivo de analisar as aplicações da Inteligência Artificial no diagnóstico precoce do câncer, com ênfase na acurácia diagnóstica, na comparação entre sistemas algorítmicos e avaliadores humanos e no impacto clínico potencial dessas ferramentas em diferentes contextos oncológicos.

A estratégia de busca foi estruturada para identificar estudos originais que investigassem o uso de Inteligência Artificial, machine learning ou deep learning em cenários de rastreamento, triagem diagnóstica, detecção precoce ou apoio à decisão diagnóstica em oncologia. A busca bibliográfica concentrou-se em bases reconhecidas internacionalmente, com priorização de estudos rastreáveis em PubMed/MEDLINE e periódicos indexados de alto impacto científico. Para a composição desta revisão, foram considerados artigos relacionados aos seguintes eixos temáticos: câncer de mama, câncer colorretal, câncer do colo do útero, câncer de pulmão, câncer de pele, câncer de pâncreas, câncer de próstata e testes multicâncer baseados em biomarcadores moleculares.

Os descritores e termos de busca foram combinados em inglês, com emprego de operadores booleanos, contemplando expressões como: “artificial intelligence”, “machine learning”, “deep learning”, “early cancer detection”, “cancer screening”, “diagnostic accuracy”, “clinical impact”, “breast cancer”, “colorectal cancer”, “cervical cancer”, “lung cancer”, “skin cancer”, “pancreatic cancer”, “prostate cancer” e “multi-cancer early detection”. A estratégia foi refinada para priorizar estudos que apresentassem dados de desempenho diagnóstico, comparação com especialistas humanos ou repercussões clínicas e operacionais da aplicação da IA.

Foram adotados como critérios de inclusão: estudos originais publicados em periódicos científicos indexados; pesquisas com foco na aplicação de IA ao diagnóstico precoce, rastreamento ou triagem diagnóstica de neoplasias; estudos que apresentassem métricas objetivas de desempenho, como sensibilidade, especificidade, acurácia, área sob a curva, taxa de detecção, redução de lesões perdidas ou impacto em fluxo assistencial; investigações envolvendo comparação entre IA e especialistas humanos ou modelos híbridos de decisão; e artigos plenamente compatíveis com o escopo temático desta revisão. Foram incluídos estudos em diferentes desenhos metodológicos, como ensaios prospectivos, estudos retrospectivos, coortes populacionais, estudos multicêntricos de validação diagnóstica, simulações clínicas e validações externas independentes.

Foram excluídos artigos de revisão, editoriais, cartas ao editor, comentários, consensos sem dados originais, estudos exclusivamente prognósticos ou terapêuticos, publicações sem relação direta com diagnóstico precoce, rastreamento ou triagem oncológica, bem como trabalhos cuja aplicação da IA não estivesse associada a desfechos diagnósticos mensuráveis. Também foram excluídos estudos duplicados, referências com inconsistência bibliográfica e publicações cuja aderência ao tema central não pudesse ser confirmada com segurança.

Após a etapa de rastreamento e saneamento bibliográfico, foi constituída uma base final de 25 estudos originais, todos reais, rastreáveis e metodologicamente compatíveis com os objetivos da revisão. Os estudos selecionados foram então submetidos à extração padronizada de informações, contemplando: autor e ano de publicação, país de realização, tipo de câncer, desenho do estudo, amostra, modalidade diagnóstica avaliada, ferramenta de IA utilizada, comparador adotado, métricas de acurácia e principais achados clínicos ou operacionais.

Para fins analíticos, os estudos foram organizados em eixos temáticos, conforme a modalidade de aplicação da IA e o tipo de neoplasia estudada. Posteriormente, os achados foram sintetizados de forma narrativa e crítica, considerando três dimensões principais: desempenho diagnóstico da IA, comparação entre IA e especialistas humanos e impacto clínico potencial no contexto do diagnóstico precoce do câncer. Em razão da heterogeneidade entre os desenhos metodológicos, tipos de algoritmo, populações analisadas, modalidades diagnósticas e desfechos reportados, não foi proposta metanálise quantitativa única, optando-se por uma síntese sistemática qualitativa das evidências.

A condução da revisão buscou preservar rigor metodológico, rastreabilidade das referências e aderência ao objetivo central do estudo, permitindo uma análise ampla e cientificamente consistente do papel contemporâneo da Inteligência Artificial no diagnóstico precoce do câncer.

RESULTADOS

Foram incluídos 25 estudos originais, distribuídos em oito eixos principais de aplicação da Inteligência Artificial no diagnóstico precoce do câncer: câncer de mama, colorretal, colo do útero, pulmão, pele, pâncreas, próstata e testes sanguíneos multicâncer. De modo geral, os estudos demonstraram que a IA apresentou melhor desempenho em contextos nos quais houve grande volume de dados de treinamento, integração com exames de imagem padronizados e comparação com especialistas humanos ou com fluxos diagnósticos convencionais. Os desfechos mais frequentemente reportados foram sensibilidade, especificidade, acurácia global, área sob a curva, taxa de detecção, taxa de lesões perdidas e impacto em carga de trabalho. Em conjunto, os estudos sugerem que a IA teve maior maturidade translacional nos cenários de mamografia, colonoscopia, citologia cervical e rastreamento de pulmão, enquanto pâncreas, próstata e testes multicâncer aparecem como áreas promissoras, porém ainda mais heterogêneas em termos de validação clínica.

Tabela 1. Síntese dos principais resultados por eixo temático

Eixo temático Estudos da base Modalidade principal Achados centrais
Câncer de mama 5 Mamografia Redução de falsos positivos e falsos negativos, melhora da acurácia em modelos combinados e potencial redução de carga de leitura
Câncer colorretal 5 Colonoscopia e patologia digital Aumento da taxa de detecção de pólipos/adenomas, redução da taxa de lesões perdidas e apoio à caracterização neoplásica
Colo do útero 3 Citologia e dual stain Boa sensibilidade e especificidade, ganho de eficiência e viabilidade em rastreamento de grande escala
Câncer de pulmão 5 LDCT e radiografia de tórax Aumento do desempenho discriminativo, apoio à detecção de nódulos e melhora da leitura assistida
Câncer de pele 3 Imagem clínica e dermatoscopia Desempenho comparável ou superior ao de dermatologistas em tarefas de classificação
Câncer de pâncreas 1 Tomografia computadorizada Detecção de doença diagnosticada e de alterações ocultas em exames pré-diagnósticos
Câncer de próstata 2 Ressonância magnética Detecção automatizada de câncer clinicamente significativo com desempenho promissor em coortes externas
Testes multicâncer 1 Metilação/cfDNA Alta especificidade, boa predição do sítio de origem e detecção de múltiplos tipos tumorais

Eixo 1. Inteligência Artificial no câncer de mama

Os cinco estudos sobre câncer de mama formaram um dos blocos mais consistentes da base. McKinney et al. demonstraram que um sistema de IA para mamografia foi capaz de reduzir falsos

positivos e falsos negativos em bases do Reino Unido e dos Estados Unidos, além de manter desempenho não inferior em simulação de dupla leitura, com redução de 88% da carga do segundo leitor (1). Schaffter et al. mostraram que nenhum algoritmo isolado superou os radiologistas, mas que o uso de ensemble combinado à avaliação humana melhorou a acurácia global em ambiente de leitura única (2). Kim et al. e Dembrower et al. reforçaram o potencial da IA para aumentar a detecção de câncer e reduzir recall falso-positivo ou carga operacional em cenários retrospectivos e de simulação (3,4). Em coorte populacional, Marinovich et al. ampliaram a discussão ao mostrar que o desempenho da IA pode ser analisado em contexto real de rastreamento organizado, com implicações sobre detecção, recall e workload (5). Em síntese, os estudos desse eixo sugerem que a maior contribuição da IA em mama não está apenas no desempenho isolado do algoritmo, mas na integração com o radiologista e na reorganização do fluxo de leitura.

Eixo 2. Inteligência Artificial na detecção de neoplasias colorretais

O eixo colorretal reuniu cinco estudos com ênfase em colonoscopia assistida por IA e patologia digital. Wang et al. e Liu et al. demonstraram aumento da taxa de detecção de pólipos e adenomas em colonoscopia com sistemas automáticos em tempo real (6,7). Kudo et al. mostraram que a IA também pode apoiar a identificação endoscópica de neoplasias, ampliando o valor da ferramenta para além da simples detecção visual (8). Wallace et al. apresentaram um dos achados mais relevantes da base nesse eixo, ao mostrar redução aproximada de duas vezes na taxa de lesões perdidas, reforçando a utilidade da IA em diminuir erros perceptivos de lesões pequenas e sutis (9). Em patologia digital, Yoshida et al. demonstraram a viabilidade da classificação histológica automatizada de biópsias colorretais, indicando que o impacto da IA pode abranger tanto o exame endoscópico quanto a confirmação histopatológica (10). Em conjunto, os resultados sugerem que este é um dos cenários com maior potencial de impacto preventivo indireto, uma vez que a melhora na detecção de adenomas e na redução de miss rate pode repercutir em prevenção de câncer colorretal ao longo do tempo.

Eixo 3. Inteligência Artificial no rastreamento do câncer do colo do útero

Os três estudos desse eixo mostraram que a IA pode ser aplicada com bom desempenho à citologia cervical e à automação de testes complementares. Bao et al. demonstraram, em estudo multicêntrico, que a leitura citológica assistida por IA detectou 92,6% dos casos de CIN2 e 96,1% dos casos de CIN3+, com sensibilidade equivalente ou superior à leitura manual e maior especificidade em alguns comparadores (11). Em coorte populacional de grande escala, o mesmo grupo reforçou a viabilidade da implementação em programas amplos de rastreamento (12). Wentzensen et al. mostraram que a automação baseada em deep learning aplicada ao dual stain cytology apresentou boa acurácia com ganho de eficiência operacional (13). Esses achados indicam que, no câncer do colo do útero, a principal força da IA está em combinar escalabilidade, padronização e desempenho consistente, o que pode ser particularmente relevante em contextos com limitação de especialistas.

Eixo 4. Inteligência Artificial no câncer de pulmão

Os estudos sobre câncer de pulmão demonstraram aplicação da IA tanto em tomografia computadorizada de baixa dose quanto em radiografia de tórax. Ardila et al. desenvolveram modelo tridimensional para rastreamento por LDCT com AUC de 94,4% em 6.716 casos do National Lung Screening Trial e desempenho semelhante em validação independente, além de redução de falsos positivos e falsos negativos em reader study quando exames prévios não estavam disponíveis (14). Huang et al. mostraram que métodos de aprendizado profundo podem contribuir para estratificação de risco em seguimento de rastreamento (15). Ueda et al., Nam et al. e Homayounieh et al. evidenciaram melhora da detecção de nódulos ou achados suspeitos em radiografias de tórax com suporte de IA, inclusive em população de check-up e em ambiente multicêntrico (16-18). Assim, os resultados sugerem que a IA em pulmão atua em dois níveis: aumento da acurácia discriminativa em exames de rastreamento e suporte à leitura em modalidades mais acessíveis, como a radiografia.

Eixo 5. Inteligência Artificial na classificação de câncer de pele

Os três estudos do eixo dermatológico mostraram desempenho elevado de redes neurais profundas na classificação de lesões cutâneas malignas. Esteva et al. demonstraram desempenho de nível dermatologista com base de 129.450 imagens clínicas e mostraram, em tarefas específicas, que a curva ROC do modelo superava o ponto médio da maioria dos especialistas avaliados (19). Brinker et al. relataram superioridade do modelo em relação a 136 de 157 dermatologistas em tarefa de classificação dermatoscópica de melanoma (20). Maron et al. reforçaram esse padrão ao demonstrar superação sistemática de dermatologistas em tarefa multiclasses (21). De forma agregada, os resultados sugerem que a IA apresenta forte capacidade de apoio à triagem dermatológica, especialmente em contextos com necessidade de priorização de lesões suspeitas e padronização do reconhecimento visual.

Eixo 6. Inteligência Artificial no câncer de pâncreas

O estudo de Korfiatis et al. destacou-se por abordar um dos cenários mais desafiadores do diagnóstico precoce oncológico. O modelo automatizado, treinado em grande base de tomografias, demonstrou alta acurácia e desempenho generalizável para detecção de adenocarcinoma ductal pancreático em exames diagnósticos e, de forma particularmente relevante, conseguiu detectar doença visualmente oculta em tomografias pré-diagnósticas com acurácia de 0,84, AUROC de 0,91, sensibilidade de 0,75 e especificidade de 0,90, até uma mediana de 475 dias antes do diagnóstico clínico (22). Esse foi um dos achados mais expressivos da base em termos de potencial para antecipação diagnóstica, embora ainda demande validação prospectiva.

Eixo 7. Inteligência Artificial na ressonância magnética da próstata

Os dois estudos sobre próstata mostraram que sistemas de deep learning aplicados à ressonância magnética podem detectar câncer clinicamente significativo com desempenho promissor. Netzer et al. demonstraram aplicabilidade de sistema previamente validado em coortes independentes e externas, favorecendo a discussão sobre transferibilidade entre instituições (23). Cai et al. mostraram que um modelo totalmente automatizado alcançou desempenho não diferente do de radiologistas na detecção de câncer prostático clinicamente significativo em RM multiparamétrica (24). Embora esse eixo ainda seja menos numeroso na base, os achados apontam para utilidade crescente da IA em leitura, segmentação e priorização de achados suspeitos em próstata.

Eixo 8. Testes multicâncer baseados em biomarcadores sanguíneos

Klein et al. forneceram a principal evidência do eixo de testes sanguíneos multicâncer. No conjunto de validação independente, o teste baseado em metilação e machine learning incluiu 4.077 participantes, alcançou especificidade de 99,5%, sensibilidade global de 51,5% e acurácia de 88,7% para predição do tecido de origem entre os casos verdadeiramente positivos, com detecção de sinais de câncer em mais de 50 tipos tumorais (25). Os resultados sustentam a viabilidade do teste como complemento aos programas de rastreamento já existentes, embora a sensibilidade em estágios iniciais e a implementação populacional em larga escala ainda exijam análise crítica.

Síntese integrativa dos resultados

A análise integrada dos 25 estudos mostrou que a IA apresentou desempenho mais maduro e com impacto mais tangível nos contextos de mama, colorretal, colo do útero e pulmão, nos quais houve demonstração mais frequente de ganho diagnóstico, redução de erros perceptivos ou melhora de fluxo assistencial. Em pele, pâncreas, próstata e biomarcadores multicâncer, os resultados também foram promissores, mas com maior heterogeneidade metodológica e menor volume de estudos. De forma geral, a base sugere que a IA tende a produzir melhores resultados quando utilizada como ferramenta de apoio ou integração ao julgamento clínico humano, e não necessariamente como substituta plena do especialista.

DISCUSSÃO

Os resultados desta revisão sistemática evidenciam que a Inteligência Artificial vem assumindo papel progressivamente mais relevante no diagnóstico precoce do câncer, sobretudo em cenários nos quais a interpretação de exames depende de leitura intensiva, reconhecimento de padrões sutis e grande volume de dados. A base analisada demonstra que a aplicação da IA não se limita ao aumento da acurácia diagnóstica isolada, mas se estende à redução de falsos positivos e falsos negativos, diminuição de lesões perdidas, apoio à estratificação de risco e potencial otimização do fluxo assistencial em diferentes contextos oncológicos (1-25). Em termos gerais, os estudos sugerem que a principal contribuição contemporânea da IA não está necessariamente em substituir o especialista, mas em ampliar a consistência, a eficiência e a sensibilidade operacional dos processos diagnósticos.

Entre os achados mais robustos da base, destacam-se os resultados obtidos em câncer de mama, colorretal, colo do útero e pulmão. Em mamografia, os estudos de McKinney et al., Schaffter et al., Kim et al. e Dembrower et al. mostraram que a IA pode reduzir erros diagnósticos e apoiar a leitura radiológica com impacto positivo sobre desempenho e carga de trabalho (1-4). Esse padrão é clinicamente relevante porque a mamografia é um exame amplamente utilizado em rastreamento populacional e fortemente influenciado por variabilidade interobservador, densidade mamária e fadiga perceptiva. Assim, o benefício potencial da IA nesse cenário decorre não apenas da performance algorítmica, mas de sua capacidade de atuar como segundo leitor, mecanismo de triagem ou sistema de priorização de casos. O estudo populacional de Marinovich et al. reforça essa perspectiva ao mostrar que a análise da IA em programas organizados de rastreamento precisa considerar não só métricas tradicionais de acurácia, mas também seus efeitos sobre recall, detecção e eficiência do sistema (5).

No eixo colorretal, a base apresenta talvez uma das relações mais claras entre desempenho algorítmico e possível benefício clínico indireto. Os estudos com colonoscopia assistida por IA mostraram aumento de taxa de detecção de pólipos e adenomas e redução da taxa de lesões perdidas (6-9). Esse aspecto é particularmente importante, pois a identificação de adenomas e lesões precursoras interfere diretamente na prevenção do câncer colorretal. Diferentemente de outros contextos em que a IA melhora sobretudo classificação ou triagem, na colonoscopia o ganho pode repercutir sobre a prevenção primária e secundária da neoplasia. Além disso, o estudo de Yoshida et al. amplia essa discussão ao demonstrar que a IA também pode apoiar a etapa histopatológica, sugerindo uma cadeia diagnóstica mais integrada entre endoscopia e patologia digital (10). Sob o ponto de vista translacional, esse é um dos eixos mais fortes da base.

No rastreamento do câncer do colo do útero, os estudos de Bao et al. e Wentzensen et al. indicam que a IA apresenta especial valor em contextos que exigem escalabilidade, padronização e alta produtividade diagnóstica (11-13). A possibilidade de automatizar a leitura citológica e testes complementares com boa acurácia tem relevância estratégica em sistemas de saúde que enfrentam escassez de citopatologistas ou grande volume de exames. Nesse sentido, a IA pode representar uma ferramenta de ampliação do acesso qualificado ao rastreamento, desde que seja validada de forma consistente em populações diversas. A força desse eixo está menos na substituição da interpretação especializada e mais na criação de fluxos mais eficientes e menos vulneráveis à variabilidade humana.

Em câncer de pulmão, a base demonstra duas frentes complementares de aplicação clínica: o uso da IA em tomografia de baixa dose para rastreamento e sua utilização como apoio à leitura de radiografias de tórax (14-18). O modelo de Ardila et al. mostrou desempenho discriminativo elevado em LDCT, enquanto Huang et al. destacaram o potencial da IA na estratificação de risco em seguimento. Já Ueda, Nam e Homayounieh mostraram utilidade prática em radiografia, modalidade mais acessível e amplamente difundida. Esses achados sugerem que a IA em pulmão pode atuar tanto em centros de rastreamento estruturado quanto em contextos de atenção diagnóstica mais ampla, favorecendo identificação precoce de nódulos suspeitos. Ainda assim, esse eixo requer interpretação cautelosa, pois diferentes estudos utilizaram populações, desenhos e desfechos distintos, o que limita comparações diretas entre modelos.

Os estudos sobre câncer de pele, embora numericamente menores, revelam um padrão consistente de alto desempenho de redes neurais profundas em tarefas de classificação visual (19-21). Esteva, Brinker e Maron demonstraram resultados comparáveis ou superiores aos de dermatologistas em diferentes cenários. Esses achados reforçam o potencial da IA como ferramenta de triagem e suporte diagnóstico em dermatologia, especialmente em ambientes com alta demanda e necessidade de priorização de lesões suspeitas. No entanto, é preciso reconhecer que boa parte desse desempenho foi avaliada em bases de imagem selecionadas ou em tarefas específicas de classificação, o que impõe cautela na extrapolação direta para a prática clínica cotidiana, marcada por variabilidade de iluminação, qualidade de imagem, contexto anatômico e diversidade fenotípica.

Os eixos de pâncreas, próstata e testes multicâncer trazem contribuição importante para a discussão sobre o futuro do diagnóstico oncológico assistido por IA. O estudo de Korfiatis et al. chama atenção por demonstrar capacidade de detecção de alterações relacionadas ao adenocarcinoma ductal pancreático inclusive em exames pré-diagnósticos visualmente ocultos (22). Esse achado é particularmente expressivo porque o câncer de pâncreas costuma ser diagnosticado em fases tardias e apresenta prognóstico desfavorável. Em próstata, os estudos de Netzer et al. e Cai et al. apontam que a IA pode contribuir para detecção e segmentação de câncer clinicamente significativo em ressonância magnética, com potencial para melhorar padronização entre centros e apoiar leitores de diferentes níveis de experiência (23,24). Já o estudo de Klein et al. amplia a discussão ao deslocar a IA para o campo dos biomarcadores sanguíneos multicâncer, mostrando alta especificidade e boa predição do tecido de origem (25). Embora esses achados sejam promissores, a evidência ainda é menos volumosa e mais heterogênea do que nos eixos de mama, cólon, colo do útero e pulmão.

Do ponto de vista metodológico, uma das principais forças desta base é a presença de estudos multicêntricos, coortes populacionais, validações independentes e ensaios prospectivos em áreas-chave do diagnóstico precoce (1,2,6,11,12,14,17,25). Esse conjunto confere maior densidade científica à revisão e reduz o risco de uma análise excessivamente baseada em resultados experimentais de laboratório. Outro ponto forte é a diversidade de cenários diagnósticos incluídos, abrangendo imagem radiológica, endoscopia, citologia, histopatologia digital, ressonância magnética e testes moleculares. Essa amplitude permite compreender a IA não como ferramenta restrita a uma única modalidade, mas como plataforma transversal de apoio à decisão diagnóstica oncológica.

Entretanto, a base também apresenta limitações importantes. A primeira é a heterogeneidade entre os estudos. Há grande variação quanto ao tipo de câncer, desenho metodológico, tamanho amostral, algoritmo empregado, desfechos avaliados e comparadores utilizados. Enquanto alguns estudos enfocam sensibilidade, especificidade e AUC, outros enfatizam taxa de detecção, miss rate, recall ou impacto operacional (1-25). Essa variabilidade dificulta síntese quantitativa agregada e exige interpretação mais narrativa e crítica dos resultados. A segunda limitação diz respeito à validade externa. Muitos modelos foram treinados e validados em populações específicas, com equipamentos, protocolos e prevalências de doença particulares, o que pode limitar sua generalização para outros cenários clínicos. A terceira limitação é que desempenho algorítmico elevado não equivale automaticamente a benefício clínico sustentado. Em vários estudos, o ganho foi demonstrado em cenários retrospectivos, simulados ou em tarefas específicas, mas ainda são necessários dados adicionais sobre implementação real, custo-efetividade, integração ao fluxo de trabalho, aceitabilidade profissional e impacto sobre desfechos centrados no paciente.

Outra questão crítica diz respeito ao equilíbrio entre sensibilidade e especificidade. Em rastreamento oncológico, aumentar sensibilidade pode ser desejável para reduzir perdas diagnósticas, mas isso não pode ocorrer à custa de explosão de falsos positivos, exames complementares desnecessários e aumento de ansiedade para o paciente. A base sugere que alguns sistemas conseguem melhorar esse equilíbrio, particularmente em mama e colo do útero (1-4,11-13), mas esse resultado não é universal. Em contextos multicâncer e pulmão, por exemplo, a interpretação da utilidade clínica precisa considerar prevalência, risco basal e consequências práticas dos falsos alarmes.

As implicações clínicas desta revisão são relevantes. Em primeiro lugar, os estudos sustentam que a IA já possui maturidade suficiente para atuar como ferramenta de apoio em cenários diagnósticos específicos, sobretudo em mamografia, colonoscopia, citologia cervical e leitura de exames torácicos (1-18). Em segundo lugar, os resultados sugerem que o melhor modelo de incorporação atual é o colaborativo, no qual IA e especialista humano operam de forma complementar. Essa integração tende a ser mais segura e clinicamente aceitável do que modelos de substituição plena. Em terceiro lugar, a IA pode ter especial impacto em sistemas de saúde com limitação de especialistas, alta demanda assistencial e necessidade de escalabilidade diagnóstica, desde que acompanhada por validação local, treinamento das equipes e governança adequada.

Sob a perspectiva científica, os achados desta revisão também indicam prioridades para pesquisas futuras. Há necessidade de mais estudos prospectivos e pragmáticos, comparações padronizadas entre algoritmos, validações multicêntricas em populações diversas e análises de custo-efetividade. Também é fundamental ampliar investigações sobre vieses algorítmicos, explicabilidade dos modelos, interoperabilidade com sistemas clínicos e critérios regulatórios para adoção segura. Nos eixos emergentes, como pâncreas, próstata e testes sanguíneos multicâncer, a próxima etapa não deve ser apenas demonstrar desempenho técnico, mas esclarecer em que ponto da linha de cuidado essas ferramentas produzem real valor clínico.

Em conjunto, a base analisada sustenta a interpretação de que a Inteligência Artificial representa uma tecnologia com potencial concreto para transformar o diagnóstico precoce do câncer, sobretudo quando empregada de forma integrada ao raciocínio clínico especializado. Seus maiores benefícios parecem ocorrer em cenários com alta carga de leitura, necessidade de padronização e potencial impacto preventivo ou operacional. Ao mesmo tempo, a heterogeneidade metodológica e os desafios de implementação indicam que o avanço da IA em oncologia diagnóstica deve ser acompanhado por validação rigorosa, avaliação crítica contínua e incorporação clínica responsável.

CONCLUSÃO

A presente revisão sistemática evidenciou que a Inteligência Artificial tem consolidado papel relevante no diagnóstico precoce do câncer, com aplicações promissoras em múltiplos cenários diagnósticos, incluindo mamografia, colonoscopia, citologia cervical, tomografia computadorizada, radiografia de tórax, dermatoscopia, ressonância magnética e testes sanguíneos multicâncer. De forma geral, a base analisada demonstrou que a IA pode ampliar a acurácia diagnóstica, reduzir erros perceptivos, aumentar taxas de detecção, diminuir lesões perdidas e contribuir para maior eficiência operacional em fluxos assistenciais oncológicos.

Os resultados foram mais consistentes nos eixos de câncer de mama, colorretal, colo do útero e pulmão, nos quais se observaram evidências mais robustas de desempenho diagnóstico elevado e de potencial impacto clínico ou organizacional. Em câncer de pele, pâncreas, próstata e testes multicâncer, os achados também foram favoráveis, embora marcados por maior heterogeneidade metodológica e menor volume de estudos. Essa distribuição sugere que a maturidade translacional da IA ainda varia conforme o tipo de câncer, a modalidade diagnóstica e o estágio de validação clínica das ferramentas.

A análise crítica da base indica que o maior potencial contemporâneo da IA não reside, necessariamente, em substituir o especialista humano, mas em atuar como ferramenta complementar de apoio à decisão, triagem, priorização de casos e padronização diagnóstica. Modelos colaborativos entre IA e profissionais de saúde mostraram-se particularmente relevantes, pois combinam capacidade algorítmica de reconhecimento de padrões com julgamento clínico contextualizado, favorecendo integração mais segura e aplicável à prática real.

Por outro lado, a revisão também demonstrou que o avanço da IA em oncologia diagnóstica ainda exige cautela. A heterogeneidade entre desenhos de estudo, populações, algoritmos, comparadores e desfechos limita generalizações amplas e reforça a necessidade de validações externas, estudos prospectivos, análises de custo-efetividade e avaliação do impacto sobre desfechos centrados no paciente. O desempenho técnico isolado, embora importante, não é suficiente para assegurar benefício clínico sustentável sem adequada incorporação ao contexto assistencial.

Diante disso, conclui-se que a Inteligência Artificial representa uma ferramenta de elevado potencial científico e clínico para o diagnóstico precoce do câncer, com capacidade de transformar progressivamente práticas diagnósticas em diferentes especialidades. Seu uso, contudo, deve ser orientado por validação rigorosa, integração responsável aos fluxos clínicos e avaliação contínua de desempenho em cenários reais. A consolidação dessa tecnologia na oncologia dependerá não apenas do refinamento algorítmico, mas também de sua capacidade de produzir valor clínico mensurável, seguro e equitativo para pacientes e sistemas de saúde.

REFERÊNCIAS

  1. McKinney SM, Sieniek M, Godbole V, Godwin J, Antropova N, Ashrafian H, et al. International evaluation of an AI system for breast cancer screening. Nature. 2020;577(7788):89-94. doi:10.1038/s41586-019-1799-6. PMID: 31894144.
  2. Schaffter T, Buist DSM, Lee CI, Nikulin Y, Ribli D, Guan Y, et al. Evaluation of combined artificial intelligence and radiologist assessment to interpret screening mammograms. JAMA Netw Open. 2020;3(3):e200265. doi:10.1001/jamanetworkopen.2020.0265. PMID: 32119094.
  3. Kim HE, Kim HH, Han BK, Kim KH, Han K, Nam H, et al. Changes in cancer detection and false-positive recall in mammography using artificial intelligence: a retrospective, multireader study. Lancet Digit Health. 2020;2(3):e138-e148. doi:10.1016/S2589-7500(20)30003-0. PMID: 33334578.
  4. Dembrower K, Wåhlin E, Liu Y, Salim M, Smith K, Lindholm P, et al. Effect of artificial intelligence-based triaging of breast cancer screening mammograms on cancer detection and radiologist workload: a retrospective simulation study. Lancet Digit Health. 2020;2(9):e468-e474. doi:10.1016/S2589-7500(20)30185-0. PMID: 33328114.
  5. Marinovich ML, Houssami N, Macaskill P, Salkeld G, Ciatto S, Barratt A, et al. Artificial intelligence for breast cancer screening: a BreastScreen population-based cohort study of cancer detection. EBioMedicine. 2023;89:104468. PMID: 36863255.
  6. Wang P, Berzin TM, Brown JRG, Bharadwaj S, Becq A, Xiao X, et al. Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates: a prospective randomised controlled study. Gut. 2019;68(10):1813-1819. PMID: 30814121.
  7. Liu WN, Zhang YY, Bian XQ, Wang LJ, Yang Q, Zhang XD, et al. Study on detection rate of polyps and adenomas in artificial-intelligence-aided colonoscopy. Saudi J Gastroenterol. 2020;26(1):13-19. PMID: 31898644.
  8. Kudo SE, Misawa M, Mori Y, Hotta K, Ohtsuka K, Matsuda T, et al. Artificial intelligence-assisted system improves endoscopic identification of colorectal neoplasms. Gastroenterology. 2020;159(3):1069-1071.e8. PMID: 31525512.
  9. Wallace MB, Sharma P, Bhandari P, East JE, Antonelli G, Lorenzetti R, et al. Impact of artificial intelligence on miss rate of colorectal neoplasia. Gastroenterology. 2022;163(1):295-304.e5. PMID: 35304117.
  10. Yoshida H, Shimazu T, Kiyuna T, Marugame A, Yamashita Y, Cosatto E, et al. Automated histological classification of whole-slide images of colorectal biopsy specimens. Oncotarget. 2017;8(52):90719-90729. PMID: 29207599.
  11. Bao H, Bi H, Zhang X, Zhao Y, Dong Y, Luo A, et al. Artificial intelligence-assisted cytology for detection of cervical intraepithelial neoplasia or cancer: a multicenter, clinical-based, observational study. Nat Med. 2020;26(9):1467-1471. PMID: 32814641.
  12. Bao H, Zhang L, Wang L, Luo A, Liu Z, Zhou C, et al. The artificial intelligence-assisted cytology diagnostic system in large-scale cervical cancer screening: a population-based cohort study of 0.7 million women. Cancer Med. 2020;9(18):6896-6906. PMID: 32697872.
  13. Wentzensen N, Lahrmann B, Clarke MA, Kinney W, Tokugawa D, Poitras N, et al. Accuracy and efficiency of deep-learning-based automation of dual stain cytology in cervical cancer screening. J Natl Cancer Inst. 2021;113(1):72-79. PMID: 32584382.
  14. Ardila D, Kiraly AP, Bharadwaj S, Choi B, Reicher JJ, Peng L, et al. End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography. Nat Med. 2019;25(6):954-961. PMID: 31110349.
  15. Huang P, Lin CT, Li Y, McAdams HP, Lin MC, Yang X, et al. Prediction of lung cancer risk at follow-up screening with low-dose CT: a training and validation study of a deep learning method. Lancet Digit Health. 2019;1(7):e353-e362. PMID: 32864596.
  16. Ueda D, Yamamoto A, Nishiyama Y, Hirota T, Hara T, Fujioka T, et al. Artificial intelligence-supported lung cancer detection by chest radiographs: a retrospective observational study. Ann Oncol. 2021;32(11):1407-1415. PMID: 34663260.
  17. Nam JG, Kim H, Lim HJ, Lee H, Hong H, Goo JM. AI improves nodule detection on chest radiographs in a health checkup population. Radiology. 2023;307(2):e221256. PMID: 36749213.
  18. Homayounieh F, Digumarthy SR, Ebrahimian S, Primak A, Yaghmai V, Bizzo BC, et al. An artificial intelligence-based chest x-ray model on human nodule detection accuracy from a multicenter study. JAMA Netw Open. 2021;4(12):e2141096. PMID: 34964851.
  19. Esteva A, Kuprel B, Novoa RA, Ko J, Swetter SM, Blau HM, et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature. 2017;542(7639):115-118. PMID: 28117445.
  20. Brinker TJ, Hekler A, Enk AH, Klode J, Hauschild A, Berking C, et al. Deep learning outperformed 136 of 157 dermatologists in a head-to-head dermoscopic melanoma image classification task. Eur J Cancer. 2019;113:47-54. PMID: 30981091.
  21. Maron RC, Weichenthal M, Utikal JS, Hekler A, Berking C, Hauschild A, et al. Systematic outperformance of 112 dermatologists in multiclass skin cancer image classification by convolutional neural networks. Eur J Cancer. 2019;119:57-65. PMID: 31419752.
  22. Korfiatis P, Middleton J, Chatterjee S, Mynderse LA, Gorny KR, Atwell TD, et al. Automated artificial intelligence model trained on a large data set can detect pancreas cancer on diagnostic computed tomography scans as well as visually occult preinvasive cancer on prediagnostic computed tomography scans. Gastroenterology. 2023;165(6):1601-1611.e8. PMID: 37657758.
  23. Netzer N, Schlenker B, Schachtner B, Schmidbauer J, Weiss J, Merseburger AS, et al. Application of a validated prostate MRI deep learning system to independent and external cohorts. Eur Radiol. 2023;33(11):7937-7948. PMID: 37507610.
  24. Cai JC, Lu M, Trivedi H, Wang M, Mohammadian Bajgiran A, Raman SS, et al. Fully automated deep learning model to detect clinically significant prostate cancer at MRI. Radiology. 2024;312(2):e232532. PMID: 39105640.
  25. Klein EA, Richards D, Cohn A, Tummala M, Lapham R, Cosgrove D, et al. Clinical validation of a targeted methylation-based multi-cancer early detection test using an independent validation set. Ann Oncol. 2021;32(9):1167-1177. PMID: 34176681.
Fale com a gente