Usar IA no dia a dia não basta para detectar imagens deepfakes: a ciência já provou

João Miguel Pires Antunes • April 12, 2026 11:24

Um comboio é imobilizado de urgência em Inglaterra.

A fotografia de uma alegada catástrofe torna-se viral. Só mais tarde alguém se apercebe: aquela cena nunca aconteceu.

À medida que a inteligência artificial (IA) produz imagens cada vez mais verosímeis, governos, empresas e utilizadores comuns procuram formas de distinguir o que é real do que é fabricado. Um estudo recente, contudo, arrefece a expectativa de que “treinar o olhar” ou usar IA diariamente seja, por si só, a solução para o problema dos deepfakes.

Quando uma fotografia falsa paralisa comboios reais em Inglaterra

De madrugada, a 3 de Dezembro de 2025, um sismo atinge Lancaster, no noroeste de Inglaterra. Poucos minutos depois, começa a circular nas redes sociais a imagem de uma ponte ferroviária destruída. A fotografia parece tão credível que a operadora britânica decide suspender a circulação por precaução.

O resultado é imediato: 32 comboios ficam parados. Há passageiros retidos em estações. As perdas financeiras acumulam-se em milhares de libras. Horas depois, chega a confirmação: a ponte está intacta. A imagem era sintética, gerada por inteligência artificial.

O caso podia ser visto como um simples erro operacional. Mas revela algo mais fundo: uma imagem falsa, com pormenores bem construídos, foi suficiente para influenciar decisões críticas em tempo real.

As fronteiras entre realidade e simulação tornaram-se tão ténues que uma única imagem plausível já consegue alterar rotas, orçamentos e decisões de segurança.

O que a ciência descobriu sobre identificar rostos falsos gerados por IA (deepfakes)

Motivados por episódios deste tipo, investigadores do Departamento de Psicologia da Universidade Vanderbilt, nos Estados Unidos, decidiram perceber por que motivo algumas pessoas parecem detectar deepfakes com facilidade, enquanto outras caem repetidamente em armadilhas visuais.

Para isso, criaram um teste próprio, o “AI Face Test”. A ideia era directa: avaliar a capacidade de voluntários para distinguir rostos reais de rostos gerados por IA e relacionar esse desempenho com outras aptidões cognitivas.

Usar IA no quotidiano não aumenta automaticamente a protecção

As conclusões contrariam o senso comum. A utilização frequente de ferramentas de IA não tornou os participantes melhores a identificar imagens falsas. Ter um QI elevado também não. E nem a experiência profissional em reconhecimento facial se mostrou decisiva.

O factor com maior poder preditivo foi outro: a capacidade de reconhecer objectos em geral. Pessoas com bom desempenho neste tipo de tarefa tendem a captar microinconsistências nas imagens sintéticas - pequenos “ruídos visuais” que raramente surgem em fotografias autênticas.

Segundo o estudo, a aptidão para notar detalhes subtis em qualquer tipo de objecto está fortemente associada à capacidade de sinalizar rostos gerados por IA.

Na prática, os cientistas destacaram três pontos:

A competência geral em reconhecimento de objectos previu melhor desempenho na detecção de faces falsas.
Quem se saiu bem manteve resultados consistentes em novos testes, sugerindo um traço relativamente estável.
Treinos técnicos de curta duração não produziram aumentos relevantes na performance média.

Uma aptidão mais próxima de “talento visual” do que de formação técnica

Os autores descrevem esta capacidade como uma competência visual ampla e, em grande medida, inata. Não é algo que se adquira apenas com cursos de tecnologia, nem apenas por “habituar o olho” a deepfakes.

Este tipo de aptidão já tinha sido relacionado, noutros trabalhos, com tarefas muito diferentes entre si:

Tarefa	Como a aptidão visual influencia
Identificação de nódulos em radiografias ao tórax	Distinguir padrões muito subtis em tecidos pulmonares
Classificação de células sanguíneas como cancerígenas	Detectar alterações mínimas em formas e texturas celulares
Leitura de notação musical complexa	Reconhecer símbolos variados e as suas relações em pouco tempo
Determinar o sexo a partir de imagens da retina	Interpretar pormenores visuais pouco óbvios para leigos

Em todas estas situações, destaca-se quem consegue discriminar objectos com elevada precisão. O estudo sobre deepfakes faciais encaixa no mesmo padrão.

Nem todos enfrentam o mesmo risco de desinformação visual

Os investigadores sublinham um aspecto sensível: as capacidades variam bastante na população. Há pessoas quase incapazes de notar diferenças entre um rosto real e um rosto sintético. Outras acertam com uma regularidade impressionante. E existe uma larga faixa intermédia que acerta muitas vezes, mas falha noutras.

Daqui resulta uma consequência desconfortável: duas pessoas com o mesmo nível de escolaridade, acesso às mesmas notícias e às mesmas aplicações podem ter vulnerabilidades muito distintas perante desinformação visual.

Uma parte da população, mesmo instruída, tende a confiar repetidamente em imagens falsas, simplesmente por limitações na percepção de detalhes visuais.

Para políticas públicas e para plataformas digitais, isto indica que campanhas genéricas de “literacia mediática” podem ter impacto limitado se ignorarem diferenças individuais na percepção.

A IA não é um antídoto automático contra a própria IA

Muitos apostam que a resposta será “mais tecnologia para vigiar a tecnologia”: filtros automáticos, detectores de deepfake, sistemas de verificação em escala. Estas ferramentas ajudam, mas o estudo aponta um limite pouco confortável dessa esperança.

Mesmo quem trabalha com IA diariamente não é, por definição, mais capaz de identificar imagens enganosas. A familiaridade com aplicações de geração de imagens, por exemplo, não se revelou um escudo fiável.

Isto sugere que delegar toda a validação em utilizadores “muito versados em tecnologia” pode ser frágil. Pode haver especialistas brilhantes em dados que não tenham o mesmo “olho” que, por exemplo, um bom patologista ou um músico treinado.

Riscos práticos: da política à saúde

Se uma parte da população é mais vulnerável do ponto de vista visual, alguns sectores ficam sob maior pressão. Em períodos eleitorais, fotografias fabricadas de candidatos em situações comprometedoras podem circular com força em grupos onde a maioria não detecta sinais de manipulação. Em crises climáticas ou em situações de desastre, imagens de pontes a colapsar ou edifícios em chamas podem provocar pânico e decisões precipitadas.

Na saúde, o cenário é ainda mais delicado. A IA já é usada para gerar imagens médicas sintéticas para treinar algoritmos. Misturar - por erro ou por intenção maliciosa - imagens reais e artificiais em contextos clínicos abre espaço a diagnósticos confusos. Profissionais com maior aptidão visual tendem a detectar incoerências; outros, não.

Um efeito lateral é organizacional: equipas que dependem de avaliação visual (por exemplo, moderação de conteúdos, análise forense de imagem, triagem de incidentes) podem beneficiar de processos que não assumam que “toda a gente vê o mesmo”. A redundância - várias validações independentes - passa a ser uma medida de segurança operacional.

Também se torna mais relevante a adopção de mecanismos de proveniência e autenticidade (por exemplo, registos de origem, assinaturas digitais e credenciais de conteúdo) para reduzir a dependência exclusiva do julgamento humano. Estas abordagens não eliminam o problema, mas acrescentam camadas verificáveis quando a percepção falha.

Conceitos que vale a pena clarificar

Dois termos surgem frequentemente nestas discussões e costumam gerar confusão.

O que é, na prática, um deepfake de imagem

Deepfake é um conteúdo visual (ou áudio) criado ou alterado com técnicas avançadas de IA, tipicamente com redes neuronais profundas. No caso de fotografias, o objectivo é fabricar rostos e cenas que pareçam captados por uma câmara, mas que nunca ocorreram. Actualmente, os geradores conseguem produzir expressões faciais convincentes, texturas realistas de pele e cenários com iluminação coerente.

Os indícios de falsificação tornaram-se mais discretos: erros em reflexos, pormenores em jóias, transições estranhas entre cabelo e fundo, artefactos em zonas pouco óbvias da imagem. Quem tem elevada capacidade de reconhecimento de objectos tende a detectar estes deslizes com mais rapidez.

O que significa “reconhecimento de objectos” neste contexto

No estudo, “reconhecimento de objectos” não é uma função de uma aplicação, mas uma capacidade humana. Refere-se a identificar rapidamente formas, padrões, texturas e relações espaciais em imagens variadas. Um exemplo simples: distinguir várias espécies de aves a partir de fotografias rápidas, ou detectar pequenas falhas em placas electrónicas.

Esta aptidão combina percepção visual fina, atenção ao detalhe e rapidez de análise. Pessoas com alto desempenho neste tipo de tarefas muitas vezes sentem que “há algo errado” numa imagem, mesmo antes de conseguirem explicar exactamente o quê.

Cenários futuros: testes de visão digital e equipas mistas

Com a proliferação de deepfakes, é plausível que empresas e organismos públicos adoptem algo semelhante a um “teste de visão digital”. Se tarefas críticas dependem de avaliar imagens ou vídeos suspeitos, pode fazer sentido formar equipas com pessoas cuja aptidão seja medida de forma objectiva.

Outra via é usar resultados de testes como o AI Face Test para melhorar detectores automáticos: perceber quais os padrões que os humanos com melhor desempenho identificam e tentar traduzir isso em critérios computacionais.

Para o público em geral, uma saída mais realista passa por uma combinação de hábitos: desconfiar de imagens “demasiado convenientes”, procurar confirmação em várias fontes, dar prioridade a conteúdos com contexto verificável e, sempre que possível, evitar decisões importantes com base numa única fotografia “explosiva”. Num ambiente em que nem todos vêem as mesmas falhas, criar camadas de verificação tornou-se rotina - não paranoia.