Skip to content
Caso de estudoPreçosSegurançaComparativoBlog

Europe

Americas

Oceania

Guia11 min de leitura

Documentos falsos com LLM e ChatGPT: a nova ameaça de fraude

ChatGPT e modelos de linguagem geram documentos textuais falsos indetectáveis. Como funciona esta ameaça, que documentos são falsificados e como proteger a sua organização.

Equipe CheckFile
Equipe CheckFile·
Illustration for Documentos falsos com LLM e ChatGPT: a nova ameaça de fraude — Guia

Resumir este artigo com

Os grandes modelos de linguagem (LLM) — ChatGPT, GPT-4o, Claude, Gemini — introduziram um vetor de fraude documental radicalmente novo: a geração de documentos textuais falsos coerentes, gramaticalmente perfeitos e contextualmente plausíveis, sem manipulação de imagens nem artefactos detectáveis. Onde outrora os falsificadores editavam imagens com o Photoshop, os defraudadores de 2026 ditam recibos de vencimento, contratos de trabalho e extratos bancários a um chatbot. Este guia examina os mecanismos da fraude documental por LLM, os documentos mais vulneráveis e as estratégias de deteção eficazes.

Este artigo tem carácter informativo. Os requisitos regulatórios evoluem — consulte o Banco de Portugal ou um consultor jurídico especializado para a sua situação específica.

Por que razão os LLM representam uma mudança qualitativa na fraude documental

Os LLM são fundamentalmente diferentes dos modelos generativos de imagens (GAN, Stable Diffusion). Produzem texto estruturado, valores coerentes e formatos profissionais a pedido — não pixéis manipulados. Um defraudador pode gerar um recibo de vencimento convincente para um salário de 1.900 €/mês em menos de dois minutos, sem qualquer competência em design gráfico. O resultado inclui as deduções de IRS calculadas corretamente, as contribuições para a Segurança Social com as taxas de 2026 e os acumulados anuais coerentes com o vencimento declarado.

De acordo com o Relatório ACFE 2024 Report to the Nations, o tempo médio de deteção de uma fraude documental não identificada na entrada é de 87 dias. Este dado ilustra o custo de não bloquear os documentos falsos no momento do onboarding. O mesmo relatório indica que 37% da fraude continua a ser detetada por revisão manual — precisamente o canal onde os falsos gerados por LLM estão concebidos para enganar.

O ENISA Threat Landscape 2024 identifica a fraude assistida por IA como uma das cinco principais ameaças para as organizações europeias, com referência específica ao aumento do conteúdo textual sintético nos fluxos de verificação de identidade e crédito.

Comparação de técnicas de fraude documental

Técnica Vetor de ataque Deteção tradicional Dificuldade 2026
Retoque Photoshop Pixéis modificados ELA, metadados EXIF Fácil
Modelos PDF modificados Campos de texto substituídos Análise PDF, metadados Moderada
GAN / Stable Diffusion Imagens sintéticas Artefactos visuais, coerência Difícil
LLM (ChatGPT, GPT-4o) Texto integralmente gerado Sem artefactos clássicos Muito difícil

Os controlos OCR tradicionais leem o conteúdo textual, mas não detetam que foi gerado por um LLM. Os controlos de metadados identificam PDFs modificados, não documentos criados de raiz. Esta lacuna é explorada pela fraude mediante LLM.

Documentos mais visados pela fraude LLM

Recibos de vencimento e comprovativos de rendimento

O recibo de vencimento é o documento mais frequentemente falsificado mediante LLM em processos de crédito à habitação, leasing e arrendamento. Um LLM pode gerar um recibo completo com firma e NIF do empregador fictício, deduções de IRS calculadas corretamente, contribuições para a Segurança Social (taxa contributiva global) e acumulados anuais coerentes com o vencimento declarado.

Plataformas nas margens da internet já oferecem "geradores de recibos de vencimento IA" que apenas requerem o salário pretendido, o nome do empregador e o período de pagamento. A geração demora segundos; o PDF resultante é visualmente indistinguível de um recibo autêntico para um revisor humano.

Contratos de trabalho e cartas-convite

Os LLM geram contratos de trabalho sem termo ou a termo completos, com cláusulas de confidencialidade, período experimental e estrutura salarial coerente com o instrumento de regulamentação coletiva do setor declarado. Os defraudadores utilizam-nos como prova corroborante quando as entidades financeiras solicitam documentação adicional.

Extratos bancários

Os extratos bancários gerados integralmente por LLM são mais complexos de tornar coerentes (requerem históricos de transações realistas), mas o ataque mais comum combina um modelo PDF legítimo com conteúdo transacional gerado por LLM. Os metadados estruturais do modelo permanecem genuínos; apenas o conteúdo foi substituído.

Cartas de referência profissional e credenciais

As cartas de referência laboral, certificados de acreditação profissional e confirmações de grau académico são frequentemente geradas por LLM em fraude de recrutamento. Estes documentos não contêm assinatura digital verificável e são estruturalmente simples de produzir.

Como detetar documentos gerados por LLM

Análise linguística e coerência textual

O texto gerado por LLM apresenta propriedades estatísticas ausentes nos documentos humanos autênticos:

  • Perplexidade uniforme: os LLM produzem texto de baixa entropia, sem as variações de registo nem as imperfeições estilísticas próprias dos documentos de RH reais
  • Ausência de variação tipográfica: os documentos reais contêm espaços não separáveis, aspas tipográficas e ligaduras — que os LLM não inserem sistematicamente
  • Precisão numérica excessiva: os recibos de vencimento gerados por IA apresentam valores redondos sem os decimais e artefactos de arredondamento habituais no software de processamento salarial real

Validação cruzada entre documentos

A deteção de maior valor ocorre através da validação cruzada: um recibo de vencimento gerado por LLM pode mencionar um empregador cujo endereço não coincide com os dados do Registo Comercial, ou um NIF cujo dígito de controlo é inválido. Estes sinais são invisíveis ao examinar cada documento isoladamente — requerem validação sistémica contra fontes de dados externas.

A CheckFile implementa uma camada adicional de sinais de geração por IA como complemento aos controlos estruturais existentes, calibrada de acordo com o nível de risco sectorial do cliente. Esta metodologia combina a análise forense do documento individual com a validação cruzada em registos de terceiros (Conservatória do Registo Comercial, AT — Autoridade Tributária, Segurança Social).

Para aprofundar as técnicas de deteção, consulte o nosso guia sobre técnicas de deteção de fraude documental com IA e o nosso artigo sobre como a IA gera documentos falsos.

Sinais forenses específicos de documentos LLM

Sinal Descrição Método de deteção
Repetição semântica Formulações quase idênticas em vários documentos do mesmo solicitante Análise de similaridade vetorial
Valores suspeitosamente redondos Salários em centenas exatas, deduções perfeitamente redondas Controlo estatístico de decimais
NIF inválido ou inativo Número plausível mas não registado na AT API NIF / AT
Endereço não verificável Endereço sintaticamente correto mas não georreferenciável API Sigarra / CTT
Uniformidade tipográfica anómala Documento monofonte sem as variações de formatação do software salarial real Análise de metadados tipográficos

Pronto para automatizar as suas verificações?

Piloto gratuito com os seus próprios documentos. Resultados em 48h.

Pedir um piloto gratuito

Enquadramento regulatório: o que os supervisores portugueses exigem

Obrigações PBCFT e diligência KYC

A Lei n.º 83/2017, de 18 de agosto, que transpôs a 4.ª Diretiva AML para o ordenamento jurídico português, exige que as entidades obrigadas verifiquem a identidade dos seus clientes com base em documentos fiáveis, de fontes independentes e atualizados. O Banco de Portugal e a CMVM supervisam o cumprimento destas obrigações pelas entidades sob a sua tutela.

O Banco de Portugal emitiu em novembro de 2025 uma carta circular às instituições de crédito alertando para o aumento das tentativas de onboarding utilizando documentação integralmente construída por IA — nomeadamente recibos de vencimento e declarações de rendimentos sintéticas — e exigindo a atualização dos procedimentos de controlo interno em conformidade.

A partir de 10 de julho de 2027, a Diretiva AMLD6 (UE 2024/1640) alargará as obrigações PBCFT a novas categorias de entidades obrigadas e introduzirá o conceito de verificação reforçada para documentos produzidos por via eletrónica, o que inclui implicitamente os documentos gerados por IA.

CNPD e tratamento de dados na deteção de fraude

A utilização de ferramentas de deteção baseadas em IA que processem dados pessoais deve cumprir o Regulamento Geral sobre a Proteção de Dados (RGPD) e a Lei n.º 58/2019. A CNPD emitiu orientações sobre a utilização de sistemas de IA em decisões automatizadas que afetem indivíduos, exigindo avaliações de impacto sobre a proteção de dados (AIPD) prévias à implementação.

AT e verificação de documentos fiscais

Para as instituições de crédito e senhorios profissionais, a Autoridade Tributária e Aduaneira (AT) disponibiliza serviços de consulta de dados fiscais que permitem verificar diretamente os rendimentos declarados, sem depender do recibo de vencimento como documento de confiança. Esta verificação direta elimina o vetor de fraude LLM nos rendimentos fiscalizados.

Construir uma defesa eficaz

Passo 1: Cartografar todos os canais de entrada documental

Todos os canais pelos quais os documentos entram na sua organização são potenciais vetores de fraude LLM: portal de cliente, correio eletrónico, integrações API de parceiros, fluxos de digitalização física. Os portais digitais — que permitem colar texto diretamente — apresentam maior risco de fraude LLM do que a digitalização de documentos físicos.

Passo 2: Implementar validação cruzada sistemática

A validação de referências de empregador na Conservatória do Registo Comercial e na AT deteta a maioria dos falsos LLM, uma vez que os modelos de linguagem não conseguem aceder em tempo real aos registos públicos portugueses. Um NIF que não aparece nos registos da AT é um sinal de fraude de alta confiança.

Passo 3: Adicionar uma camada de deteção de sinais IA

As ferramentas de deteção de texto gerado por IA (análise de perplexidade, pontuação de burstiness, impressão estilística) aplicadas a documentos textuais pontuam o risco LLM de cada submissão. Esta camada não substitui os controlos clássicos — complementa-os.

Saiba como a CheckFile integra estes controlos no seu fluxo de verificação para identificar sinais de geração IA sem abrandar a experiência do utilizador. A nossa página de segurança e conformidade detalha a arquitetura de controlo aplicada aos documentos submetidos em tempo real.

Passo 4: Formar as equipas de conformidade e risco

Os analistas KYC devem ser formados para reconhecer os indicadores textuais e visuais de documentos gerados por LLM. Os profissionais em fóruns especializados reportam que a perfeição tipográfica se tornou um sinal de alerta — o contrário do que acontecia há dez anos. Salários em valores redondos, gramática impecável e ausência de qualquer imperfeição de formatação são agora suspeitos.

O que dizem os profissionais

Os responsáveis de conformidade que debatem este tema em fóruns especializados colocam duas questões recorrentes:

"Como distinguir um documento Word convertido em PDF de um gerado por LLM?" A resposta técnica: a análise de metadados PDF (ProductID, DateCreated) e a impressão tipográfica revelam habitualmente a ferramenta autora. Um documento Word conserva rastos do Microsoft Office; um documento gerado por LLM e formatado por código Python deixa uma assinatura de metadados radicalmente diferente.

"Os LLM cometem erros previsíveis?" Sim — produzem valores coerentes na aparência mas estatisticamente improváveis (demasiados salários redondos, ausência de variação anual nos acumulados). Geram também formulações de RH padronizadas ausentes dos recibos de vencimento reais de PME.

Para um quadro mais abrangente, consulte o nosso guia de verificação documental e a nossa página dedicada à deteção de documentos deepfake e IA.

Perguntas frequentes

Os LLM conseguem realmente gerar recibos de vencimento convincentes?

Sim. Os LLM atuais (GPT-4o, Claude 3.5, Gemini 1.5 Pro) produzem recibos de vencimento sintaticamente corretos com deduções de IRS e contribuições para a Segurança Social calculadas com as taxas de 2026. A formatação PDF pode ser aplicada posteriormente por código, tornando o documento visualmente indistinguível de um recibo autêntico. A deteção requer análise forense e validação cruzada dos dados do empregador nos registos da AT e Conservatória do Registo Comercial.

Qual é a diferença entre fraude LLM e deepfake visual?

Os deepfakes visuais manipulam imagens (GAN, Stable Diffusion) e deixam artefactos detetáveis por ELA (Error Level Analysis) ou controlos de coerência de pixéis. Os falsos LLM são integralmente textuais — sem artefactos visuais nem manipulação de imagens. A sua deteção requer análise linguística e validação de coerência semântica, não análise forense visual.

Os controlos OCR tradicionais são suficientes?

Não. O OCR lê o conteúdo textual mas não deteta a origem desse texto. Um recibo de vencimento gerado por LLM ultrapassa todos os controlos OCR porque o seu conteúdo é sintaticamente correto. A deteção requer análises complementares: pontuação de perplexidade linguística, coerência de valores e validação em registos de terceiros.

Que obrigações tenho se detetar um documento falso?

As entidades obrigadas ao abrigo da Lei n.º 83/2017 têm a obrigação de comunicar à Unidade de Informação Financeira (UIF) qualquer transação ou tentativa de estabelecimento de relação de negócio suspeita de estar relacionada com atividades criminosas, incluindo a fraude documental detetada durante o processo de onboarding. A recusa de estabelecimento da relação de negócio é a medida padrão quando a falsificação é confirmada.

A aceitação de um falso gerado por LLM expõe a minha organização a responsabilidade?

Para as instituições de crédito supervisionadas pelo Banco de Portugal, a aceitação de um documento fraudulento num processo de crédito pode constituir incumprimento das obrigações KYC e PBCFT, suscetível de sanção administrativa. Para senhorios e entidades não reguladas, a responsabilidade é menor, mas o prejuízo direto — rendas em falta, dispendiosos processos de despejo — é imediato e significativo.

Para situar este risco na oferta CheckFile, consulte a nossa abordagem de deteção IA e deepfake.

Mantenha-se informado

Receba as nossas análises de conformidade e guias práticos diretamente no seu email.

Pronto para automatizar as suas verificações?

Piloto gratuito com os seus próprios documentos. Resultados em 48h.