Gids9 min leestijd

Valse documenten via LLM en ChatGPT: de nieuwe fraudedreiging

ChatGPT en grote taalmodellen genereren ondetecteerbare nep-tekstdocumenten. Hoe deze dreiging werkt, welke documenten worden vervalst en hoe u uw organisatie beschermt.

Het CheckFile-team·28 juni 2026

Illustration for Valse documenten via LLM en ChatGPT: de nieuwe fraudedreiging — Gids

Dit artikel samenvatten met

Grote taalmodellen (LLM) — ChatGPT, GPT-4o, Claude, Gemini — hebben een fundamenteel nieuw vector van documentfraude geïntroduceerd: het genereren van coherente, grammaticaal foutloze, contextueel plausibele nep-tekstdocumenten zonder beeldmanipulatie en zonder detecteerbare artefacten. Waar vroegere fraudeurs afbeeldingen bewerkten in Photoshop, dicteren fraudeurs van 2026 loonstroken, arbeidscontracten en bankafschriften aan een chatbot. Deze gids onderzoekt de mechanismen van LLM-documentfraude, de meest kwetsbare documenten en effectieve detectiestrategieën.

Dit artikel is uitsluitend informatief. Regelgevende vereisten veranderen — raadpleeg de DNB of een gespecialiseerd juridisch adviseur voor uw specifieke situatie.

Waarom LLM's een kwalitatieve verschuiving vertegenwoordigen in documentfraude

LLM's zijn fundamenteel anders dan generatieve beeldmodellen (GAN, Stable Diffusion). Ze produceren gestructureerde tekst, coherente cijfers en professionele opmaak op aanvraag — geen gemanipuleerde pixels. Een fraudeur kan in minder dan twee minuten een overtuigende loonstrook genereren voor een salaris van €3.200 per maand, zonder enige grafische ontwerpvaardigheid. Het resultaat bevat loonheffingsberekeningen correct toegepast op Nederlandse tarieven 2026, pensioenpremies conform een sectorale pensioenregeling en cumulatieve jaarbedragen die coherent zijn met het opgegeven salaris.

Volgens het ACFE 2024 Report to the Nations bedraagt de mediane detectietijd van een niet bij binnenkomst onderkende documentfraude 87 dagen. Dit cijfer illustreert de kosten van het niet blokkeren van valse documenten tijdens onboarding. Hetzelfde rapport geeft aan dat 37% van de fraude nog steeds wordt gedetecteerd via handmatige beoordeling — precies het kanaal waar LLM-gegenereerde vervalsingen zijn ontworpen om te misleiden.

Het ENISA Threat Landscape 2024 identificeert AI-ondersteunde fraude als een van de vijf belangrijkste bedreigingen voor Europese organisaties, met specifieke verwijzing naar de opkomst van synthetische tekstuele inhoud in identiteitsverificatie- en kredietstromen.

Vergelijking van documentfraudetechnieken

Techniek	Aanvalsvector	Traditionele detectie	Moeilijkheid 2026
Photoshop-bewerking	Gewijzigde pixels	ELA, EXIF-metadata	Gemakkelijk
Gewijzigde PDF-sjablonen	Vervangen tekstvelden	PDF-analyse, metadata	Matig
GAN / Stable Diffusion	Synthetische afbeeldingen	Visuele artefacten, coherentie	Moeilijk
LLM (ChatGPT, GPT-4o)	Volledig gegenereerde tekst	Geen klassieke artefacten	Zeer moeilijk

Standaard OCR-controles lezen de tekstinhoud maar kunnen niet detecteren dat deze door een LLM is gegenereerd. Metadatacontroles identificeren gewijzigde PDF's, geen documenten die vanaf nul zijn aangemaakt. Dit is de lacune die LLM-fraude uitbuit.

Meest getargete documenten door LLM-fraude

Loonstroken en inkomensbewijs

De loonstrook is het meest frequent vervalste document via LLM in hypotheekaanvragen, leasingdossiers en huurovereenkomsten. Een LLM kan een volledige loonstrook genereren met werkgevernaam en KvK-nummer (plausibel gegenereerd), loonheffingsberekeningen correct toegepast op tarieven 2026, pensioenpremie conform een sectorale regeling en cumulatieve jaarcijfers coherent met het opgegeven maandsalaris.

Op donkere hoeken van het internet worden openlijk "AI-loonstrookgeneratoren" aangeboden die slechts het doelsalaris, de werkgevernaam en de loonperiode vereisen. Generatie duurt seconden; de resulterende PDF is visueel niet te onderscheiden van een echte loonstrook voor een menselijke beoordelaar.

Arbeidscontracten en dienstverbandbevestigingen

LLM's genereren volledige arbeidscontracten voor onbepaalde of bepaalde tijd, met geheimhoudingsclausules, proefperiode en salarisstructuur coherent met de cao van de opgegeven sector. Fraudeurs gebruiken deze als corroborerend bewijs wanneer kredietverstrekkers aanvullende documentatie vragen.

Bankafschriften

Volledig door LLM gegenereerde bankafschriften zijn complexer te maken coherent (vereisen realistische transactiegeschiedenissen), maar de meest voorkomende aanval combineert een legitiem PDF-sjabloon met door LLM gegenereerde transactiegegevens. De structurele metadata van het sjabloon blijven echt; alleen de inhoud is vervangen.

Arbeidsreferenties en professionele certificaten

Referentiebrieven van werkgevers, beroepsaccreditatiecertificaten en universitaire diplomabevestigingen worden frequent gegenereerd door LLM bij rekruteringsfraude. Deze documenten bevatten geen verifieerbare digitale handtekening en zijn structureel eenvoudig te produceren.

Hoe LLM-gegenereerde documenten detecteren

Linguïstische en tekstuele coherentieanalyse

Door LLM gegenereerde tekst vertoont statistische eigenschappen die afwezig zijn in authentieke menselijke documenten:

Uniforme perplexiteit: LLM's produceren tekst met lage entropie, zonder de registerwisselingen en stilistische onvolkomenheden die kenmerkend zijn voor echte HR-documenten
Afwezigheid van typografische variatie: echte documenten bevatten vaste spaties, typografische aanhalingstekens en ligaturen — die LLM's niet systematisch invoegen
Buitensporige numerieke precisie: door AI gegenereerde loonstroken vertonen verdacht ronde cijfers zonder de afrondingsartefacten die typisch zijn voor echt salarissoftware

Kruisvalidatie tussen documenten

De meest waardevolle detectie vindt plaats via kruisvalidatie: een door LLM gegenereerde loonstrook kan een werkgever vermelden wiens adres niet overeenkomt met de KvK-registratie, of een IBAN-nummer dat een geldige opmaak heeft maar niet gekoppeld is aan de vermelde werkgever. Deze signalen zijn onzichtbaar bij het afzonderlijk onderzoeken van elk document — ze vereisen systemische validatie aan de hand van externe databronnen.

CheckFile implementeert een aanvullende laag van AI-generatiesignalen als complement op de bestaande structurele controles, gecalibreerd op het sectorale risiconiveau van de klant. Deze methodologie combineert forensische analyse van individuele documenten met kruisvalidatie in registers van derden (KvK, Belastingdienst, IBAN-verificatiediensten).

Zie voor meer context over AI-detectietechnieken onze gids over AI-documentfraudedetectietechnieken en ons artikel over hoe AI valse documenten maakt.

Specifieke forensische signalen voor LLM-documenten

Signaal	Beschrijving	Detectiemethode
Semantische herhaling	Bijna identieke formuleringen in meerdere documenten van dezelfde aanvrager	Vectorgebaseerde similariteitsanalyse
Verdacht ronde bedragen	Salarissen op de honderd euro nauwkeurig, perfecte afrondingen	Statistische decimaalcontrole
Niet-verifieerbaar KvK-nummer	Plausibele opmaak maar niet geregistreerd bij KvK	KvK Open Data API
Afwijkend IBAN-formaat	IBAN valide qua opmaak maar bankcode onbekend bij BIC-register	IBAN-validatiedienst
Abnormale lettertypeuniformiteit	Enkelfontdocument zonder de gemengde lettertypehandtekeningen van echte salarissoftware	Typografische metadata-extractie

Klaar om uw controles te automatiseren?

Gratis proefproject met uw eigen documenten. Resultaten binnen 48u.

Gratis proefproject aanvragen

Regelgevend kader: wat Nederlandse toezichthouders vereisen

Wwft-verplichtingen en KYC-zorgplicht

De Wet ter voorkoming van witwassen en financieren van terrorisme (Wwft) verplicht alle meldingsplichtige instellingen de identiteit van hun cliënten te verifiëren op basis van betrouwbare, onafhankelijke brondocumenten. De DNB (De Nederlandsche Bank) en de AFM (Autoriteit Financiële Markten) houden toezicht op de naleving hiervan door respectievelijk financiële instellingen en beleggingsondernemingen.

De DNB publiceerde in haar Good Practices document van september 2025 een specifieke paragraaf over risico's van AI-gegenereerde documentatie in het KYC-proces, met een oproep aan instellingen om hun cliëntenonderzoeksprocedures aan te passen aan deze nieuwe dreiging.

Vanaf 10 juli 2027 zal de AMLD6-richtlijn (EU 2024/1640) de Wwft-verplichtingen uitbreiden naar nieuwe categorieën meldingsplichtige instellingen en het concept van verscherpte verificatie voor elektronisch geproduceerde documenten introduceren, wat impliciet ook AI-gegenereerde documenten omvat.

AP en gegevensbescherming bij fraudedetectie

Het gebruik van AI-gebaseerde detectietools die persoonsgegevens verwerken moet voldoen aan de Algemene Verordening Gegevensbescherming (AVG) en de Uitvoeringswet AVG. De Autoriteit Persoonsgegevens (AP) heeft richtsnoeren uitgevaardigd over het gebruik van AI bij geautomatiseerde besluitvorming die individuen kan treffen, waarbij een Data Protection Impact Assessment (DPIA) verplicht is vóór implementatie.

Belastingdienst en inkomensdocumentverificatie

Voor hypotheekverstrekkers en professionele verhuurders biedt de Belastingdienst digitale inkomensverklaringen die rechtstreeks inkomensgegevens kunnen bevestigen, zonder afhankelijk te zijn van de loonstrook als vertrouwensdocument. Deze directe verificatie elimineert de LLM-fraudevector bij belastinggecontroleerde inkomens.

Een effectieve verdediging opbouwen

Stap 1: Alle documentaanvoerkanalen in kaart brengen

Elk kanaal waarlangs documenten uw organisatie binnenkomen is een potentiële LLM-fraudevector: cliëntenportaal, e-mail, API-integraties van partners, fysieke scanworkflows. Digitale portals — waarbij tekst direct kan worden ingeplakt — dragen een hoger LLM-frauderisico dan scans van fysieke documenten.

Stap 2: Systematische kruisvalidatie implementeren

Validatie van werkgeversreferenties in de KvK en bij de Belastingdienst detecteert het merendeel van de LLM-vervalsingen, omdat taalmodellen geen toegang hebben tot Nederlandse openbare registers in realtime. Een bedrijfsnaam die niet in de KvK is geregistreerd is een fraudesignaal met hoge betrouwbaarheid.

Stap 3: Een LLM-signaaldetectielaag toevoegen

AI-gegenereerde tekstdetectietools (perplexiteitsanalyse, burstiheidsscoring, stilistische vingerafdruk) toegepast op tekstdocumenten scoren het LLM-risico van elke indiening. Deze laag vervangt klassieke controles niet — ze vormt een aanvulling.

Ontdek hoe CheckFile deze controles integreert in uw verificatieworkflow om AI-generatiesignalen te identificeren zonder de gebruikerservaring te vertragen. Onze beveiligings- en compliancepagina beschrijft de controlearchitectuur die wordt toegepast op documenten die in realtime worden ingediend.

Stap 4: KYC- en kredietteams trainen

Compliance-analisten moeten worden getraind in het herkennen van tekstuele en visuele indicatoren van LLM-gegenereerde documenten. Professionals op gespecialiseerde forums rapporteren consistent dat typografische perfectie een alarmsignaal is geworden — het omgekeerde van tien jaar geleden. Ronde salariebedragen, foutloze grammatica en het ontbreken van enige opmaakafwijking zijn nu verdacht.

Wat praktijkmensen melden

Complianceprofessionals die dit onderwerp bespreken op gespecialiseerde forums stellen twee terugkerende vragen:

"Hoe onderscheid ik een Word-naar-PDF-conversie van een LLM-gegenereerd document?" Het technische antwoord: PDF-metadataanalyse (ProductID, CreationDate) en lettertypevingerafdrukken onthullen doorgaans de gebruikte auteurstool. Een Word-naar-PDF-conversie behoudt Microsoft Office-sporen; een door LLM gegenereerd document geformatteerd via Python-code laat een radicaal ander metadatahandtekeningprofiel achter.

"Maken LLM's voorspelbare fouten?" Ja — ze produceren cijfers die schijnbaar coherent maar statistisch onwaarschijnlijk zijn (te veel ronde salariebedragen, geen jaarlijkse cumulatieve variatie). Ze genereren ook gestandaardiseerde HR-formuleringen die ontbreken in echte loonstroken van mkb-bedrijven.

Zie voor een bredere aanpak onze complete documentverwerkingsgids en onze dedicated AI en deepfake-documentdetectiepagina.

Veelgestelde vragen

Kunnen LLM's echt overtuigende loonstroken genereren?

Ja. Huidige LLM's (GPT-4o, Claude 3.5, Gemini 1.5 Pro) produceren syntactisch correcte loonstroken met loonheffingen en premies berekend op de tarieven van 2026. PDF-opmaak kan vervolgens via code worden toegepast, waardoor het document voor een menselijke beoordelaar visueel niet te onderscheiden is van een echte loonstrook. Detectie vereist forensische analyse en kruisvalidatie van werkgeversgegevens in de KvK en bij de Belastingdienst.

Wat is het verschil tussen LLM-fraude en visuele deepfakes?

Visuele deepfakes manipuleren afbeeldingen (GAN, Stable Diffusion) en laten artefacten achter die detecteerbaar zijn via Error Level Analysis (ELA) of pixelcoherentiecontroles. LLM-vervalsingen zijn volledig textueel — geen visuele artefacten, geen beeldmanipulatie. Detectie vereist linguïstische analyse en semantische coherentievalidatie in plaats van visuele forensiek.

Zijn traditionele OCR-controles voldoende?

Nee. OCR leest tekstinhoud maar kan de oorsprong van die tekst niet detecteren. Een LLM-gegenereerde loonstrook doorstaat alle OCR-controles omdat de tekstinhoud syntactisch correct is. Detectie vereist aanvullende analyse: linguïstische perplexiteitsscoring, cijfercoherentie en validatie in registers van derden.

Welke verplichtingen heb ik als ik een vals document detecteer?

Meldingsplichtige instellingen onder de Wwft zijn verplicht een melding van ongebruikelijke transacties in te dienen bij de Financial Intelligence Unit Nederland (FIU-Nederland) wanneer zij weten of vermoeden dat een cliënt fraude of witwassen heeft gepleegd. Dit omvat documentfraude ontdekt tijdens het onboardingproces. Niet-melding is zelf een strafbaar feit.

Stelt het accepteren van een LLM-vervalsing mijn organisatie bloot aan aansprakelijkheid?

Voor door DNB of AFM gereguleerde instellingen kan het accepteren van een frauduleus document in een kredietaanvraag een schending vormen van de Wwft-KYC-verplichtingen, wat leidt tot toezichtrechtelijke handhavingsacties. Voor verhuurders en niet-gereguleerde entiteiten is de aansprakelijkheid lager, maar de directe financiële schade — huurachterstanden, kostbare ontruimingsprocedures — is onmiddellijk en aanzienlijk.

Voor waar dit risico in het CheckFile-aanbod past, zie onze AI- en deepfake-detectieaanpak.

Blijf op de hoogte

Ontvang onze compliance-analyses en praktische gidsen rechtstreeks in uw inbox.

Klaar om uw controles te automatiseren?

Gratis proefproject met uw eigen documenten. Resultaten binnen 48u.

Valse documenten via LLM en ChatGPT: de nieuwe fraudedreiging

Waarom LLM's een kwalitatieve verschuiving vertegenwoordigen in documentfraude

Vergelijking van documentfraudetechnieken

Meest getargete documenten door LLM-fraude

Loonstroken en inkomensbewijs

Arbeidscontracten en dienstverbandbevestigingen

Bankafschriften

Arbeidsreferenties en professionele certificaten

Hoe LLM-gegenereerde documenten detecteren

Linguïstische en tekstuele coherentieanalyse

Kruisvalidatie tussen documenten

Specifieke forensische signalen voor LLM-documenten

Regelgevend kader: wat Nederlandse toezichthouders vereisen

Wwft-verplichtingen en KYC-zorgplicht

AP en gegevensbescherming bij fraudedetectie

Belastingdienst en inkomensdocumentverificatie

Een effectieve verdediging opbouwen

Stap 1: Alle documentaanvoerkanalen in kaart brengen

Stap 2: Systematische kruisvalidatie implementeren

Stap 3: Een LLM-signaaldetectielaag toevoegen

Stap 4: KYC- en kredietteams trainen

Wat praktijkmensen melden

Veelgestelde vragen

Kunnen LLM's echt overtuigende loonstroken genereren?

Wat is het verschil tussen LLM-fraude en visuele deepfakes?

Zijn traditionele OCR-controles voldoende?

Welke verplichtingen heb ik als ik een vals document detecteer?

Stelt het accepteren van een LLM-vervalsing mijn organisatie bloot aan aansprakelijkheid?

Blijf op de hoogte

Klaar om uw controles te automatiseren?

Gerelateerde artikelen

Hoe AI valse documenten maakt — en hoe je ze detecteert

Liveness detectie vs documentvervalsing detectie: de belangrijkste verschillen

Error Level Analysis uitgelegd: vervalste documentafbeeldingen herkennen