Valse documenten via LLM en ChatGPT: de nieuwe fraudedreiging
ChatGPT en grote taalmodellen genereren ondetecteerbare nep-tekstdocumenten. Hoe deze dreiging werkt, welke documenten worden vervalst en hoe u uw organisatie beschermt.

Dit artikel samenvatten met
Grote taalmodellen (LLM) — ChatGPT, GPT-4o, Claude, Gemini — hebben een fundamenteel nieuw vector van documentfraude geïntroduceerd: het genereren van coherente, grammaticaal foutloze, contextueel plausibele nep-tekstdocumenten zonder beeldmanipulatie en zonder detecteerbare artefacten. Waar vroegere fraudeurs afbeeldingen bewerkten in Photoshop, dicteren fraudeurs van 2026 loonstroken, arbeidscontracten en bankafschriften aan een chatbot. Deze gids onderzoekt de mechanismen van LLM-documentfraude, de meest kwetsbare documenten en effectieve detectiestrategieën.
Dit artikel is uitsluitend informatief. Regelgevende vereisten veranderen — raadpleeg de DNB of een gespecialiseerd juridisch adviseur voor uw specifieke situatie.
Waarom LLM's een kwalitatieve verschuiving vertegenwoordigen in documentfraude
LLM's zijn fundamenteel anders dan generatieve beeldmodellen (GAN, Stable Diffusion). Ze produceren gestructureerde tekst, coherente cijfers en professionele opmaak op aanvraag — geen gemanipuleerde pixels. Een fraudeur kan in minder dan twee minuten een overtuigende loonstrook genereren voor een salaris van €3.200 per maand, zonder enige grafische ontwerpvaardigheid. Het resultaat bevat loonheffingsberekeningen correct toegepast op Nederlandse tarieven 2026, pensioenpremies conform een sectorale pensioenregeling en cumulatieve jaarbedragen die coherent zijn met het opgegeven salaris.
Volgens het ACFE 2024 Report to the Nations bedraagt de mediane detectietijd van een niet bij binnenkomst onderkende documentfraude 87 dagen. Dit cijfer illustreert de kosten van het niet blokkeren van valse documenten tijdens onboarding. Hetzelfde rapport geeft aan dat 37% van de fraude nog steeds wordt gedetecteerd via handmatige beoordeling — precies het kanaal waar LLM-gegenereerde vervalsingen zijn ontworpen om te misleiden.
Het ENISA Threat Landscape 2024 identificeert AI-ondersteunde fraude als een van de vijf belangrijkste bedreigingen voor Europese organisaties, met specifieke verwijzing naar de opkomst van synthetische tekstuele inhoud in identiteitsverificatie- en kredietstromen.
Vergelijking van documentfraudetechnieken
| Techniek | Aanvalsvector | Traditionele detectie | Moeilijkheid 2026 |
|---|---|---|---|
| Photoshop-bewerking | Gewijzigde pixels | ELA, EXIF-metadata | Gemakkelijk |
| Gewijzigde PDF-sjablonen | Vervangen tekstvelden | PDF-analyse, metadata | Matig |
| GAN / Stable Diffusion | Synthetische afbeeldingen | Visuele artefacten, coherentie | Moeilijk |
| LLM (ChatGPT, GPT-4o) | Volledig gegenereerde tekst | Geen klassieke artefacten | Zeer moeilijk |
Standaard OCR-controles lezen de tekstinhoud maar kunnen niet detecteren dat deze door een LLM is gegenereerd. Metadatacontroles identificeren gewijzigde PDF's, geen documenten die vanaf nul zijn aangemaakt. Dit is de lacune die LLM-fraude uitbuit.
Meest getargete documenten door LLM-fraude
Loonstroken en inkomensbewijs
De loonstrook is het meest frequent vervalste document via LLM in hypotheekaanvragen, leasingdossiers en huurovereenkomsten. Een LLM kan een volledige loonstrook genereren met werkgevernaam en KvK-nummer (plausibel gegenereerd), loonheffingsberekeningen correct toegepast op tarieven 2026, pensioenpremie conform een sectorale regeling en cumulatieve jaarcijfers coherent met het opgegeven maandsalaris.
Op donkere hoeken van het internet worden openlijk "AI-loonstrookgeneratoren" aangeboden die slechts het doelsalaris, de werkgevernaam en de loonperiode vereisen. Generatie duurt seconden; de resulterende PDF is visueel niet te onderscheiden van een echte loonstrook voor een menselijke beoordelaar.
Arbeidscontracten en dienstverbandbevestigingen
LLM's genereren volledige arbeidscontracten voor onbepaalde of bepaalde tijd, met geheimhoudingsclausules, proefperiode en salarisstructuur coherent met de cao van de opgegeven sector. Fraudeurs gebruiken deze als corroborerend bewijs wanneer kredietverstrekkers aanvullende documentatie vragen.
Bankafschriften
Volledig door LLM gegenereerde bankafschriften zijn complexer te maken coherent (vereisen realistische transactiegeschiedenissen), maar de meest voorkomende aanval combineert een legitiem PDF-sjabloon met door LLM gegenereerde transactiegegevens. De structurele metadata van het sjabloon blijven echt; alleen de inhoud is vervangen.
Arbeidsreferenties en professionele certificaten
Referentiebrieven van werkgevers, beroepsaccreditatiecertificaten en universitaire diplomabevestigingen worden frequent gegenereerd door LLM bij rekruteringsfraude. Deze documenten bevatten geen verifieerbare digitale handtekening en zijn structureel eenvoudig te produceren.
Hoe LLM-gegenereerde documenten detecteren
Linguïstische en tekstuele coherentieanalyse
Door LLM gegenereerde tekst vertoont statistische eigenschappen die afwezig zijn in authentieke menselijke documenten:
- Uniforme perplexiteit: LLM's produceren tekst met lage entropie, zonder de registerwisselingen en stilistische onvolkomenheden die kenmerkend zijn voor echte HR-documenten
- Afwezigheid van typografische variatie: echte documenten bevatten vaste spaties, typografische aanhalingstekens en ligaturen — die LLM's niet systematisch invoegen
- Buitensporige numerieke precisie: door AI gegenereerde loonstroken vertonen verdacht ronde cijfers zonder de afrondingsartefacten die typisch zijn voor echt salarissoftware
Kruisvalidatie tussen documenten
De meest waardevolle detectie vindt plaats via kruisvalidatie: een door LLM gegenereerde loonstrook kan een werkgever vermelden wiens adres niet overeenkomt met de KvK-registratie, of een IBAN-nummer dat een geldige opmaak heeft maar niet gekoppeld is aan de vermelde werkgever. Deze signalen zijn onzichtbaar bij het afzonderlijk onderzoeken van elk document — ze vereisen systemische validatie aan de hand van externe databronnen.
CheckFile implementeert een aanvullende laag van AI-generatiesignalen als complement op de bestaande structurele controles, gecalibreerd op het sectorale risiconiveau van de klant. Deze methodologie combineert forensische analyse van individuele documenten met kruisvalidatie in registers van derden (KvK, Belastingdienst, IBAN-verificatiediensten).
Zie voor meer context over AI-detectietechnieken onze gids over AI-documentfraudedetectietechnieken en ons artikel over hoe AI valse documenten maakt.
Specifieke forensische signalen voor LLM-documenten
| Signaal | Beschrijving | Detectiemethode |
|---|---|---|
| Semantische herhaling | Bijna identieke formuleringen in meerdere documenten van dezelfde aanvrager | Vectorgebaseerde similariteitsanalyse |
| Verdacht ronde bedragen | Salarissen op de honderd euro nauwkeurig, perfecte afrondingen | Statistische decimaalcontrole |
| Niet-verifieerbaar KvK-nummer | Plausibele opmaak maar niet geregistreerd bij KvK | KvK Open Data API |
| Afwijkend IBAN-formaat | IBAN valide qua opmaak maar bankcode onbekend bij BIC-register | IBAN-validatiedienst |
| Abnormale lettertypeuniformiteit | Enkelfontdocument zonder de gemengde lettertypehandtekeningen van echte salarissoftware | Typografische metadata-extractie |
Klaar om uw controles te automatiseren?
Gratis proefproject met uw eigen documenten. Resultaten binnen 48u.
Gratis proefproject aanvragenRegelgevend kader: wat Nederlandse toezichthouders vereisen
Wwft-verplichtingen en KYC-zorgplicht
De Wet ter voorkoming van witwassen en financieren van terrorisme (Wwft) verplicht alle meldingsplichtige instellingen de identiteit van hun cliënten te verifiëren op basis van betrouwbare, onafhankelijke brondocumenten. De DNB (De Nederlandsche Bank) en de AFM (Autoriteit Financiële Markten) houden toezicht op de naleving hiervan door respectievelijk financiële instellingen en beleggingsondernemingen.
De DNB publiceerde in haar Good Practices document van september 2025 een specifieke paragraaf over risico's van AI-gegenereerde documentatie in het KYC-proces, met een oproep aan instellingen om hun cliëntenonderzoeksprocedures aan te passen aan deze nieuwe dreiging.
Vanaf 10 juli 2027 zal de AMLD6-richtlijn (EU 2024/1640) de Wwft-verplichtingen uitbreiden naar nieuwe categorieën meldingsplichtige instellingen en het concept van verscherpte verificatie voor elektronisch geproduceerde documenten introduceren, wat impliciet ook AI-gegenereerde documenten omvat.
AP en gegevensbescherming bij fraudedetectie
Het gebruik van AI-gebaseerde detectietools die persoonsgegevens verwerken moet voldoen aan de Algemene Verordening Gegevensbescherming (AVG) en de Uitvoeringswet AVG. De Autoriteit Persoonsgegevens (AP) heeft richtsnoeren uitgevaardigd over het gebruik van AI bij geautomatiseerde besluitvorming die individuen kan treffen, waarbij een Data Protection Impact Assessment (DPIA) verplicht is vóór implementatie.
Belastingdienst en inkomensdocumentverificatie
Voor hypotheekverstrekkers en professionele verhuurders biedt de Belastingdienst digitale inkomensverklaringen die rechtstreeks inkomensgegevens kunnen bevestigen, zonder afhankelijk te zijn van de loonstrook als vertrouwensdocument. Deze directe verificatie elimineert de LLM-fraudevector bij belastinggecontroleerde inkomens.
Een effectieve verdediging opbouwen
Stap 1: Alle documentaanvoerkanalen in kaart brengen
Elk kanaal waarlangs documenten uw organisatie binnenkomen is een potentiële LLM-fraudevector: cliëntenportaal, e-mail, API-integraties van partners, fysieke scanworkflows. Digitale portals — waarbij tekst direct kan worden ingeplakt — dragen een hoger LLM-frauderisico dan scans van fysieke documenten.
Stap 2: Systematische kruisvalidatie implementeren
Validatie van werkgeversreferenties in de KvK en bij de Belastingdienst detecteert het merendeel van de LLM-vervalsingen, omdat taalmodellen geen toegang hebben tot Nederlandse openbare registers in realtime. Een bedrijfsnaam die niet in de KvK is geregistreerd is een fraudesignaal met hoge betrouwbaarheid.
Stap 3: Een LLM-signaaldetectielaag toevoegen
AI-gegenereerde tekstdetectietools (perplexiteitsanalyse, burstiheidsscoring, stilistische vingerafdruk) toegepast op tekstdocumenten scoren het LLM-risico van elke indiening. Deze laag vervangt klassieke controles niet — ze vormt een aanvulling.
Ontdek hoe CheckFile deze controles integreert in uw verificatieworkflow om AI-generatiesignalen te identificeren zonder de gebruikerservaring te vertragen. Onze beveiligings- en compliancepagina beschrijft de controlearchitectuur die wordt toegepast op documenten die in realtime worden ingediend.
Stap 4: KYC- en kredietteams trainen
Compliance-analisten moeten worden getraind in het herkennen van tekstuele en visuele indicatoren van LLM-gegenereerde documenten. Professionals op gespecialiseerde forums rapporteren consistent dat typografische perfectie een alarmsignaal is geworden — het omgekeerde van tien jaar geleden. Ronde salariebedragen, foutloze grammatica en het ontbreken van enige opmaakafwijking zijn nu verdacht.
Wat praktijkmensen melden
Complianceprofessionals die dit onderwerp bespreken op gespecialiseerde forums stellen twee terugkerende vragen:
"Hoe onderscheid ik een Word-naar-PDF-conversie van een LLM-gegenereerd document?" Het technische antwoord: PDF-metadataanalyse (ProductID, CreationDate) en lettertypevingerafdrukken onthullen doorgaans de gebruikte auteurstool. Een Word-naar-PDF-conversie behoudt Microsoft Office-sporen; een door LLM gegenereerd document geformatteerd via Python-code laat een radicaal ander metadatahandtekeningprofiel achter.
"Maken LLM's voorspelbare fouten?" Ja — ze produceren cijfers die schijnbaar coherent maar statistisch onwaarschijnlijk zijn (te veel ronde salariebedragen, geen jaarlijkse cumulatieve variatie). Ze genereren ook gestandaardiseerde HR-formuleringen die ontbreken in echte loonstroken van mkb-bedrijven.
Zie voor een bredere aanpak onze complete documentverwerkingsgids en onze dedicated AI en deepfake-documentdetectiepagina.
Veelgestelde vragen
Kunnen LLM's echt overtuigende loonstroken genereren?
Ja. Huidige LLM's (GPT-4o, Claude 3.5, Gemini 1.5 Pro) produceren syntactisch correcte loonstroken met loonheffingen en premies berekend op de tarieven van 2026. PDF-opmaak kan vervolgens via code worden toegepast, waardoor het document voor een menselijke beoordelaar visueel niet te onderscheiden is van een echte loonstrook. Detectie vereist forensische analyse en kruisvalidatie van werkgeversgegevens in de KvK en bij de Belastingdienst.
Wat is het verschil tussen LLM-fraude en visuele deepfakes?
Visuele deepfakes manipuleren afbeeldingen (GAN, Stable Diffusion) en laten artefacten achter die detecteerbaar zijn via Error Level Analysis (ELA) of pixelcoherentiecontroles. LLM-vervalsingen zijn volledig textueel — geen visuele artefacten, geen beeldmanipulatie. Detectie vereist linguïstische analyse en semantische coherentievalidatie in plaats van visuele forensiek.
Zijn traditionele OCR-controles voldoende?
Nee. OCR leest tekstinhoud maar kan de oorsprong van die tekst niet detecteren. Een LLM-gegenereerde loonstrook doorstaat alle OCR-controles omdat de tekstinhoud syntactisch correct is. Detectie vereist aanvullende analyse: linguïstische perplexiteitsscoring, cijfercoherentie en validatie in registers van derden.
Welke verplichtingen heb ik als ik een vals document detecteer?
Meldingsplichtige instellingen onder de Wwft zijn verplicht een melding van ongebruikelijke transacties in te dienen bij de Financial Intelligence Unit Nederland (FIU-Nederland) wanneer zij weten of vermoeden dat een cliënt fraude of witwassen heeft gepleegd. Dit omvat documentfraude ontdekt tijdens het onboardingproces. Niet-melding is zelf een strafbaar feit.
Stelt het accepteren van een LLM-vervalsing mijn organisatie bloot aan aansprakelijkheid?
Voor door DNB of AFM gereguleerde instellingen kan het accepteren van een frauduleus document in een kredietaanvraag een schending vormen van de Wwft-KYC-verplichtingen, wat leidt tot toezichtrechtelijke handhavingsacties. Voor verhuurders en niet-gereguleerde entiteiten is de aansprakelijkheid lager, maar de directe financiële schade — huurachterstanden, kostbare ontruimingsprocedures — is onmiddellijk en aanzienlijk.
Voor waar dit risico in het CheckFile-aanbod past, zie onze AI- en deepfake-detectieaanpak.
Blijf op de hoogte
Ontvang onze compliance-analyses en praktische gidsen rechtstreeks in uw inbox.