Behavioral large language models: de volgende evolutie in digitaal vertrouwen
In dit artikel:
Tomer Segall (Director of Data Science, BioCatch) betoogt dat de doorbraak van large language models (LLM’s) de afgelopen twee jaar ons beeld van AI fundamenteel veranderde en dat dezelfde principes nu kunnen worden ingezet voor fraudedetectie door menselijk gedrag als een “taal” te beschouwen. Waar LLM’s patronen in woorden en zinnen leren, zouden gedragsmatige language models (BeLM’s) patronen in reeksen van micro-interacties — toetsaanslagen, muisbewegingen, scrollen, pauzes, wisselen tussen velden en timing — moeten leren herkennen.
Waarom dit nu relevant is: fraude groeit snel en verandert voortdurend; BioCatch-klanten zagen het afgelopen jaar een toename van ongeveer 65% in scam-pogingen. Tegelijk maken eenvoudige automatiseringstools het nabootsen van gegevens makkelijker, terwijl authentiek menselijk gedrag moeilijker te imititeren blijft. Die unieke, vaak subtiele temporele patronen zitten verspreid over honderden microgebeurtenissen en ontsnappen aan veel traditionele modellen die vooral op geaggregeerde features vertrouwen.
De voorgestelde BeLM’s gebruiken transformer-architecturen — dezelfde techniek achter moderne LLM’s — omdat deze goed zijn in het leggen van verbanden over lange reeksen en het herkennen van verbanden tussen ver uit elkaar liggende acties. In plaats van het volgende woord te voorspellen leert een BeLM of een reeks gedragsgebeurtenissen past binnen de “grammatica” van echt gebruikersgedrag en of afwijkingen mogelijk wijzen op fraude of risico.
BioCatch bevindt zich nog in een vroeg R&D-stadium. Belangrijke onderzoeksvragen zijn onder meer: hoe codeer je gedragsreeksen zodanig dat semantiek behouden blijft (tokenisatie), in hoeverre kunnen transformers consistente authentieke patronen opnemen, en hoe verhouden BeLM’s zich tot bestaande gedragsmodellen? Er lopen experimenten en prototypen om de haalbaarheid te toetsen voordat productontwikkeling volgt.
Verwachte voordelen zijn onder meer beter begrip van intentie, sterkere afwijkingsdetectie en sneller aanpassingsvermogen aan nieuwe fraudetactieken. BeLM’s kunnen diepere inzichten bieden dan feature-gebaseerde systemen doordat ze leren van de onbewerkte stroom van interacties en daardoor signalen kunnen oppikken die eerder verborgen bleven. BioCatch ziet ook toepassingen in de context van nieuwe interfaces, zoals agentic browsers en AI-ondersteunde gebruikersomgevingen.
Segall benadrukt dat de aanpak gericht is op verantwoord experimenteren en leren. De kernboodschap: door gedragsdata als taal te behandelen en transformers hiervoor in te zetten, ontstaat een veelbelovende nieuwe laag in fraudepreventie — een manier waarop machines in de toekomst mogelijk de rijke, complexe “taal” van menselijk digitaal handelen kunnen begrijpen.