De sociale inspectie gebruikt datamining om te kunnen achterhalen bij welke bedrijven er een groot risico op fraude bestaat. “Bij hoge risicoscores kunnen we van 15 naar 55 procent positieve controles gaan”, zegt Gaël Kermarrec van de FOD Sociale Zekerheid.
De Sociale Inspectie van de FOD Sociale Zekerheid kijkt na of de sociale zekerheidswetgeving wel goed wordt nageleefd door de 240.000 werkgevers in ons land. Er worden immers heel wat inbreuken gepleegd, waardoor de staat inkomsten misloopt. Een voorbeeld? In de bouwsector zijn er firma’s die tijdelijke werkloosheid om economische redenen inroepen voor hun arbeiders, terwijl die laatsten gewoon aan het werk blijven, of vervangen worden door goedkopere collega’s van een onderaannemer met een bedenkelijke reputatie.
“Dergelijke dingen hebben kwalijke gevolgen voor de sociale zekerheid”, vertelt projectleider Gaël Kermarrec van de Sociale Inspectie. “In de eerste plaats krijgen die mensen ten onrechte een werkloosheidsuitkering, en ze betalen natuurlijk geen sociale zekerheid voor de dagen dat ze clandestien aan het werk zijn. Zo lopen we twee keer inkomsten mis.”
De inspecteurs van de Sociale Inspectie stellen regularisaties voor wanneer ze dergelijke inbreuken vaststellen, en kunnen zo tot 110 miljoen euro per jaar ophalen. De uitdaging bestaat er in om met minder mensen efficiëntere controles te doen. Zo kan het bedrag uit regularisaties nog flink worden opgetrokken.
“Het is belangrijk dat we ons team goed aansturen”, zegt Kermarrec. “We moeten kunnen zeggen: daar ga je best eens kijken, want de kans dat er bij dat bedrijf gefoefeld wordt, is groot. Die risico’s op misbruik worden berekend op basis van datamining. Bij de FOD Sociale Zekerheid gebruiken we daarvoor de Enterprise Miner-software van SAS.”
De data die als basis genomen wordt voor de risicoberekening, bestaat eenvoudigweg uit de oude controles van de Sociale Inspectie, dat zijn er zo’n 20.000-tal per jaar. “Daar zit heel veel ervaring van onze inspecteurs in vervat”, glimlacht de ambtenaar. “En uit de staat van dienst van een werkgever kan je erg nuttige informatie distilleren.”
In 2010 is de FOD Sociale Zekerheid beginnen kijken naar wat er op de markt was op het gebied van datamining, in 2011 volgde een proof of concept. “We gingen er van uit dat het aansturen van controles op basis van een ‘voorspellend risicomodel’ kon werken, maar we wilden het eerst testen. SAS heeft de offerte toen binnengehaald, en de resultaten van de tests waren uitermate positief.”
“Van een gemiddeld aantal van 10 tot 15 procent ‘positieve’ controles de voorbije jaren, zijn we naar 55 procent geëvolueerd bij de bedrijven met een groot risico op misbruik. Dat is toch een aanzienlijke stijging. De software rangschikt ondernemingen van het hoogste naar het laagste risico. We kunnen onze mensen dus zeggen: hou die werkgever maar goed in de gaten, want de kans dat je daar iets gaat aantreffen is aanzienlijk.”
Analytical base tables
De Enterprise Miner-software van SAS berekent het risico op fraude voor een bepaald moment, meestal per kwartaal. “Zoals gezegd kijkt de toepassing daarbij naar de controles uit het verleden. Hoe gedroeg de werkgever zich in de voorgaande kwartalen? Wat is de evolutie van het zakencijfer? Hoe vaak is er een aanvraag geweest voor economische werkloosheid? In totaal zijn er 300 basisvariabelen waarmee rekening gehouden wordt. Daarmee kan je al erg veel statistische afgeleiden berekenen. Naargelang van de bron kijken we tot 8 trimesters terug.”
De variabelen die op basis van de data van de FOD worden opgesteld, worden ingegeven in zogeheten ‘analytical base tables’. “Er is dus niet alleen de software, we moeten ook die base tables (‘abt’s’) klaar maken voor gebruik. Dat gebeurt wel volgens een vastliggend stramien en op een zo goed als automatische manier, maar toch kruipt nog 80 procent van onze tijd in het klaarstomen van gegevens voor analyse.”
“Als er dingen veranderen, en er moeten aanpassingen worden doorgevoerd aan de analytical base tables (die ten alle tijden aangepast moeten zijn aan de noden waar de sociale inspectie mee te maken krijgt), dan kunnen onze werknemers dat op eigen houtje doen. SAS heeft er voor gezorgd dat we op een autonome manier kunnen werken met de software.”
“Of we ook risicoberekening zouden kunnen doen zonder speciale software? Goh, om de risico’s te identificeren kan je al een heel eind op weg raken met eenvoudige statistische software, maar dan ben je toch nog een heel eind verwijderd van de automatische opmaak van abt’s”, besluit de man. “De bewuste info moet immers uit ons datawarehouse worden gehaald, hij moet regelmatig geüpdatet worden, en de uiteindelijke scores moeten op een vlotte manier verspreid kunnen worden binnen onze organisatie. Dan heb je echt wel een tool nodig op industriële schaal.”
Frederik Tibau
Fout opgemerkt of meer nieuws? Meld het hier