Kan je een annulering zien aankomen?

Volle wagons zorgen voor rendabel goederenvervoer via het spoor. Het komt er dus op aan zo flexibel mogelijk om te gaan met geannuleerde boekingen en die vlot te vervangen door andere vracht. Belgisch onderzoek ging in de Big Data van het treinverkeer op zoek naar nieuwe inzichten.

Voor Alain Goossens, managing partner bij SII Belgium, vormde het gevoerde onderzoek het sluitstuk van de postgraduaatopleiding ‘Big Data & Analytics in Business & Management’ die hij volgde aan de KU Leuven. Hij stelde een voorspellend model op voor de annulering van geboekte vracht op Europese goederentreinen en werkte daarvoor nauw samen met een groep van bedrijven die in Europa zowat 75 procent van het gecombineerde spoorvervoer uitvoert. Het gaat om vijf miljoen transporten per jaar.

“Klanten reserveren het treinvervoer voor hun ladingen via een digitale hub”, legt Alain Goossens uit. “Het gaat dan bijvoorbeeld om een trip van Moskou naar Hamburg met de vrachtwagen, en daarna verder naar Noorwegen via het spoor.” Om rendabel te zijn, moet een goederentrein minstens voor negentig procent volgeboekt zijn. In de realiteit is niet alle verwachte vracht aanwezig op het moment dat de trein vertrekt. “De redenen daarvoor lopen sterk uiteen. Soms beslist de klant om het transport te annuleren, maar vaak is de annulering onverwacht, bijvoorbeeld omdat de vrachtwagen motorpech heeft of vastzit in het verkeer.” Voor de spoorbedrijven zou het uiteraard handig zijn om een annulering te kunnen voorspellen, zodat ze de vrijgekomen ruimte nog tijdig met andere vracht kunnen opvullen.

Eén op tien ritten geannuleerd

De transportoperatoren gingen uit van één à twee procent annuleringen. “Concrete cijfers bestonden er echter niet”, zegt Alain Goossens. “In het archief bevinden zich ruim dertig miljoen records, maar data over geannuleerde opdrachten zijn daar niet bij. Wanneer een klant een boeking afzegt, is die informatie niet meer relevant voor de verdere planning van de treinen. Daarom waren er over de annuleringen geen historische data beschikbaar.” Goossens vroeg om die informatie wel ter beschikking te houden. Via de analyse van de data hoopte hij verbanden te ontdekken tussen de kans op annulering en andere elementen, zoals de opdrachtgever, de chauffeur, bestemming enzovoort.

Voor de eigenlijke analyse maakte hij gebruik van de Cortana Intelligence-suite van Microsoft, en dan vooral van de module voor machine learning. Dat leverde modellen op waarmee Goossens op zoek ging naar correlaties in historische data. De analyse gebeurde met data uit de productiedatabank – op drie verschillende momenten – en nam ongeveer dertig mandagen in beslag. De eerste analyse had 60.000 records als basis. Bij de tweede en derde oefening was het datavolume al gegroeid tot 140.000 en 800.000 records. Uit de analyse kwam naar voren dat van alle reservaties gemiddeld 10,7 procent op een annulering uitdraait. “Daar schrok de klant van”, zegt Alain Goossens, “want het gaat om een cijfer dat veel hoger ligt dan de inschatting die de operatoren zelf hadden gemaakt.”

Extra onderzoek

Een substantiële correlatie tussen de annulering van een boeking en andere elementen kon het onderzoek niet aanwijzen. “Om echt van een voorspellende analyse te kunnen spreken, moet de probabiliteit voldoende hoog liggen.” Het onderzoek vond geen verbanden die toelaten om voldoende accuraat te kunnen voorspellen of een bepaalde boeking op een annulering zal uitlopen. Alain Goossens: “Het feit dat er geen verbanden boven water komen, is op zich natuurlijk ook al nuttig. Het sluit alvast bepaalde veronderstellingen uit.” Intussen gaat de zoektocht naar correlaties verder. “We gaan onder meer data in verband met de geolokalisatie van vrachtwagens mee in de oefening opnemen, gecombineerd met verkeersdata. Dat moet voor extra inzicht zorgen, bijvoorbeeld rond de invloed van files en chauffeurs.”

DRIES VAN DAMME

“Als je geen verband vindt, biedt dat op zich ook nuttige informatie”

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content