De Belgische start-up NGData heeft zich op korte tijd gemanifesteerd als één van dé interessante ‘big data’-bedrijven. “Dankzij onze tool kan je met gelijke wapens strijden tegen Google en Facebook.”
De Gentse big data en ‘predictive analytics’-specialist NGData is één van die bedrijfjes die de tijdsgeest helemaal mee hebben. Het uitgangspunt – de technologie die gebruikt wordt door Google en Facebook beschikbaar maken voor banken, telco’s en andere ondernemingen – klinkt bijna te mooi om waar te zijn, maar leverde de starter op nauwelijks twee jaar tijd wel al referenties op als Time Warner, een grote Amerikaanse bank, Axa, France Telecom, De Persgroep en Telenet.
In 2015 wil ceo Luc Burgelman meer dan de helft van zijn zakencijfer in de VS optekenen, een markt die al veel rijper is dan de Europese. “Binnen twee tot drie jaar moeten we een omzet draaien van 15 miljoen euro”, klinkt het ambitieus, “vandaag zitten we aan 3,6 miljoen. Wie in de VS actief wil zijn, moet in eerste klasse durven spelen. Je moet een echte leader willen zijn in je sector.”
NGData kon al 6,5 miljoen euro ophalen bij een rist Belgische en Amerikaanse investeerders, en bereidt momenteel een B-ronde voor. Onder de geldschieters klinkende namen als William J. Pade van Oak Hill Capital Partners en voormalig McKinsey-partner Michael Patsalos-Fox. “Het feit dat zulke mensen investeren in NGData blijft niet onopgemerkt”, lacht de topman.
Burgelman is al heel zijn leven bezig met machine learning, artificiële intelligentie en data-analyse. “Ik heb een thesis gemaakt over AI en leerde bij het dienstenbedrijf Porthus (dat in 2010 verkocht werd aan de Canadese saas-leverancier Descartes) de business intelligence markt goed kennen”, vertelt de man tijdens een gesprek naar aanleiding van de lancering van het Lily 3.0-platform (zie kader). “Toen al had ik door dat bi-specialisten vooral data versluizen.”
GOOGLE NOW
Het ontginnen van grote hoeveelheden klantengegevens is geen sinecure. Klassieke analysemiddelen volstaan niet meer en leveren in het beste geval gedateerde en te ruime segmenteringen op, mijlenver verwijderd van de persoonlijke gegevens waarover internetgiganten zoals Google en Facebook beschikken.
“Google Now weet om hoe laat je opstaat, waar je woont en werkt, hoe lang je in de file gaat staan en met wie je afspraken hebt gemaakt”, geeft Burgelman een voorbeeld. “De consument raakt vertrouwd met dergelijke diensten, terwijl zijn bank-app tien jaar achterop hinkt.”
“Maximum 1 procent van de werknemers in een bank is bezig met business intelligence. De datawarehouses waar die mensen mee werken zijn niet flexibel genoeg en kunnen de berg data die verwerkt moet worden niet aan. Om een eenvoudige dataset te kunnen maken moet hemel en aarde bewogen worden. Na de oefening is je data drie maanden oud.”
De burgerlijk ingenieur oppert dat banken en telecombedrijven zich de vraag moeten stellen wat hun uitdagingen zijn. “Worstelen ze met big data? Welneen. Het probleem is dat ze met een groot verloop geconfronteerd worden, en met hevige concurrentie uit onverwachte hoek. De grote Amerikaanse internetbedrijven willen de bankiers van morgen worden, waardoor onze financiële instellingen een ongeziene identiteitscrisis doormaken.”
“Wil je je meten met die Amerikaanse giganten, dan moet je je diensten verbeteren en met gelijke wapens kunnen strijden. Dan moet een meerderheid van je personeel aan de slag kunnen gaan met de resultaten uit je data-ontginning. Dan moet je in real time analyseren op gepersonaliseerde klantensegmenten en daar naar handelen. Dat is wat we met NGData trachten te doen: de intelligentie achter Google in een product gieten dat die instellingen kunnen gebruiken.”
HADOOP
Hiervoor bouwt NGData verder op het populaire open source framework Hadoop, dat gebruikt wordt om grote hoeveelheden ongestructureerde data te kunnen verwerken. Ook Facebook, Yahoo, Google en vele anderen doen hun voordeel met dat raamwerk.
“Onze Lily-toepassing maakt van Hadoop een bedrijfsdatabase”, legt Burgelman uit. “Daarbij distilleren we uit alle mogelijke databronnen gedetailleerde klantenprofielen, die we duizenden scores toekennen. Ter vergelijking: bij traditionele BI-segmenteringen worden klanten in een klein aantal vakjes gestoken, bijvoorbeeld een 20-tal. Wanneer je 10 miljoen klanten hebt en slechts 20 vakjes, dan blijf je zitten met 500.000 klanten per segment. Hoe persoonlijk is dat?”
“Op basis van het resultaat voorspellen we wat de volgende stap gaat zijn. Waarin is de klant geïnteresseerd op basis van wat we van hem weten? Welk artikel wil hij straks lezen? Of over welke verzekering gaat hij zich morgen informeren?”
NGData focust met Lily in de eerste plaats op het bankwezen en op de telecomsector. “Dat zijn industrieën die heel wat interessante informatie hebben over hun klanten. De uitdaging bestaat er in om uit die databronnen zinvolle informatie te halen, en om te kunnen anticiperen op de wensen van de klanten.”
ECOSYSTEEM
Sinds vorige zomer is NGData gecertifieerd voor de Oracle Big Data Appliance (BDA). “We zijn de eerste externe tool die op die manier in de markt gezet wordt”, aldus nog Burgelman. “Tijdens Oracle Open World willen we daar toch wat buzz rond creëren. De uitbouw van een degelijk ecosysteem rond NGData is erg belangrijk, want de concurrentie zit niet stil. Big data wordt een hyper-concurrentiële sector. Als je binnen enkele jaren geen sterke positie hebt opgebouwd, ben je een vogel voor de kat.”
Overigens zit het wel snor met dat ecosysteem. NGData werkt sinds de start immers nauw samen met Cloudera, het dienstenbedrijf dat Hadoop-componenten uitrolt en daar potten mee breekt. Meer nog: Doug Cutting, de legendarische chief architect van Cloudera, zit in de adviesraad van NGData.
“De Cloudera-wave kan niet meer worden tegengehouden, want straks is big data niet meer weg te denken. Dat we geassocieerd worden met een bedrijf met zo veel potentieel maakt ons alleen maar sterker.”
In het software-segment komt de grootste concurrentie van SAS en van Teradata. “Dat zijn nu blijkbaar ook big data bedrijven geworden”, zegt Burgelman fijntjes. “Ook wij hebben klanten die segmenteren met SAS of met SPSS, en die tools maken ook leuke visualisaties, maar ze werken niet in real-time en zoeken enkel in lokale en statische data. Terwijl Lily ook verse databronnen aanboort en dagelijks nieuwe profielen opmaakt.”
“Dit gezegd zijnde, is het voor mij niet ‘of-of’, maar ‘en-en’. De datasets die wij gebruiken kunnen ook door SAS of SPSS gehaald worden. Eigenlijk zijn die tools dus complementair.”
“Cio’s van banken vertellen ons dat ze zwaar gaan inzetten op big data, maar we zien eigenlijk vooral dat er verwarring gecreëerd wordt, niet in het minst door de grote BI-bedrijven. Het gevolg is dat financiële instellingen koudwatervrees hebben. De stap naar analytics werd wel gezet, maar nu moet er echt naar big data geëvolueerd worden. Velen weten nog steeds niet wat je daar mee kan doen. Big data is wel de oplossing, maar voor welk probleem? Nogmaals: vertrek vanuit de vraag wat de uitdaging is, en welke tools er voor nodig zijn. Dat denkproces moet op de meeste plaatsen nog zijn intrede doen.”
Frederik Tibau
De grote Amerikaanse internetbedrijven willen de bankiers van morgen worden.
Fout opgemerkt of meer nieuws? Meld het hier