"Data, juist." Al dan niet gevolgd door een lange stilte of een diepe zucht. Dat is hoe we ons de gemiddelde CEO voorstellen die zich afvraagt wat er moet gebeuren met de beschikbare data over producten, klanten, en noem maar op. Dat die data waardevol zijn, weet de CEO intussen heus wel. Volgens een studie van KPMG verwachten zeven op tien CEO's dat de analyse van die data voor omzetgroei zorgt. Onderzoek van Accenture toont aan dat negen op tien CEO's de analyse van data als essentieel beschouwen om de concurrentiële positie van hun bedrijf te verdedigen. Alleen: hoe begin je daar aan? Volgens Harvard Business Review blijft het resultaat van data-analyse in bijna negen op tien gevallen onder de verwachtingen.

Die ontgoocheling hoeft niet echt te verbazen. De analysetools die vandaag in de mainstream circuleren, zijn niet voorzien op de huidige explosie in data die afkomstig zijn uit allerlei systemen, machines en sociale media. Niet alleen kunnen ze de schaal niet aan, doorgaans zijn ze ook te strikt op rapportering gericht: op het verleden, niet op het voorspellen van de toekomst. Valt dat op te lossen met meer hardware en meer data engineers? "Daar geloof ik niet in", zegt Grant Halloran, CMO bij Omnisci. "Er zijn in de markt minstens de helft meer data scientists nodig. Waar moeten die op korte termijn vandaan komen? En dan nog, de data scientists die er wel zijn, verspillen drie vierde van hun tijd." Ze besteden namelijk veel meer tijd aan data prepping dan aan productief werk.

Bliksemsnel

Enter Todd Mostak. Als student aan de Harvard Kennedy School voerde hij in 2012 onderzoek naar het gebruik van Twitter tijdens de Arabische Lente. "Ik verzamelde meer dan een miljard tweets", vertelt hij tijdens ons bezoek aan het kantoor van Omnisci in het centrum van San Francisco. "Alleen had ik geen goede oplossing om de berichten te analyseren of te visualiseren." Toen hij een jaar later aan het MIT in contact kwam met GPU computing, ging er een belletje rinkelen. De Graphics Processing Unit (GPU) is de processor die bij een computer de videotaken uitvoert. En wat wil het geval? Die GPU - de grafische kaart - kan veel meer dan dat alleen. Heel kort samengevat: om big data te analyseren heb je geen reusachtig datacenter meer nodig, maar een doos met een reeks GPU's.

"Er zijn in de markt minstens de helft meer data scientists nodig. Waar moeten die op korte termijn vandaan komen?"

Met dat idee ging Todd Mostak van start met zijn bedrijf: eerst als MapD, sinds een nieuwe financieringsronde - en de bijhorende rebranding begin oktober - onder de naam OmniSci. De kern van de oplossing bestaat uit een open source SQL engine, ontwikkeld voor het gebruik van GPU computing. Daarnaast is er een rendering engine die de snelle query's op de data even snel visualiseert. "Je kunt Omnisci on-premise draaien, op specifiek toegewezen hardware, maar even goed gebruik je het platform via Amazon of Google." Op de site van Omnisci zijn live demo's te vinden waarmee je als gebruiker in milliseconden query's uitvoert op tientallen miljarden niet-geïndexeerde records, simpelweg via je browser. "We gebruiken daarvoor vier servers met GPU's, meer is het niet", zegt Todd Mostak. "De brute kracht van GPU computing laat toe om die zware query's in een fractie van een seconde uit te voeren en te visualiseren."

Opportuniteiten

Omnisci profileert zich als een alternatief voor klassieke databasespelers als IBM en Oracle, maar ziet zichzelf tegelijk niet als een concurrent van de klassieke tools voor BI. "We sluiten er eerder op aan", stelt Todd Mostak. Uiteraard heb je geen GPU computing nodig om een wekelijks verkooprapport te produceren. Omnisci ziet vooral opportuniteiten bij analyse die te maken heeft met fraudedetectie, smart metering, de monitoring van netwerken, enzovoort. In de zoektocht naar waarde uit extreme big data maken onder meer Volkswagen en Verizon intussen van Omnisci gebruik.