Klinkt het bovenstaande wat al te overdreven? Al te zeer als 'overhyping'? Allicht niet. Onder de vlag van 'big data' dienen zich vandaag nieuwe tools en diensten aan, die het bedrijven mogelijk maken om snel, haast in reële tijd grote hoeveelheden data uit verschillende bronnen samen te brengen, te analyseren en aan te wenden. Waarbij als steeds het ware succes is weggelegd voor de bedrijven die deze beloftevolle producten ook op een rationele en zinvolle wijze aanwenden.
...

Klinkt het bovenstaande wat al te overdreven? Al te zeer als 'overhyping'? Allicht niet. Onder de vlag van 'big data' dienen zich vandaag nieuwe tools en diensten aan, die het bedrijven mogelijk maken om snel, haast in reële tijd grote hoeveelheden data uit verschillende bronnen samen te brengen, te analyseren en aan te wenden. Waarbij als steeds het ware succes is weggelegd voor de bedrijven die deze beloftevolle producten ook op een rationele en zinvolle wijze aanwenden. Nieuw is 'big data' overigens ook weer niet, want grote datasets had je ook al in het verleden, bij de opkomst van data warehouses. Nieuw is evenwel de hoeveelheid data - vlotweg in de ordegrootte van petabytes, en binnenkort zelfs exabytes (1018 bytes) -en hun grote verscheidenheid aan structuur (of geen structuur) en afkomst (interne en externe bronnen). Dat maakt dat de definitie van 'big data' zelf nog wat wazig is, wat het dan weer 'big data novicen' op een event als Big Data niet makkelijker maakt. De concrete aanleiding voor de belangstelling is wel duidelijk: bedrijven willen voordeel (en dus geld) halen uit de nieuwe databronnen als sociale media, mobiele omgevingen en binnenkort het 'internet der dingen', en rekent daarvoor op de ongelimiteerde opslag- en verwerkingsmogelijkheden die worden geboden door 'cloud'-type diensten. Of zoals werd gesteld: 'big data' systemen bezorgen onze planeet een zenuwstelsel, waarlangs de data continu naar de hersenen voor verwerking stromen. En voor bedrijven is 'big data' dan ook geen kwestie van 'of', dan wel 'wanneer'. Dat was de algemene teneur op het Parijse Big Data event. Wat is dan het verschil met datawarehouses en 'business intelligence' wordt dan al gevraagd? Deze laatsten zijn allicht qua 'antwoorden' meer strategisch, lange termijn gericht, op basis van historische gegevens. Big data biedt dan weer de middelen voor een snelle, ogenblikkelijke analyse van grote datasets, en is dus meer 'operationeel' van aard. Je wint de data uit verschillende bronnen in, en je doet er meteen wat mee. Hoewel niet is uitgesloten dat je uit dergelijke datasets ook nog andere rapporten distilleert. Omdat het nut van 'big data' afhangt van het inzicht in de 'use case' is het dan ook interessant dat voor het eerst een 'Trophée de l'innovation' voor big data projecten werd geïnteresseerd. Niet minder dan 43 projecten werden ingediend, en niet uitsluitend door marketing afdelingen (momenteel nog de grote voortrekkers van het big data gebeuren). Ook waren die afkomstig uit alle mogelijke sectoren, zoals telecom, de bankwereld, pharma, maar ook uit de sportwereld (Roland Garros Slamtracker), de Post en de ruimtevaartwereld (ESA, rond de dataverwerking van de Gaia-satelliet, bestemd voor de nauwkeurige plaatsbepaling en bewegingen van miljoenen sterren in onze melkweg). Een 'surprise' award werd toegekend aan een wel bijzonder data-intensief project van het astronomische 'Observatoire de Paris'. Dat simuleerde op Frankrijks grootste supercomputer de structuren van heel het heelal conform drie theorieën van 'donkere energie' in het kader van het DEUS-project, goed voor een totaal van 150 petabyte aan gegevens! Interessant is dat in het big data gebeuren ook uitdrukkelijk aandacht wordt besteed aan het gebruik van 'open data', in casu data die werden gegenereerd door overheidsdiensten of gefinancierd met overheidsgeld - nog benadrukt in een videopresentatie van EU-commissaris Kimmo Rosssi, die een Europese dataverwerkingsindustrie wil zien opbloeien. De voorbeelden mogen wellicht wat exotisch klinken - zoals de Japanse spoorwegen die erin slaagden dankzij de data uit seismografen de hoge snelheidstreinen 43 seconden voor de grote aardbeving tot stilstand te brengen - maar uiteindelijk hangen de baten af van de creativiteit om met data om te gaan. En dat zonder respect te verliezen voor privacy of te vervallen in een ongebreidelde 'Big Brother' toestand..Guy KindermansBedrijven willen voordeel (en dus geld) halen uit de nieuwe databronnen als sociale media, mobiele omgevingen en binnenkort het 'internet der dingen'. Big data biedt middelen voor een snelle, ogenblikkelijke analyse van grote datasets.