Met Watson Analytics lanceert IBM een toegankelijk analysetool voor bedrijfsgegevens en sociale-mediagegevens, te bevragen in gewone spreektaal. Het is een alternatief voor de grotere BI-tools die vooral door specialisten worden gebruikt.

Halverwege de jaren tachtig maakte ik voor het toenmalige Radio 3 een lange reportage over artificiële intelligentie (ai). Bij de geïnterviewde specialisten heerste er groot optimisme over hun vakgebied. Dat optimisme bleek onterecht. Prof. Luc Steels, die in 1983 het Artificial Intelligence Laboratory van de VUB oprichtte en die ik dat jaar ook interviewde, gaf het onlangs toe in De Tijd : “Een 3-jarige is nog altijd slimmer dan een robot.” Hij reageerde daarmee op het voornemen van Facebook-oprichter Mark Zuckerberg om een robot te ontwerpen die als zijn butler werkt. “De onderliggende intelligentie (van robots) is al decennia dezelfde. Ze is gebaseerd op algoritmen die er dertig jaar geleden ook al waren”, aldus Steels. Maar betekenis, daar worstelt de ai enorm mee.

DEEP LEARNING

Hoezo er is geen echte ai zult u misschien opwerpen ? Onlangs nog versloeg Google’s DeepMind-computer Go-wereldkampioen Lee Sedol ? En wat dan met IBM’s Deep Blue die eind de jaren negentig Gary Kasparov alle hoeken van het schaakbord liet zien ? Of IBM’s Watson die de aartsmoeilijke Amerikaanse quiz-show Jeopardy won ? Met artificiële intelligentie hebben al die voorbeelden echter weinig te maken. Het zijn allemaal voorbeelden van wat tegenwoordig populair “deep learning” wordt genoemd, oftewel artificiële neurale netwerken. Door de sterk toegenomen rekenkracht en de beschikbaarheid van enorme, snel toegankelijke dataverzameling kunnen dergelijke systemen de indruk van intelligentie wekken. Met volledige ai, ofwel artificial general intelligence (agi), heeft dit echter weinig te maken.

Maar dat zegt natuurlijk weinig of niets over de capaciteiten en nuttigheid van “deep learning”-systemen zoals DeepMind en Watson. Specifiek gebruikt IBM zijn Watson-technologie meer en meer ook voor commerciële toepassingen, bijvoorbeeld de integratie van Watson in het zakelijke communicatietool Verse dat we in oktober vorig jaar testten (zie online archief voor abonnees). Recent eindigde de eind 2014 gestarte bètaperiode voor IBM Watson Analytics, een gebruiksvriendelijk business intelligence tool dat voortaan in verschillende uitvoeringen voor iedereen commercieel beschikbaar is. Watson valt trouwens onder een aparte groepsdivisie binnen IBM met tweeduizend medewerkers, waarin het bedrijf ondertussen één miljard dollar investeerde. De IBM Watson Group is naast Watson Analytics ook verantwoordelijk voor twee andere cloudgebaseerde diensten, namelijk Watson Discovery Advisor, dat farmaceutische bedrijven assisteert bij het ontdekken van nieuwe formules en medicijnen, en Watson Explorer, een intelligente zoekmachine voor massieve, al dan niet gestructureerde bedrijfsdata. Deze drie producten kunnen via de open Watson API ook geïntegreerd worden in bedrijfssystemen en software van derden.

BI VOOR LEKEN

Watson Analytics is in essentie een business intelligence-tool voor leken, die met behulp van natuurlijk taal analyses kunnen loslaten op willekeurige dataverzamelingen. Het is dus geen vervanging voor grote bi-tools zoals IBM Cognos waarmee specialisten bedrijfsgegevens analyseren. U moet het eerder zien als een eenvoudiger analysetool voor “ad hoc” gebruik door bijvoorbeeld marketeers die snel een rapport willen over een bepaalde tendens of gebeurtenis zonder dat ze daarvoor de bi-afdeling hoeven lastig te vallen. Het systeem kan worden gevuld met allerlei bedrijfsgegevens, op voorwaarde dat die aangeleverd worden in spreadsheet-formaat (Excel of .csv) of IBM SPSS Statistics sav-format op een lokale (netwerk)drive of een clouddrive zoals Dropbox, Box of Microsoft OneDrive. IBM voegt voortdurend nieuwe mogelijkheden toe. Sinds eind vorig jaar kan Watson Analytics ook rechtstreeks werken met sociale media-gegevens (Twitter, forums, review sites), voor zover die in het Engels, Frans, Duits of Spaans zijn. Met die Watson Analytics for Social Media kan men antwoorden vinden op vragen zoals “wat zijn de meest besproken eigenschappen van mijn product of productcategorie”, “wat is de reputatie van de verkopers die ik overweeg”, of “waar maken de kiezers in mijn kiesgebied zich het meest druk over?”

WERKING

Wij gebruikten tijdens de test een spreadsheet met tienduizenden sap-meldingen en verschillende xls-bestanden van data.gov.be. Zodra de dataset geladen is, vraagt het systeem u om eventuele kolomtitels te markeren. Watson analyseert de data en plakt er dan een kwaliteitscijfer op tussen één en honderd. U kunt uw dataset achteraf verfijnen door bijvoorbeeld kolommen en rijen anders te benoemen of sorteren, rijen uit te sluiten, de inhoud van de cellen anders te markeren of de manier waarop gegevens worden verzameld te wijzigen. Watson Analytics helpt u bij het verfijnen van de dataset door de cijfermatige kolommen te voorzien van een kwaliteitscijfer. U kunt zo kolommen met een lage kwaliteit uitsluiten omdat ze bijvoorbeeld te weinig gegevens voor een zinvolle analyse bevatten. Dit kan een flinke verbetering van de datakwaliteit opleveren en het loont de moeite om dit eerst in orde te maken. Bijvoorbeeld de kwaliteit van de dataset “Aandeel huishoudens met een computer” van data.gov.be konden we op die manier verbeteren van 54/100 of “gemiddeld” naar 92/100 of “hoog.”

Zodra u op uw dataset klikt, suggereert het systeem een aantal vragen die u kunt stellen : “hoeveel keren komen die en die waardes voor”, “wat is het verband tussen de ene en de andere waarde”, “hoe verhoudt zich waarde x tot waarde y”, “wat is de meest gemeenschappelijke waarde in kolom x”, etc. U kunt ook zelf vragen stellen en wordt daarbij eventueel geholpen door de “Ask a question”-wizard.

Naast analyses kunt u ook voorspellingen loslaten op uw dataset. U definieert daarbij maximaal vijf “targets” (vijf soorten gegevens uit uw dataset). Ook hier helpt een wizard u op weg. Ten slotte verzamelt u in het onderdeel “Assemble” resultaten en inzichten in rapporten met infographics, diavoorstellingen of tijdslijnen die u eenvoudig samenstelt door middel van klikken en slepen van gegevens uit de dataset. De aldus gecreëerde rapporten kunnen steeds hergebruikt worden en gevuld met de nieuwste gegevens, op voorwaarde dat het formaat van de onderliggende dataset dezelfde blijft.

EDITIES

De gratis versie van Watson Analytics verwerkt spreadsheet-datasets van maximaal 500 MB met 100.000 rijen en 50 kolommen. De Plus-versie, die wij hebben getest, is geschikt voor datasets van 2 GB met maximaal 1 miljoen rijen en 256 kolommen. Deze versie bevat ook de Social Media-add-on, plus de mogelijkheid om gegevens te importeren uit IBM Cognos Business Intelligence. Extra gegevens kunnen bijgekocht worden in pakketten van 10 GB. Deze versie kost 29,95 euro per gebruiker per maand. Ten slotte is er de Professional-versie, waarvan wij een demo kregen, waarin meerdere gebruikers samenwerken rond dezelfde datasets, die een maximale omvang van 100 GB hebben met 10 miljoen rijen en 500 kolommen. Extra data kan men tegen betaling toevoegen à rato van 50 GB. Deze versie kost 77,2 euro per gebruiker per maand. De Professional-versie laat ook toe om bestaande dataverzamelingen, voorspellingen, bevragingen en “views” te delen met anderen.

CONCLUSIE

Watson Analytics laat toe om via eenvoudige vragen en antwoorden willekeurige dataverzamelingen te analyseren zonder doorgedreven kennis van booleaanse operatoren, Excel-formules of sql-queries. De beste resultaten verkrijgt u als u Watson loslaat op dataverzamelingen waarmee u enigszins vertrouwt bent. Op die manier stelt u vooral relevante vragen en voert u met relatief weinig inspanning werkelijk nuttige data-analyses uit.

Jozef Schildermans

“Watson Analytics is in essentie een business intelligence tool voor leken”

Partner Content