Maxime Vermeir
Vijf misverstanden over datamining
Datamining wordt gebruikt om gegevens te analyseren en nieuwe verbanden te ontdekken, waardoor organisaties inzichten krijgen die hen helpen om betere beslissingen te nemen. Data-analyse gebeurt al honderden jaren, maar is recent meer naar de voorgrond getreden door de introductie van nieuwe technologieën. Volgens Maxime Vermeir, Head of Customer Innovation bij ABBYY, gaat die ontwikkeling echter gepaard met veel misvattingen en onjuistheden over wat datamining is, hoe het werkt en wat de voordelen zijn.
Misverstand #1: Datamining is een gecompliceerd en ingewikkeld proces
De algoritmen achter datamining zijn wellicht complex, maar met de juiste tools is de technologie eenvoudig in te zetten en kan het de dagelijkse bedrijfsvoering ingrijpend veranderen. Met dataminingtools kun je gemakkelijker bedrijfsgegevens inzien en interpreteren met grafieken en simpele query’s. Datavisualisatie geeft inzage in de prestaties van de onderneming. Je kunt gericht problemen en potentiële uitdagingen in kaart brengen en gefundeerde beslissingen nemen om inefficiënties te verbeteren.
Dataminingtools zijn niet zo moeilijk te gebruiken als men denkt; ze zijn juist ontworpen zodat organisaties informatie eenvoudig kunnen interpreteren. Organisaties die overwegen ermee aan de slag te gaan, moeten zich niet laten afschrikken.
Vrijwel elke hoeveelheid data kan waardevolle inzichten opleveren waarmee bedrijven problemen in kaart kunnen brengen
Misverstand #2: Datamining is de zoveelste trend die binnenkort zal overwaaien
Bedrijven hanteren al geruime tijd kwantitatieve analyses: datamining is simpelweg een doorontwikkelde variant, die is ontstaan in het begin van de twintigste eeuw. Data is overal en de omvang van sommige databases is enorm, waardoor het ontzettend moeilijk is om handmatig nieuwe inzichten te verkrijgen. Het gebruiksgemak, de tijd- en kostenbesparing, en de snelle analyse van de prestaties van het bedrijf maken het lastig voor te stellen dat datamining ooit nog naar de achtergrond zal verdwijnen. Sterker nog, datamining zal zich blijven ontwikkelen als een hulpmiddel dat organisaties de komende jaren zal ondersteunen.
Misverstand #3: Datamining-technieken zijn zo geavanceerd dat zij domeinkennis overbodig maken
Expertise en ervaring kunnen niet zomaar worden vervangen door datamining-technieken. Het is belangrijk om op de hoogte te blijven van nieuwe analysemethoden, maar zonder kennis van het bedrijf en zijn markten bestaat voor deze methoden geen toepassing. Het is dan ook essentieel om diepgaand begrip te hebben van beide onderdelen.
Als je een analyse uitvoert van bedrijfsgegevens is het belangrijk een expert uit de branche te betrekken voor de juiste interpretatie van de verkregen informatie. Tegelijkertijd is het voor iemand met kennis van de organisatie cruciaal om een expert in datamining te raadplegen voor analyse met gebruik van tools en modellen. Datamining en domeinkennis gaan hand in hand.
Misverstand #4: Datamining is alleen zinvol bij grote databases
Hoewel datamining doorgaans wordt gebruikt voor het analyseren van grote datasets, kan het voor elke database worden gebruikt. Vrijwel elke hoeveelheid data kan waardevolle inzichten opleveren die bedrijven kunnen inzetten om problemen in kaart te brengen en potentiele uitdagingen te detecteren. Zelfs deze ‘sample size’ datasets stellen bedrijven in staat om inefficiënties te vinden die zij proactief of gepland kunnen verbeteren. Het kan in sommige gevallen ook handig zijn om alleen bepaalde gegevens uit een groot datawarehouse te ontsluiten in plaats van de volledige database te analyseren. Je hoeft alleen maar te weten welke gegevens je wilt onderzoeken om waardevolle resultaten en inzichten te genereren.
Misverstand #5: Datamining is alleen nuttig in bepaalde sectoren
Ondanks het feit dat datamining vooral wordt gebruikt in data-gedreven, innovatieve sectoren, is het een hulpmiddel dat in elke branche kan worden gebruikt. Er zullen altijd situaties zijn waarin datamining niet voldoende ROI oplevert, maar grootte van de database of het type sector maakt niet echt uit. Je kunt waarde onttrekken aan elk type data dat je analyseert.
Fout opgemerkt of meer nieuws? Meld het hier