De Brusselse start-up Collibra heeft op de Semantic Technology Conference in San José een suite gelanceerd die bedrijven moet helpen om hun data beter te managen door middel van semantische technologie. “De sofware doet eigenlijk dienst als een digitale tolk die een woordenboek opstelt voor hij begint te vertalen”, aldus Patrice Krakow van SCA Packaging.
SCA Packaging is een belangrijke Europese producent van kartonnen verpakkingen op maat. Tot de grote klanten van het bedrijf behoren onder meer Nestlé en Unilever. SCA ontvangt dagelijks grote hoeveelheden aankooporders, en tracht de daarmee gepaard gaande processen al een tijdje te automatiseren. “We moeten voorturend informatie van het éne systeem naar het andere doorsluizen”, vertelt system integration coördinator Patrice Krakow, “maar onze afnemers gebruiken allemaal andere applicaties. Het doorgeven van de data is dus altijd een erg moeilijke opdracht geweest.”
De informatie die gedeeld moet worden, is eigenlijk krek dezelfde, maar het zijn de formaten die verschillen. Denk aan twee administraties die gegevens van eenzelfde persoon opslaan, maar allebei op een ietwat andere manier.
De data moet dus van het ene formaat naar het andere worden omgezet, en die omzetting kan dan nog eens verschillen van klant tot klant. “We hadden bij SCA wel middleware die transformaties uitvoerde, maar de vertalingen die daarvoor dienden te worden opgemaakt, gebeurden op een verre van accurate manier, in die mate zelfs dat er soms bijna geraden werd welke informatie-eenheden nu juist overeen kwamen.”
Collibra-motor
Met de softwaretoepassingen van Collibra kan er een mouw gepast worden aan dat euvel. “In eerste instantie wordt de betekenis van een voorwerp of van een woord formeel vastgelegd”, gaat Krakow verder. “Eigenlijk wordt er dus een soort van gezamenlijke definitie opgemaakt, en dit op een gestructureerde manier. Zo is de software altijd in staat om de betekenis, de semantiek van een woord of een zin te kunnen vatten.” Daarna legt de software een link tussen die semantiek en het gebruikte formaat. En dat kunnen verschillende formaten zijn, ook RDF. Eens de betekenis gedistilleerd is uit beide formaten, voert de Collibra-motor de transformatie uit. In real time. En wat dat betreft is het bedrijf absoluut uniek.”
Wat Collibra doet met zijn pakket, proberen heel wat softwarebedrijven al héél lang te doen. “Het probleem is altijd geweest dat men de semantiek in één of ander vaststaand formaat wilde gieten, bijvoorbeeld xml,” klinkt het nog. “Men wilde eigenlijk een soort van formulier opstellen dat alle andere formulieren overbodig zou maken. Maar zo werkt het niet. Ik geloof niet in een top-down benadering.”
“De toepassing van Collibra pikt enkel de betekenis op. Het gaat hier dus niet over het zoveelste nieuwe semantische formaat, en het bedrijf heeft ook geen nieuwe container gebouwd voor de opslag van data. Waar het wel over gaat, zijn ontologieën (formele specificaties van concepten) die onmiddellijk inzetbaar zijn. Wanneer ik morgen van systeem verander, of er komt een formaat bij, dan wordt de ontologie aangepast en kunnen we meteen verder werken.”
Frederik Tibau
Fout opgemerkt of meer nieuws? Meld het hier