De Belgische integrator TenForce maakt nochtans zelf gebruik van semantische technologie, zij het dan in een industriële context. "We hebben heel wat ervaring in het opzetten van totaaloplossingen voor grote uit-geverijen die reusachtige hoeveelheden tekst moeten verwerken en categoriseren", zegt medeoprichter Bastiaan Deblieck. "Bij Wolters Kluwer bijvoorbeeld, worden in een recent project automatisch indexen gebouwd op basis van één thesaurus. Bij een ander project maken we gebruik van RDF-triples om de content te organiseren. Vervolgens zorgen we er dan voor dat er manipulaties kunnen gebeuren op die data. Om de thesauri te beschrijven gebrui...

De Belgische integrator TenForce maakt nochtans zelf gebruik van semantische technologie, zij het dan in een industriële context. "We hebben heel wat ervaring in het opzetten van totaaloplossingen voor grote uit-geverijen die reusachtige hoeveelheden tekst moeten verwerken en categoriseren", zegt medeoprichter Bastiaan Deblieck. "Bij Wolters Kluwer bijvoorbeeld, worden in een recent project automatisch indexen gebouwd op basis van één thesaurus. Bij een ander project maken we gebruik van RDF-triples om de content te organiseren. Vervolgens zorgen we er dan voor dat er manipulaties kunnen gebeuren op die data. Om de thesauri te beschrijven gebruiken we de SKOS-standaard (Simple Knowledge Organisation System), en OWL." Die werkwijze opent heel wat perspectieven naar het koppelen van de verschillende bronstructuren. "Zo kan je bijvoorbeeld juridische classificaties die gebruikt worden in een bepaalde rist wetteksten, koppelen aan classificaties van andere wetteksten", gaat Deblieck verder. "Daarnaast zitten we in de opstartfase van een project bij Eures, een onderdeel van het directoraat voor werkgelegenheid van de Europese Commissie. Die organisatie hanteert verschillende categorisaties voor beroepen en competenties. Wij steken die categorisaties in één taxonomie, opdat ze in 25 verschillende talen beheerd kunnen worden. De mensen van Eures dromen ervan om de twee structuren, voor beroepen en voor competenties, te koppelen. Zodanig dat je meteen kan zien welke competenties je nodig hebt om een bepaald beroep uit te oefenen." Dankzij SKOS en RDF kunnen die verschillende datasets gekoppeld worden. "In een later stadium, en daar staan we nu heel dicht bij, kan je al die gegevens nog eens gaan verspreiden op het internet, via Linked Open Data. Al die gestructureerde informatie is dan machine readable, waardoor werkgelegenheidsorganisaties zoals de VDAB hun beroepsclassificaties in principe bij de Europese Commissie kunnen gaan halen." "Een mooi voorbeeld is de website van de BBC", klinkt het nog. "Sommige onderdelen van die site kan je ook in RDF-formaat bekijken. Die data bevat betekenis en structuur, en kan dus geïnterpreteerd en gerecupereerd worden door andere websites of diensten. Het komt erop aan ontologieën of modellen te bouwen die deze data betekenisvol kunnen presenteren en verwerken. Het gevolg zullen geautomatiseerde integraties zijn die verder gaan dan onze stoutste dromen." De semantische standaarden die de voorbije jaren ontwikkeld zijn om die integraties mogelijk te maken, zijn volgens Deblieck onontbeerlijk, ook al komen ze grotendeels uit de academische wereld. "Er wordt veel gezegd en geschreven over het semantische web, en semantische technologie ís ongelooflijk krachtig voor alles wat te maken heeft met integratie van data, BI of rapportering, maar we moeten een beetje realistisch blijven." Er zijn heel wat onderzoeksinitiatieven, en ook tal van overheden springen mee op de trein. Maar het is nog erg moeilijk om bedrijven te overtuigen van de toegevoegde waarde. We anticiperen wel hoor, en TenForce gaat ook met grote klanten praten over de mogelijkheden van geïntegreerde en gestructureerde oplossingen met semantics, maar we zijn er nog niet. Geef ons nog wat tijd." www.tenforce.be Frederik Tibau