De funderingen zijn gelegd, de voornaamste afspraken gemaakt. Het semantische web heeft zijn academische juk afgeschud en is klaar voor commerciële exploitatie. Dat was althans de boodschap op de Semantic Technology Conference in San José. Maar analisten waarschuwden meteen voor te veel optimisme: “Het zal nog jaren duren voor we op kruissnelheid zijn.”
Het hele 2.0-gebeuren is nog niet goed en wel verteerd, of het internet staat alweer op een keerpunt. Een noodzakelijk keerpunt volgens velen. De voorbije jaren is het world wide web een beetje het slachtoffer geworden van zijn eigen succes. Er staat zo veel informatie online, en die informatie is zo gefragmenteerd, dat gebruikers door de bomen het bos niet meer zien.
Eén van de problemen is dat het web altijd opgevat werd als een instrument voor het delen van documenten, en niet zozeer als een platform voor het delen van de informatie die vervat zit in de miljarden internetpagina’s. Bij het internet van morgen, vaak het semantische web of web 3.0 genoemd, gaat dat anders zijn, zo wil men ons doen geloven.
Het uiteindelijke doel is om te komen tot een ‘dataweb’, waarbij niet enkel documenten, maar ook de individuele data-eenheden binnen die documenten aan elkaar gelinkt zijn. Is zo’n web een utopie? Misschien. Maar vast staat dat er semantische ‘eilanden’ zullen opduiken, en toepassingen die de internetervaring nog maar eens grondig veranderen. Op dit eigenste ogenblik groepeert het Linking Open Data-project al heel wat semantische databases en datamodellen van over de hele wereld.
Het dataweb zal bestaan uit gestructureerde maar open data-eenheden, die gepubliceerd worden in herbruikbare en vooral bevraagbare semantische formaten. RFD (Resource Description Framework) moet zowat de belangrijkste semantische standaard zijn, en de databases die RDF-informatie bevatten, kunnen bevraagd worden met speciaal daarvoor ontwikkelde talen zoals SPARQL.
Bij één enkele bevraging wordt er data opgehaald op verschillende locaties, waardoor er geheel nieuwe vormen van data-integratie ontstaan, en de interoperabiliteit van applicaties nog gevoelig kan verbeteren.
Voor alle duidelijkheid: zo ver zijn we nog niet. In een gesprek met Data News liet analist Edward Poshkus van durfinvesteerder Creative Strategies verstaan dat het nog zeker twee tot drie jaar zal duren vooraleer er sprake kan zijn van een grote doorbraak. Maar dat zelfs researchdirecteur Peter Norvig van Google tijdens een panelgesprek toegaf dat ook zijn bedrijf data gaat omzetten in RDF, was volgens vele aanwezigen het ultieme bewijs dat de trein eindelijk in beweging gezet is.
Mede dankzij de omzetting van informatie naar RDF en consoorten, houdt het semantische web ook de belofte in dat het beter zal weten wat de eindgebruikers wenst. Cruciaal bij web 3.0 is dan ook de introductie van een rist nieuwe zoekalgoritmes. Bing biedt al een heel klein voorsmaakje. “Met Bing proberen we de zoekervaring al ietsje gemakkelijker te maken”, vertelde general manager Scott Prevost van het voormalige PowerSet aan het publiek.
“Wat reizen betreft, gezondheid of zelfs shoppen, begrijpen we beter wat mensen juist willen doen op het net. Waardoor we informatievere en snellere resultaten kunnen aanbieden. Van tien saaie en vaak irrelevante blauwe links zijn we geëvolueerd naar het aanbieden van iets minder links, maar wel links die relevanter zijn en beter gestructureerde informatie bevatten. Het is al lang niet meer voldoende om enkel de ranking van de links goed te hebben.”
Toepassingen
Nogmaals: ondanks de hoeraberichten van de vele standhouders en de interessante initiatieven die werden voorgesteld op de Semantic Technology Conference, is het semantische web nog geen realiteit. Wel zijn er al heel wat early adopters actief die op één of andere manier gebruik maken van wat men semantische technologie zou kunnen noemen.
SearchMonkey van Yahoo! is een interessant voorbeeld. Gebruikers kunnen semantische webextensies toevoegen aan hun zoekrobot, waarmee ze onmiddellijk content kunnen zien op de resultaatpagina waarvoor ze anders doorgeklikt zouden moeten hebben.
Geïnteresseerden hebben de keuze tussen extensies voor restaurantrecensies, LinkedIn-profielen, noem maar op. Een mooi voorbeeld van hoe Yahoo het mogelijk maakt voor eigenaars van websites om anderen gebruik te laten maken van hun content.
Wie van reizen houdt, kan een kijkje gaan nemen bij TripIt.com. Deze ‘semantische’ webapplicatie verzamelt alle informatie over je vluchten, je hotelboekingen, het huren van een wagen, en zowat alle andere reisinformatie. Het enige wat je als gebruiker moet doen, is de bevestigingsmail naar TripIt sturen, en de site kneedt alle informatie mooi samen tot één geheel. Of hoe 3.0-technologie je kan helpen om data die verspreid zit over tal van websites, samen te brengen onder één handige paraplu. Erg indrukwekkend was de keynote van Tom Gruber van Siri, een bedrijf dat een ‘virtual personal assistant’ (VPA) bouwt voor de i-Phone. De VPA focust op het uitvoeren van taken. Gebruikers kunnen op een natuurlijke manier een vraag stellen aan de applicatie (via spraaktechnologie, of gewoon via het toetsenbord), die op haar beurt een antwoord formuleert. Alsof er een echte conversatie wordt opgestart. Hoe dat kan? Omdat de applicatie contextgevoelige informatie ophaalt, zoals de plaats van de gebruiker. Siri heeft wel wat weg van het jongste idee van Jo Lernout (MiaMia), maar is heel wat geavanceerder.
De Zwitsers van Ontos kwamen dan weer met een toepassing die interessant kan zijn voor mediabedrijven. De software van On-tos zet de betekenis van kernwoorden uit teksten in het archief automatisch om in RDF-formaat, waardoor er bij het tikken van een nieuwe tekst een schermpje verschijnt met links naar oudere, verwante stukken die interessant zou kunnen zijn voor de redacteur in kwestie. Een beetje zoals bij het Calais-project van Thomson Reuters dus.
En om met de woorden van Tom Tague van Thomson Reuters te besluiten: “Als je geld wil verdienen met semantische technologie, moet je naar de mensen gaan, naar mobieltjes en naar de browser. De gebruikservaring en de interface zullen van het allergrootste belang blijken te zijn.”
Frederik Tibau
Fout opgemerkt of meer nieuws? Meld het hier