De ‘osteofoon’ (bone microphone) zou de efficiëntie van spraakherkenning in een logistieke omgeving gevoelig moeten verbeteren.
Het R&D-project LO-V-Wall (LOgistique Vocale en WALLonie) (zie kader) wil een oplossing voor spraakherkenning ontwikkelen en implementeren, gebaseerd op de techniek van microfonen met botgeleiding (osteofonen). Deze technologie moet een antwoord bieden op de nadelen of lacunes die de traditionele technologieën op basis van barcodes of stembesturing in moeilijke omgevingen ondervinden. “Stembesturingen zoals aangeboden door Voxware of Vocollect, zijn weinig efficiënt in de lawaaierige omgeving van bijvoorbeeld een hangar en leiden daardoor tot fouten”, verklaart Stéphane Deketelaere, projectleider bij Multitel. “Om die reden is de firma VoiceInsight op zoek gegaan naar een flexibelere en meer solide oplossing.” Doelmarkten: “elke mobiele omgeving, maar in hoofdzaak de vocale logistiek, overal waar een handenvrije en oogvrije besturing de efficiëntie kan verbeteren”, benadrukt Jean-Jacques De Gheyndt, commercieel directeur van VoiceInsight. “We verwijzen dan naar de picking in de opslagplaatsen, de ruimten waar post gesorteerd wordt of waar verschillende operatoren praten en bewegen. Elke verbetering die garandeert dat het order dat door het systeem wordt gedetecteerd, afkomstig is van de juiste spreker, zal een grote vooruitgang zijn. Hetzelfde geldt in een lawaaierige opslagruimte waar de osteofoon de filtering van elk vreemd geluid voor de spraakherkenning zal verbeteren.”
De uitdaging
De verwerking van de botvibraties van de schedel vereist een specifieke aanpak en interface. “De botvibratie verschilt van luchttrillingen (die worden opgevangen door een traditionele microfoon)”, zegt Stéphane Deketelaere. “De informatie die overeenstemt met de botvibratie, kan wel worden verwerkt, maar het is niet mogelijk om een geluid te regenereren alsof die was opgevangen door een normale microfoon. Het signaal van botgeleiding kan niet als dusdanig verwerkt worden. Het moet gecombineerd worden met dat van een klassieke microfoon en daarvoor moet een specifiek algoritme ontwikkeld worden. Voordeel van een osteofoon is dat er in grote mate abstractie wordt gemaakt van het omgevingsgeluid, maar de kwaliteit van het signaal zal slechter zijn dan bij een klassieke microfoon. Een osteofoon zal dus als ondersteuning dienen.” De microfoons met botgeleiding maken het bovendien mogelijk om valse en echte spraakactiviteit te onderscheiden. Met een klassieke microfoon bestaat het risico dat, als de spreker zijn koptelefoon afneemt maar blijft praten, de computer signalen interpreteert die niet voor hem bestemd zijn, en onjuiste sequenties gaat lanceren. Dat is niet het geval met een osteofoon die op basis van contact met het bot werkt. Door een algoritme te ontwikkelen dat in staat is om een (quasi)identiteit tussen 2 signalen (klassiek en bot) te detecteren, wordt het mogelijk om wat in andere domeinen ‘valspositieven’ zou worden genoemd, uit te schakelen.
Laatste rechte lijn
De technologieën VoiceInsight en Multitel (herkenningstechnologie MRO-Multitel Recognition Object) werden geïntegreerd en de tests zouden begin dit jaar van start moeten gaan. Een eerste demonstratiemodel zonder ingebouwde osteofoon zou in februari 2010 klaar moeten zijn. De eerste algoritmetests voor de fusie van kanalen vonden eind 2009 plaats. “Ze zijn erg bemoedigend in termen van potentiële performantiewinsten, met industrieel achtergrondgeluid”, benadrukt Stéphane Deketelaere. De performantere algoritmen staan op het punt geselecteerd te worden. Volgende stap, die ongeveer een maand in beslag zou nemen: het herschrijven van de algoritmen in C-taal en de integratie ervan in de MRO-motor. De oplossing die eruit voortvloeit, zal dan worden toevertrouwd aan VoiceInsight voor integratie in haar systemen. Jean-Jacques De Gheyndt meent dat eind juni een prototype zal klaar zijn, gevolgd door een commercialiseerbaar product in 2011.
Mestdagh zal als testsite dienen. De firma gebruikt reeds een klassieke voice picking oplossing VoiceInsight/Multitel voor het beheer van de pallets leeggoed die terugkomen van de winkels. De integratie van een osteofoon in de koptelefoon zou de spraakherkenning gevoelig moeten verbeteren en “interpretatie”fouten door het systeem uitschakelen. “Het potentiële voordeel is allesbehalve verwaarloosbaar voor een supermarkt”, benadrukt Stéphane Deketelaere. “Als een fles Chimay bijvoorbeeld wordt teruggestuurd naar een leverancier van Inbev, dan wordt de winkelier niet alleen niet terugbetaald, hij krijgt bovendien nog een boete omdat hij het systeem van de leverancier heeft geblokkeerd en een dubbele controle heeft nodig gemaakt.”
De andere partner in deze testfase is het Forem Logistique, dat als opleidingsinstrument fungeert, maar ook als “een vitrine van de Waalse technologische realisaties op het vlak van logistiek”. En dit ook ten overstaan van buitenlandse opleidingsinstanties.
Brigitte Doucet
Fout opgemerkt of meer nieuws? Meld het hier