Taalverwerving door robots via demonstratie: Gerangschikte gegevens en relevantiedetectie

Vincent
Renkens
  • Steven
    Janssens

P { margin-bottom: 0.08in; }

De opkomst van de robots
Veel sciencefiction films vertelden het ons al: de toekomst zal wemelen van de robots. Ze worden gebruikt in het dagelijkse leven, zijn hyperintelligent en hopelijk keren ze zich niet tegen ons, want dat zou wel eens het einde van de mensheid kunnen betekenen. Dit soort robots lijkt nog verre toekomstmuziek, maar robots op zich zijn geen sciencefiction meer. Robots komen steeds vaker voor in het dagelijkse leven. De gebruiker zou op een natuurlijke manier met robots moeten kunnen omgaan en dus moet de besturing hiervoor aangepast worden. De robot besturen met spraak lijkt hier een goede keuze, maar dit brengt vele uitdagingen met zich mee.


Robots in het dagelijkse leven
industriële robots zoals robotarmen in fabrieken worden al een hele tijd gebruikt. Tegenwoordig vinden we robots steeds vaker terug in het dagelijkse leven, denk maar aan een automatische grasmachine of stofzuiger of de robot ZORA die onlangs veel persaandacht kreeg omdat ze zeer nuttig bleek in de zorgsector. Door de verhuis van de fabriek naar mensen thuis, komen robots in een voor hen veel moeilijkere omgeving terecht. In een fabriek moet de robot vaak gelijkaardige taken uitvoeren, is de omgeving volledig vooraf bekend en wordt de robot bestuurd door technici die normaal gezien weten hoe ze de robot moeten besturen. In, bijvoorbeeld, een woning van een oudere heer of dame, waar de robot een handje kan toesteken, is dit alles behalve het geval. De robot moet namelijk vele verschillende klusjes uitvoeren, komt in een onbekende en veranderlijke omgeving terecht en de gebruiker is meestal geen technicus die met ingewikkelde interfaces kan werken.

Om ervoor te zorgen dat iedereen met robots kan werken, moeten we ervoor zorgen dat de gebruiker op een hele natuurlijke manier kan communiceren met de robot. Hiervoor lijkt spraaktechnologie een geschikte oplossing. Het probleem lijkt opgelost, er bestaan immers al heel geavanceerde spraakherkenners op de markt die deze taak kunnen uitvoeren, of niet? Een gebruiker zou bijvoorbeeld kunnen vragen: "pak is een pinke uit de frigo alstublieft". Een standaard spraakherkenner zou met dit commando niet veel kunnen aanvangen. Hij weet immers niet wat een "frigo" of een "pinke" is, deze woorden staan niet in het woordenboek. En zelfs al weet hij het, waar staat de frigo? Deze gegevens zouden eventueel allemaal voorgeprogrammeerd kunnen worden door een technicus, maar dit zou veel tijd in beslag nemen. Niet alleen moet dit voor elke gebruiker apart gebeuren, als er iets verandert in het huis moet dit opnieuw ingevoerd worden. Atypische taal kan het voor een spraakherkenner zeer moeilijk maken. Atypische taal kan, bijvoorbeeld, een dialect of een accent zijn. Vele mensen weten hoe moeilijk het kan zijn om een Engelstalige spraakherkenner aan te sturen. Een spraakgebrek, wat veroorzaakt kan worden door een motorische handicap, of ouderenspraak worden ook als atypisch ervaren door spraakherkenners. Het is echter net voor deze mensen dat een robot zeer nuttig kan zijn, denk maar aan een service robot, die hun thuis kan helpen.

In deze masterproef is getracht een oplossing te vinden voor deze problemen door een robot te ontwikkelen die spraak kan leren via interactie met de gebruiker zelf. De robot start zoals een pasgeboren baby: zonder enige kennis van taal, maar wel met de mogelijkheid om het te leren. De gebruiker kan de robot taal aanleren door te demonstreren wat hij/zij bedoelt met elk commando. Hiervoor wordt een afstandbediening gebruikt, zodat de acties die de robot uitvoert gelinkt kunnen worden aan het gesproken commando. Na enkele demonstraties kent de robot de betekenis van het commando en kan hij met de aangeleerde spraakcommando's bestuurd worden. Deze manier van werken zorgt ervoor dat de robot tegemoet kan komen aan de vooraf genoemde problemen. Het gebruik van ongekende woorden, dialect of atypische spraak geeft geen fundamenteel probleem meer, want de robot leert taal door te luisteren naar de gebruiker.


Werking van de robot
De robot verwerkt een gesproken commando in twee stappen: de spraakverwerking en de spraakclassificatie. In de spraakclassificatie wordt het commando gelinkt aan een actie. Het is echter heel moeilijk om dit te doen op basis van het geluidssignaal, want hier zit te veel irrelevante informatie in. Het geluidssignaal moet eerst verwerkt worden en dit gebeurt in de spraakverwerking. In de spraakverwerking wordt het geluidssignaal omgevormd naar wat we een kenmerkvector noemen. Dit is een beschrijving van het geluidssignaal op basis van kenmerken. Dit is vergelijkbaar met hoe je een persoon beschrijft. Je beschrijft een persoon niet door elk haartje op zijn/haar hoofd te vermelden, je gebruikt kenmerken zoals haarkleur, huidskleur en lengte. De spraakverwerking bestaat uit twee fasen, een leerfase en een gebruiksfase. In de leerfase zal de robot proberen te leren welke kenmerken er beschreven moeten worden om de commando's van de gebruiker goed te kunnen beschrijven. Vervolgens zal hij in de gebruiksfase het gesproken commando, dat hij als input krijgt van de gebruiker, beschrijven met deze kenmerken. Deze kenmerken worden samen in een vector geplaatst, de "kenmerkvector". Net als bij de spraakverwerking is er in de spraakclassificatie een leerfase en een gebruiksfase. In de leerfase zal de robot patronen proberen te zoeken in de kenmerken van de commando's en deze proberen te linken aan de demonstraties die de gebruiker heeft gedaan. Als deze patronen en verbanden gevonden zijn, kan de robot een nieuw commando classificeren in de verschillende commando's die hij geleerd heeft door de demonstraties.


Besluit
Robots zullen meer en meer voorkomen in het dagelijkse leven, daarom moet de manier van besturen van de robots herdacht worden. De diversiteit van gebruikers en omgevingen waarmee de robots geconfronteerd zullen worden, vragen om een intelligente robot. Een robot die zijn commando's kan leren door interactie met de gebruiker kan tegemoet komen aan de uitdagingen die gesteld worden door zulke nieuwe werkomgeving. In de masterproef is een tip van de sluier opgelicht over hoe zo een robot zou kunnen worden functioneren.

 

Universiteit of Hogeschool
KU Leuven
Thesis jaar
2014