Kwantumalgoritmen zorgen voor beter taalbegrip bij computers

- EN- NL

Promovendus gebruikt gereedschappen uit de kwantummechanica om computers beter om te laten gaan met dubbelzinnige taal.

Dat woorden en zinnen meerdere betekenissen kunnen hebben, is voor normale computers een lastig concept. Promovendus Adriana Duarte Correia gebruikte kwantumalgoritmen om computers te laten begrijpen dat een zin als ’Kijk naar de hond met één oog’ twee verschillende dingen kan betekenen. Vandaag verdedigt ze haar proefschrift met de titel Quantum distributional semantics aan de Universiteit Utrecht.

Natuurlijke taalverwerking

Wanneer je online iets opzoekt, probeert je zoekmachine te begrijpen wat je schrijft zodat die zinvolle suggesties kan doen. Het proces hierachter heet natuurlijke taalverwerking (natural language processing, NLP). De meeste NLP-onderzoekers gebruiken momenteel een methode die niet perfect is: de computer begrijpt ongeveer 80 procent van de gevallen correct. Correia: "Dat zijn de simpele gevallen, taalkundig gezien. Maar als je wilt zorgen dat de computer ook de complexe gevallen goed begrijpt, dan vraagt deze methode erg veel rekenkracht. Het was ons doel om de mate van begrip te verhogen en het proces te versnellen door kwantumberekeningen te gebruiken."

Schrödingers kat

Maar hoe kunnen kwantumcomputers en -algoritmen de taalverwerking verbeteren? Het heeft alles te maken met Schrödingers kat. Dit beroemde gedachte-experiment illustreert het concept van kwantum-superpositie, waarbij twee ogenschijnlijk tegengestelde toestanden op hetzelfde moment kunnen bestaan. Correia: "We gingen echt voor de complexe gevallen, zoals ’Pluizige katten en vogels’. Betekent dit dat alleen de katten pluizig zijn, of zijn de vogels dat ook? Door onze kwantumbenadering te gebruiken, kunnen beide mogelijkheden tegelijkertijd bestaan, totdat meer informatie duidelijk maakt wat er precies bedoeld werd."

Theoretische kwantumversnelling

"We pasten het algoritme van Grover toe, een veelgebruikt kwantumalgoritme. Zo toonden we wiskundig aan dat onze methoden minder berekeningen nodig hadden dan bestaande NLP-methoden om bepaalde taalgerelateerde vragen te beantwoorden. Het meest opvallende was dat deze versnelling helemaal te danken was aan onze kwantumbenadering. Meestal wordt er ’machine learning’ gebruikt om de taalverwerking van computers te versnellen. In tegenstelling tot bij ’machine learning’, hoefden onze computers helemaal niet getraind te worden."

Correia legt uit dat haar resultaten nog puur wiskundig en dus theoretisch zijn. Andere studenten proberen de methode nu toe te passen op echte kwantumcomputers, maar de weg is nog lang. "De toepassingen van deze kwantumcomputers staan nog in hun kinderschoenen. Er is meer onderzoek nodig om de theoretische versnelling te vertalen naar een daadwerkelijke versnelling in tijd."

Uitdagend maar bevredigend

Correia studeerde Theoretical Physics aan de Universiteit Utrecht. Aan het einde van haar master realiseerde ze zich dat ze aan een project wilde werken waarin theoretisch natuurkunde en taal gecombineerd werden. Samen met professor Henk Stoof, haar afstudeervakbegeleider, nam ze contact op met Michael Moortgat, hoogleraar Taalwetenschap, en vroeg ze een beurs aan bij het Centre for Complex Systems Studies. Correia is trots op het resultaat dat ze behaald hebben, vooral omdat het project best uitdagend was door het interdisciplinaire karakter.

"De mensen bij natuurkunde spraken als het ware een andere taal dan de mensen bij taalwetenschappen," zegt Correia. "Ik moest een manier vinden om de twee vakgebieden bij elkaar te brengen."