Alexa, Siri en Google begrijpen geen woord dat je zegt

Spraakassistenten zoals Alexa, Google Assistant en Siri hebben de afgelopen jaren een lange weg afgelegd. Maar ondanks al hun verbeteringen houdt één ding hen tegen: ze begrijpen je niet. Ze vertrouwen te veel op specifieke spraakopdrachten.

Spraakherkenning is slechts een goocheltruc

Stemassistenten begrijpen je niet. Niet echt, in ieder geval. Wanneer u met een Google Home of Amazon Echo spreekt, worden uw woorden in wezen geconverteerd naar een tekenreeks en wordt dat vervolgens vergeleken met verwachte opdrachten. Als het een exacte overeenkomst vindt, volgt het een reeks instructies. Als dit niet het geval is, zoekt het naar een alternatief voor wat te doen op basis van de informatie die het wel heeft, en als dat niet werkt, krijgt u een foutmelding zoals “Het spijt me, maar ik weet niet dat .” Het is niet meer dan goochelarij magie om je te laten denken dat het het begrijpt.

Het kan geen contextuele aanwijzingen gebruiken om de beste schatting te maken, of zelfs begrip van vergelijkbare onderwerpen gebruiken om zijn beslissingen te onderbouwen. Het is ook niet moeilijk om stemassistenten te laten struikelen. Terwijl je Alexa kunt vragen: “Werk je voor de NSA?” en antwoord krijgen als je vraagt: “Ben je stiekem onderdeel van de NSA?” je krijgt een “die ken ik niet” antwoord (tenminste op het moment van schrijven).

Mensen, die spraak echt begrijpen, werken niet zo. Stel dat je een mens vraagt: ‘Wat is die klarvain in de lucht? Degene die gebogen is en vol gestreepte kleuren zoals rood, oranje, geel en blauw.” Ondanks dat klarvain een verzonnen woord is, kan de persoon aan wie je het vraagt ​​waarschijnlijk uit de context afleiden dat je een regenboog beschrijft.

Hoewel je zou kunnen stellen dat een mens spraak omzet in ideeën, kan een mens kennis en begrip toepassen om een ​​antwoord af te sluiten. Als je een mens vraagt ​​of ze in het geheim voor de NSA werken, geven ze je een ja of nee antwoord, zelfs als dat antwoord een leugen is. Een mens zou niet zeggen “die ken ik niet” op zo’n vraag. Dat mensen kunnen liegen, komt met echt begrip.

  Bestanden uploaden naar Microsoft Teams

Stemassistenten kunnen niet verder dan hun programmering

Spraakassistenten zijn uiteindelijk beperkt tot geprogrammeerde verwachte parameters, en buiten hen ronddwalen zal het proces doorbreken. Dat feit laat zien wanneer apparaten van derden binnenkomen om te spelen. Gewoonlijk is de opdracht om hiermee te communiceren erg onpraktisch, wat neerkomt op “vertel de fabrikant van het apparaat om een ​​optioneel argument te bevelen”. Een exact voorbeeld zou zijn: “Vertel Whirlpool om de droger te pauzeren.” Voor een nog moeilijker te onthouden voorbeeld: Genève Alexa-vaardigheid bestuurt enkele GE-ovens. Een gebruiker van de vaardigheid moet onthouden om “Genève te vertellen” en niet “GE te vertellen” dan de rest van het commando. En hoewel je hem kunt vragen om de oven voor te verwarmen tot 350 graden, kun je geen gevolg geven aan een verzoek om de temperatuur met nog eens 50 graden te verhogen. Een mens zou deze verzoeken echter kunnen volgen.

Amazon en Google hebben heel hard gewerkt om deze obstakels te overwinnen, en dat is te zien. Waar je vroeger de bovenstaande volgorde moest volgen om een ​​slim slot te bedienen, kun je nu in plaats daarvan zeggen “sluit de voordeur”. Alexa werd vroeger in de war gebracht door “vertel me een hondengrap”, maar vraag er vandaag nog een, en het zal werken. Ze hebben variaties toegevoegd aan de commando’s die je gebruikt, maar uiteindelijk moet je nog steeds het juiste commando weten om te zeggen. U moet de juiste syntaxis gebruiken, in de juiste volgorde.

En als je denkt dat dat veel op een opdrachtregel lijkt, heb je het niet mis.

  Hoe veeg je uit om terug te gaan in Chrome op touchscreens

Spraakassistenten zijn een mooie opdrachtregel

Een opdrachtregel is eng gedefinieerd om eenvoudige taken uit te voeren, maar alleen als u de juiste syntaxis kent. Als je uit die correcte syntaxis glipt en dyr typt in plaats van dir, dan zal de opdrachtprompt je een foutmelding geven. U kunt aliassen gebruiken om opdrachten gemakkelijker te onthouden, maar u moet een idee hebben van wat de oorspronkelijke opdrachten waren, hoe ze werken en hoe u aliassen efficiënt kunt gebruiken. Als je niet de tijd neemt om de ins en outs van de commandoregel te leren, zul je er nooit veel uit halen.

Stemassistenten zijn niet anders. U moet de juiste manier kennen om een ​​commando uit te spreken of een vraag te stellen. En u moet weten hoe u groepen instelt voor Google en Alexa, waarom het groeperen van uw apparaten essentieel is en hoe u uw slimme apparaten een naam geeft. Als u deze noodzakelijke stappen niet volgt, zult u gefrustreerd raken als u uw stemassistent vraagt ​​om het onderzoek uit te schakelen, alleen om te worden gevraagd “welk onderzoek” moet worden uitgeschakeld.

Zelfs als u de juiste syntaxis in de juiste volgorde gebruikt, kan het proces mislukken. Ofwel met een verkeerd antwoord of een verrassend resultaat. Twee Google Homes in hetzelfde huis kunnen het weer geven voor enigszins verschillende locaties, ook al hebben ze toegang tot dezelfde gebruikersaccountinformatie en internetverbinding.

In bovenstaand voorbeeld wordt het commando “Stel een timer in voor een half uur” gegeven. De Google Home-hub maakte een timer met de naam ‘Hour’ en vroeg vervolgens hoe lang de timer zou moeten zijn. En toch werkte het drie keer herhalen van hetzelfde commando correct en creëerde een timer van 30 minuten. Het gebruik van het commando “Stel een timer in voor 30 minuten” werkt correct op een meer consistente basis.

Hoewel het spreken met een Google Home of Echo vloeiender kan zijn, werken stemassistenten en opdrachtregels onder de motorkap op dezelfde manier. U hoeft misschien geen nieuwe taal te leren, maar u moet wel een nieuw dialect leren.

  Hoe de app-bibliotheek op de iPhone te gebruiken

Het beperkte begrip van spraakassistenten zal de groei beperken

Dit alles verhindert niet dat stemassistenten zoals Google Assistant en Alexa goed genoeg werken (hoewel Cortana een ander verhaal is). Google Assistant en Alexa en zoek fatsoenlijk online naar vragen, hoewel het niet verrassend is dat Google beter is in zoeken en basisvragen kan beantwoorden, zoals meetconversies en eenvoudige wiskunde. Met een correct ingesteld smart home en een goed opgeleide gebruiker werken de meeste smart home-commando’s zoals bedoeld. Maar dit kwam door werk en inspanning, niet door intellectueel begrip.

Timers en alarmen waren vroeger simplistisch. Na verloop van tijd werd naamgeving toegevoegd en vervolgens de mogelijkheid om tijd aan een timer toe te voegen. Ze gingen van simplistisch naar ingewikkelder. Spraakassistenten kunnen meer vragen beantwoorden en elke dag brengt nieuwe vaardigheden en functies met zich mee. Maar dat is geen product van zelfgroei dat voortkomt uit leren en begrijpen.

En niets van dat alles levert de inherente mogelijkheid om wat bekend is te gebruiken om het onbekende te bereiken. Voor elke opdracht en vraag die wel werkt, zijn er altijd drie die niet werken. Zonder een doorbraak in AI die een mensachtig vermogen tot begrip verleent, zijn spraakassistenten helemaal geen assistenten. Het zijn slechts spraakopdrachtregels – handig in het juiste scenario, maar beperkt tot die scenario’s waarvoor ze zijn geprogrammeerd om ze te begrijpen.

Met andere woorden: machines leren dingen, maar kunnen ze niet begrijpen.

gerelateerde berichten