Alexa, Siri und Google verstehen kein Wort, das du sagst

Sprachassistenten wie Alexa, Google Assistant und Siri haben in den letzten Jahren einen langen Weg zurückgelegt. Aber bei all ihren Verbesserungen hält sie eines zurück: Sie verstehen dich nicht. Sie verlassen sich zu sehr auf bestimmte Sprachbefehle.

Spracherkennung ist nur ein Zaubertrick

Sprachassistenten verstehen Sie nicht. Jedenfalls nicht wirklich. Wenn Sie mit einem Google Home oder Amazon Echo sprechen, wandelt es Ihre Wörter im Wesentlichen in eine Textzeichenfolge um und vergleicht diese dann mit den erwarteten Befehlen. Wenn es eine genaue Übereinstimmung findet, folgt es einer Reihe von Anweisungen. Wenn dies nicht der Fall ist, sucht es basierend auf den verfügbaren Informationen nach einer Alternative, und wenn dies nicht funktioniert, erhalten Sie eine Fehlermeldung wie „Es tut mir leid, aber das weiß ich nicht“. .“ Es ist kaum mehr als Taschenspielertrick, um Sie dazu zu bringen, zu glauben, dass sie es versteht.

Es kann keine kontextbezogenen Hinweise verwenden, um die beste Vermutung zu treffen, oder sogar ein Verständnis ähnlicher Themen verwenden, um seine Entscheidungen zu treffen. Es ist auch nicht schwer, Sprachassistenten zum Stolpern zu bringen. Während Sie Alexa fragen können: „Arbeiten Sie für die NSA?“ und erhalten Sie eine Antwort, wenn Sie fragen „Sind Sie heimlich Teil der NSA?“ Sie erhalten eine „Ich kenne das nicht“-Antwort (zumindest zum Zeitpunkt dieses Schreibens).

Menschen, die Sprache wirklich verstehen, funktionieren nicht so. Angenommen, Sie fragen einen Menschen: „Was ist das klarvain am Himmel? Der gewölbte und voller gestreifter Farben wie Rot, Orange, Gelb und Blau.“ Obwohl klarvain ein erfundenes Wort ist, könnte die Person, die Sie gefragt haben, wahrscheinlich aus dem Kontext herausfinden, dass Sie einen Regenbogen beschreiben.

Während Sie argumentieren könnten, dass ein Mensch Sprache in Ideen umwandelt, kann ein Mensch dann Wissen und Verständnis anwenden, um eine Antwort zu schließen. Wenn Sie einen Menschen fragen, ob er heimlich für die NSA arbeitet, werden Sie mit Ja oder Nein antworten, auch wenn diese Antwort eine Lüge ist. Ein Mensch würde auf eine solche Frage nicht „das kenne ich nicht“ sagen. Dass Menschen lügen können, ist etwas, das mit echtem Verständnis einhergeht.

  So laden Sie Ihre Google Apps mit dem Skript-Editor auf

Sprachassistenten können nicht über ihre Programmierung hinausgehen

Sprachassistenten sind letztendlich auf programmierte erwartete Parameter beschränkt, und das Abwandern von ihnen wird den Prozess unterbrechen. Diese Tatsache zeigt sich, wenn Geräte von Drittanbietern ins Spiel kommen. Normalerweise ist der Befehl, mit diesen zu interagieren, sehr unhandlich und bedeutet „Gerätehersteller anweisen, optionales Argument zu befehlen“. Ein genaues Beispiel wäre: „Whirlpool anweisen, den Trockner anzuhalten.“ Für ein noch schwerer zu merkendes Beispiel, das Genfer Alexa-Skill steuert einige GE-Öfen. Ein Benutzer des Skills muss daran denken, „Geneve zu sagen“, nicht „GE“, dann den Rest des Befehls. Und während Sie ihn bitten können, den Ofen auf 350 Grad vorzuheizen, können Sie nicht darauf folgen, die Temperatur um weitere 50 Grad zu erhöhen. Ein Mensch könnte diesen Aufforderungen jedoch folgen.

Amazon und Google haben sehr hart daran gearbeitet, diese Hindernisse zu überwinden, und das zeigt sich. Wo Sie früher die obige Sequenz befolgen mussten, um ein intelligentes Schloss zu steuern, können Sie jetzt stattdessen „Haustür verriegeln“ sagen. Früher war Alexa verwirrt von „Erzähl mir einen Hundewitz“, aber frag heute nach einem und es wird funktionieren. Sie haben den von Ihnen verwendeten Befehlen Variationen hinzugefügt, aber letztendlich müssen Sie immer noch den richtigen Befehl kennen. Sie müssen die richtige Syntax in der richtigen Reihenfolge verwenden.

  keine abspielbaren Quellen gefunden“ in Ihrem Browser

Und wenn Sie denken, dass das sehr nach einer Befehlszeile klingt, liegen Sie nicht falsch.

Sprachassistenten sind eine ausgefallene Befehlszeile

Eine Befehlszeile ist eng definiert, um einfache Aufgaben auszuführen, jedoch nur, wenn Sie die richtige Syntax kennen. Wenn Sie diese korrekte Syntax verlassen und dyr anstelle von dir eingeben, erhalten Sie in der Eingabeaufforderung eine Fehlermeldung. Sie können Aliase verwenden, um Befehle leichter zu merken, aber Sie müssen wissen, was die ursprünglichen Befehle waren, wie sie funktionieren und wie Sie Aliase effizient verwenden. Wenn Sie sich nicht die Zeit nehmen, die Besonderheiten der Befehlszeile zu erlernen, werden Sie nie viel daraus machen.

Sprachassistenten sind nicht anders. Sie müssen wissen, wie Sie einen Befehl richtig aussprechen oder eine Frage stellen. Und Sie müssen wissen, wie Sie Gruppen für Google und Alexa einrichten, warum es wichtig ist, Ihre Geräte zu gruppieren und wie Sie Ihre Smart-Geräte benennen. Wenn Sie diese notwendigen Schritte nicht befolgen, werden Sie frustriert, wenn Sie Ihren Sprachassistenten bitten, die Studie auszuschalten, nur um gefragt zu werden, „welche Studie“ ausgeschaltet werden soll.

Selbst wenn Sie die richtige Syntax in der richtigen Reihenfolge verwenden, kann der Vorgang fehlschlagen. Entweder mit der falschen Antwort oder einem überraschenden Ergebnis. Zwei Google Homes im selben Haus können das Wetter für leicht unterschiedliche Orte anzeigen, obwohl sie Zugriff auf dieselben Benutzerkontoinformationen und Internetverbindung haben.

Im obigen Beispiel wird der Befehl „Timer für eine halbe Stunde stellen“ gegeben. Der Google Home Hub hat einen Timer mit dem Namen „Stunde“ erstellt und dann gefragt, wie lange der Timer sein soll. Und doch funktionierte das dreimalige Wiederholen des gleichen Befehls korrekt und erzeugte einen 30-Minuten-Timer. Die Verwendung des Befehls „Timer auf 30 Minuten stellen“ funktioniert konsistenter und korrekter.

  Warum bin ich mit dem WLAN verbunden, aber nicht mit dem Internet?

Während das Sprechen mit einem Google Home oder Echo möglicherweise flüssiger ist, funktionieren Sprachassistenten und Befehlszeilen unter der Haube auf die gleiche Weise. Sie müssen möglicherweise keine neue Sprache lernen, aber Sie müssen einen neuen Dialekt lernen.

Das enge Verständnis von Sprachassistenten wird das Wachstum begrenzen

Nichts davon hindert Sprachassistenten wie Google Assistant und Alexa daran, gut genug zu funktionieren (obwohl Cortana eine andere Geschichte ist). Google Assistant und Alexa und suchen Sie online anständig nach Fragen, obwohl es nicht überraschend ist, dass Google bei der Suche besser ist und grundlegende Fragen wie Messwertumrechnungen und einfache Mathematik beantworten kann. Mit einem richtig eingerichteten Smart Home und einem gut geschulten Benutzer funktionieren die meisten Smart Home-Befehle wie beabsichtigt. Aber dies geschah durch Arbeit und Anstrengung, nicht durch intellektuelles Verständnis.

Timer und Alarme waren früher einfach. Im Laufe der Zeit wurde die Benennung hinzugefügt, dann die Möglichkeit, einem Timer Zeit hinzuzufügen. Sie wechselten von einfach zu komplizierter. Sprachassistenten können mehr Fragen beantworten und jeder Tag bringt neue Fähigkeiten und Funktionen mit sich. Aber das ist kein Produkt des Selbstwachstums, das durch Lernen und Verstehen entsteht.

Und nichts davon bietet die inhärente Fähigkeit, Bekanntes zu nutzen, um das Unbekannte zu erreichen. Für jeden Befehl und jede Frage, die funktioniert, gibt es immer drei, die nicht funktionieren. Ohne einen Durchbruch in der KI, der eine menschenähnliche Fähigkeit des Verstehens ermöglicht, sind Sprachassistenten überhaupt keine Assistenten. Sie sind nur Sprachbefehlszeilen – nützlich im richtigen Szenario, aber beschränkt auf die Szenarien, für deren Verständnis sie programmiert wurden.

Mit anderen Worten: Maschinen lernen Dinge, können sie aber nicht verstehen.