Kusito News

Warum akzeptieren Menschen Sprachassistenten so schnell?

Conversational AI
Conversational User Interfaces sind nichts Neues. Seit vielen Jahren wird auf diesem Gebiet geforscht und die dabei gewonnenen Erkenntnisse werden z.B. bei automatisierten Telefonanrufen genutzt. Seit dem rasanten technischen Fortschritt der Künstlichen Intelligenz (KI) ist jedoch eine starke Dynamik in der Entwicklung und auf dem Markt zu beobachten. Der Einsatz von Deep Learning und Künstlichen neuronalen Netzen hat im Bereich der Spracherkennung, aber auch im Bereich der Text-to-Speech-Synthese grosse Sprünge gemacht.


Bereits 2017 wies Mary Meeker in ihrem jährlichen Internet Trend Report von Kleiner Perkins darauf hin, dass Google in der englischen Sprache im Bereich der Spracherkennung auf menschlichem Niveau ist. Quelle: www.kleinerperkins.com

Spätestens seit der Einführung von Siri im Jahr 2011 waren die Menschen von der Anwendung überrascht - "Ah, es funktioniert!" - aber viele Menschen waren nicht unbedingt begeistert von den neuen Möglichkeiten. Zu schlecht war die Nutzererfahrung.

Es dauerte eine Weile, bis Amazon 2014 mit Alexa auf den Markt kam. Amazon brachte Alexa-Geräte dann relativ aggressiv über sehr niedrige Preise an die Kunden. Im Jahr 2016 zog Google mit seinem Voice Assistant nach. Sie führten ihn gleichzeitig auf dem Android-Betriebssystem (Mobiltelefon) und auf ihrem ersten Google Home Smart Speaker ein.

Amazon und Google dominieren nun den Markt für Sprachassistenten. Beide verfügen über viel Know-how im Bereich der KI, was sich auch in der Entwicklung ihrer neuesten Produkte widerspiegelt. Die Nutzererfahrung der beiden Systeme ist deutlich besser als die anderer Anbieter.

Es gibt weitere Gründe für diese Entwicklung, die dazu geführt haben, dass Sprachassistenten rasant auf dem Markt Fuss gefasst haben. Hier eine Liste ohne Anspruch auf Vollständigkeit:

Stimme - Die menschliche Stimme ist zusammen mit den Ohren unsere angeborene Kommunikationsschnittstelle. Die «Spracheingabe» ist viel schneller als die schriftliche Eingabe eines Geräts.

KI-Entwicklung - Alle Fortschritte bei der Spracherkennung und Sprachausgabe sind nur dank der enormen Fortschritte der KI in den letzten Jahren möglich gewesen.

Convenience Economy - Wir befinden uns in einer Zeit, in der alles, was das Leben der Menschen vereinfacht, zügig angenommen wird. "Convenience beats privacy" (Bequemlichkeit schlägt Privatsphäre) ist in diesem Zusammenhang immer wieder zu hören. Und es scheint, dass wir Menschen langsam resignieren, wenn es um Datenschutz und Privatsphäre geht. Sprachassistenten werden uns mehr und mehr einfache und sich wiederholende Aufgaben abnehmen. Wenn das Leben durch etwas vereinfacht wird, nehmen die Menschen oft etwas Negatives in Kauf, wie etwa eine eingeschränkte Privatsphäre. Bequemlichkeit und Zeitersparnis wiegen oft schwerer als solche Fragen.

Das Zeitalter des Mobilfunks - Die Menschen in modernen Gesellschaften sind in den letzten Jahren durch das Smartphone mit der Technik zusammengewachsen. Es ist normal geworden, dass wir fast immer ein Gerät bei uns tragen. Jetzt wird dieses noch intelligenter und kann durch ergänzende Peripheriegeräte wie den Smart Speaker zu Hause oder im Büro noch besser genutzt werden.

Aha-Erlebnis - Der Moment, in dem man erkennt, wie grossartig ein digitaler Assistent sein kann 😊. Zum ersten Mal können Maschinen menschliche Sprachen sprechen. Wer schon einmal beobachtet hat, wie kleine Kinder mit einem Smart Speaker interagieren, weiss, dass es wirklich ein Kinderspiel ist. Innerhalb kürzester Zeit sprechen Kinder mit Google Assistant oder Alexa.

Wir stehen am Anfang eines neuen Zeitalters. Die Art und Weise, wie wir mit Computern interagieren, kann durch sprachgesteuerte Benutzeroberflächen noch einmal auf den Kopf gestellt werden. Nach der Eingabe über Lochkarten, Tastaturen und Touchscreens können wir nun Maschinen direkt mit unserer angeborenen Kommunikationsschnittstelle steuern.