Spracheingabe zur Komplexitätsreduktion

Schon im Blogpost “Datenflut – Möglichkeiten zur Reduktion der Komplexität” führte ich ein Beispiel der Spracheingabe zur Komplexitätsreduktion (oder sollte ich sagen “zur vereinfachten Ein- und Ausgabe von Informationen”) an – ein Beispiel aus dem privaten Bereich von der Suche nach dem nächsten Media Markt, über die Navigation dorthin bis hin zum SMS-Diktat inklusive Versendung. Und ich bin überzeugt davon, dass sich dieser Trend fortsetzen wird.

Siri forciert die Marktdurchdringung der Spracheingabetools

Apple entwickelte mit der an der NASDAQ notierten Nuance Communications seit 2007 die Spracherkennungssoftware Siri (Speech Interpretation and Recognition Interface), bevor sie im Oktober 2011 mit dem iPhone 4S im Markt eingeführt wurde. Sprachsteuerung und intelligente Spracheingaben gab es auch vorher schon im Markt,
Dragon NaturallySpeaking Premium 12.0 (übrigens auch von Nuance Communication entwickelt) hatte ich beispielsweise schon zumindest ausprobiert. Mit der Einführung von Apple stieg aber die (potenzielle) Marktdurchdringung rasant, denn durch die Vorinstallation der Siri Software auf jedem iPhone 4S und iPhone 5 sind rechnerisch zumindest mehrere Millionen Geräte mit Siri ausgerüstet und verkauft worden. Allerdings bezweife ich trotz der Vorteile, dass Siri bei den iPhone Besitzern durchgängig verwendet wird und glaube, dass es viel eher darauf warten muss, entdeckt zu werden. Mehr als einmal waren Gesprächspartner nach meinem Hinweis darauf jedenfalls fasziniert von den Möglichkeiten und verwendeten die Spracheingabe auf dem iPhone erst nach dem direkten Hinweis darauf.

Mittlerweile nutze ich das Sprachinterface jedenfalls ausgiebig, etliche Mails und einige Texte zum Beispiel für Präsentationen oder auch Blogposts diktiere ich mittlerweile teilweise über mein iPhone. Es spart eine Menge Zeit und ist ungeheuer bequem. Auch wenn je nach Komplexität des Textes und zum Beispiel der Häufung von Fremdwörtern eine manuelle Nachkorrektur notwendig ist – da ich auch bei selbst getippten Texten mehrfach Korrektur lese, ist dies kein zusätzlicher Schritt bzw. Aufwand für mich.

Hier ein Auszug möglicher Interaktionen per Sprache:

  • eingegangene Nachrichten / SMS vorlesen lassen
  • Nachrichten / SMS diktieren und verschicken lassen
  • Suchanfragen (inklusive Einbindung / Berücksichtigung des aktuellen Standorts)
  • Navigation (sehr praktisch: zum Beispiel zum Treffer einer vorherigen Suchanfrage auch per Sprache)
  • Notizen, Erinnerungen, Artikel diktieren
  • Wecker stellen oder bestimmte Musikstücke abspielen

Eine mehr oder weniger vollständige Liste aller Siri-Befehle befindet sich nach eigener Aussage übrigens im folgenden Artikel des Blogs re:Blog.

Auch Google arbeitet am Thema Spracherkennung

Auch die anderen großen IT-Player wie Microsoft oder Goolge schlafen natürlich nicht bei diesem Thema, siehe zum Beispiel die Einführung und der Funktionsumfang von Google Now. Realisierte Features wie zum Beispiel die Einbindung eines Kalenders um noch näher an den Alltag und die Tätigkeiten des Benutzers zu kommen reizen mich zwar – aber da hier (natürlich) die Verwendung des Google-Kalenders Voraussetzung ist, ist für viele potenzielle Nutzer in Großunternehmen, wie es auch auf mich zutrifft, aus Gründen der Sicherheit und Vertraulichkeit eine Nutzung nicht möglich beziehungsweise ratsam.

Sprache als Passwort?

Wovon ich ja wirklich träume – nicht nur zur Eingabeerleichterung Sprache zu verwenden, sondern beispielsweise zur Handyentriegelung. Warum soll ich mein Handy unnötigerweise mit eingetippten PIN-Codes entriegeln, bevor ich Sprachbefehle geben kann – siehe erneut das Beispiel aus meinem früheren Blogpost. Alle Sprachbefehle während der Autofahrt zu geben war kein Problem – aber ich musste stehen, um die Spracherkennung überhaupt nach der Straßenverkehrsordnung starten zu dürfen. Und wenn das Handy dann meine Stimme als die des “richtigen Benutzer” erkennen und damit automatisch die Entriegelung vornehmen und die Spracherkennung starten würde, dann wäre das ein deutlicher weiterer Schritt in Richtung Reduktionskomplexität und Benutzerfreundlichkeit.

Während ich wie üblich bereits seit drei, vier Tagen an diesem Artikel arbeite finde ich heute abend auf dem Blog von Caschy schon direkt die passende Ankündigung dazu. Auch wieder Nuance Communications (nein, dieses ist kein Werbebeitrag!) kündigt die Anwendung der eigenen Stimme als Passwort an – im Beispielvideo als Zugriff auf den eigenen Bank-/Kreditkartenaccount.

Warum also nicht auch gleich für die Entsperrung des eigenen Handys?


Leave a Reply

Your email address will not be published. Required fields are marked *