„Hey, Nutzer!“ – Aktive Ansprache besser gestalten

Es gibt Dinge, von denen lasse ich mich gerne wecken. Von der aufgehenden Morgensonne beispielsweise. Oder vom Geruch von frischem Kaffee.

Nicht so gerne werde ich von diesem Satz geweckt:
“BLUETOOTH-VERBINDUNG KONNTE NICHT HERGESTELLT WERDEN!”

Genau diesen Satz plärrte mein Amazon Echo in maximaler Lautstärke kürzlich nachts um halb 1 durch die Wohnung. Und das nicht nur ein mal, sondern mit etwa einer halben Minute Abstand immer wieder. Nachdem ich im Halbschlaf vergeblich versucht hatte, Alexa mit der Mobile-App zum Schweigen zu bringen musste ich am Ende doch aufstehen und den Netzstecker ziehen.

Weniger geduldige Zeitgenossen hätten den Echo möglicherweise direkt aus dem Fenster geworfen. Ich gebe zu, dass ich auch kurz darüber nachgedacht habe. Zum Glück bringe ich aber ein Interesse an Sprachassistenten mit (und habe eine tolerante Ehefrau).

Aus Fehlern lernen

Am nächsten Morgen nach einer Extra-Portion Koffein überlegte ich dann, was hier schief gelaufen ist – und was man daraus für die Entwicklung von Sprach-Anwendungen lernen kann.

Die technische Analyse ist in dem Fall nicht sonderlich schwierig: Ich hatte am Nachmittag zuvor meinen Echo mit einem Bluetooth-Transmitter verbunden. Ich wollte damit das Kabel-Gewirr meiner Musik-Anlage ein wenig übersichtlicher gestalten und den Echo zur Musik-Wiedergabe nutzen. Das klappte auch ganz gut – nur hatte ich den Bluetooth-Transmitter nach einigen Tests wieder vom Strom getrennt und damit anscheinend meinen Echo nachhaltig verwirrt.

Aktive Ansprache gestalten

Viel interessanter ist aber die Frage, was man daraus als Gestalter und Entwickler von Sprach-Anwendungen lernen kann.

Auf diesem Blog wurde schon einiges über die Gestaltung von Dialogen geschrieben. Das ist schon eine Fachdisziplin für sich und durchaus anspruchsvoll. In einem Fall wie diesem müssen wir noch einen weiteren Aspekt mit betrachten: Wann und wie darf mich ein Sprachassistent aktiv ansprechen?

Es gibt durchaus einige Situationen, in denen es Sinn macht, dass ein Sprachassistent nicht nur reagiert, sondern mich auch ohne direkte Aufforderung anspricht.

Beispiele:
– Ein Anruf kommt rein.
– Der Kuchen muss aus dem Ofen.
– Ich möchte an einen Termin erinnert werden.
– Eine Maschine droht zu überhitzen.

Sprache hat dabei den großen Vorteil, dass sie meine Aufmerksamkeit auch dann aktivieren kann, wenn ich gerade mit etwas anderem beschäftigt bin. Das kann in manchen Situationen genau richtig sein – aber manchmal eben auch total daneben.

Wenn ich also eine Sprach-Anwendungen entwickele, die eine aktive Ansprache des Nutzers vorsieht, dann sollte ich mir dabei einige Fragen stellen:
– Muss der Nutzer wirklich aktiv angesprochen werden?
– Wie dringend ist die Information, die der Nutzer bekommen soll? Was passiert, wenn er sie nicht sofort bekommt?
– Ist Sprache die beste Art, den Nutzer auf etwas hinzuweisen? Oder gibt es andere, weniger aufdringliche Wege? (z.B. eine SMS oder einen Kalender-Eintrag)
– Kann die Anwendungen prüfen, ob es gerade passt? (z.B. über die Uhrzeit oder über den Kalender)

Hätte der Designer der Bluetooth-Kopplungs-Funktion sich diese Fragen vorher gestellt, dann wäre mir (und bestimmt auch einigen anderen Alexa-Nutzern) ein nächtliches Erwachen vielleicht erspart geblieben.