VUI Design auf falschem Fuß!

„Wir brauchen eine Sprachanwendung um auf digitalen Sprachassistenten zu sein!“… tönt es früher oder später in jedem Unternehmen.

So einige Agenturen haben diesen Ruf gehört und holen sich das entsprechende Budget ab. Bei Anwendungen die keine große sprachliche Intelligenz erfordern (z.B Fragen & Antworten, Quiz, Steuerung), funktioniert das eigentlich auch schon ganz gut. Braucht die Anwendung jedoch auch nur minimal mehr an Intelligenz, schon landet die nächste schlecht bewertete Voice-App im Store.

Auch mit den besten Entwicklern der Welt lässt sich aktuell keine einigermaßen intelligente Voice App herstellen, weil die Systeme diese Intelligenz einfach noch nicht haben. Hinzu kommt, das die Entwickler und Design selbst, die gesprochene Sprache in ihrem Wesen selbst noch garnicht erfasst und erlernt haben, so das traditionelle Herangehensweisen in der Produktion von Voice Apps ihren Niederschlag finden, was jedoch an einigen Stellen grundverkehrt ist.

Das gesprochene Sprache anders ist, lässt sich an vielen Punkten festmachen. Einge davon…


// Das Ohr ist das emotionalste Wahrnehmungsorgan das wir haben. Das kann man vom Auge nicht behaupten. Wie auch? So schnell wie der Mensch gucken kann, kann er nicht Emotionen erfahren. Wer also versucht „formal“ im Ohr des Nutzers zu landen, wird nicht im selben bleiben.

// Ebenso funktioniert das Ohr eher seriell und langsam, wogegen das Auge fast parallel wesentlich schneller Informationen wahrnehmen kann.

// Dann ist die gesprochene Sprache auch noch extrem Situationsabhängig. Das was und wie der Mensch spricht, hängt stets von der aktuellen Situation ab in der er sich befindet.

// Als wäre das alle nicht genug, ist Sprache auch noch sehr mehrdeutig und persönlich.


Und ja, genau diese extremst wichtigen Dinge werden in der aktuellen Entwicklung von Sprachanwendungen selten oder garnicht berücksichtig. Das Ergebnis ist in der Regel entsprechend schlecht, die Budgets verbrannt und der Kunde und Nutzer frustiriert.

Dabei muss das eigentlich garnicht sein, denn es reicht schon bei der Konzeption mal einen Schritt zurück zu tun und eben nicht wie bei einer Webseite oder App einfach nur „einen Kanal mit Content füllen“, sondern die geplante Sprachanwendung an einem „idealtypischen Nutzer“ (=Persona) festzumachen, weil Sprache nunmal extremst von der Situation abhängt.

Diese Persona wird durch folgende Attribute beschrieben…

1.) Eigenschaften des Nutzers. z.B…

  • Mann/Frau?
  • Erwachsener/Teen/Kind/Senior?
  • Alter?
  • Interessen?
  • Wohnort?
  • Sprache

2.) Zeitpunkt des Touchpoints

  • Tageszeit/Uhrzeit?
  • Gut/Schlecht gelaunt?
  • Gestresst/Gelangweilt/Schlafend?

3.) Ort des Touchpoints

  • Bei der Arbeit
  • Beim Sport
  • Beim Kochen

Hat man die Persona erstmal rausgefischt, braucht es natürlich auch noch ein Ziel, anhand sich der Nutzen/Sinn/Zweck der zu konzipierenden Voice App manifestiert und über Funktionen des Sprachassistenten hergestellt wird.

Es ist ein Unterschied ob man „den Nutzer unterhalten will“, oder ihm z.B „den neusten Sneaker verkaufen möchte“. Also, was ist das Ziel?

Sind Ziel und Persona letztendlich bekannt, muss der Nutzen/Sinn/Zweck der Sprachanwendung hergestellt werden. Dies passiert natürlich über die Möglichkeiten die das System des Sprachassistenten hergibt, also seinen Funktionen welche dann in den Skills (Alexa) und Actions (Google) vom Programmierer umgesetzt werden müssen.

Wenn also das System des Sprachassistenten es z.B hergibt das der Sprachassistenten z.B eine EMail versendet, eine Lampe schaltet, eine Sprachausgabe macht etc. dann sind es genau diese Funktionen die entsprechend dem Ziel und der Persona gestaltet werden müssen.

Natürlich muss dabei stets sensibel auf das Design der Sprache geachtet sein und diese so emotional und vor allem an der Absicht des Nutzers orientiert sein!

„Der Kunde will keine Bohrmaschine, er will das Loch in der Wand!“ (Henry Ford)

Letztendlich bedingt das Ziel und die Persona die Gestaltung der Funktionen (Skills/Actions) einer Sprachanwendung und damit auch den Nutzen für den Anwender wie den Anbieter!