Effizienz und Natürlichkeit
[Der Microsoft-Agent ist ab Windows 7 veraltet und in nachfolgenden Versionen von Windows möglicherweise nicht verfügbar.]
Bei der Durchführung von Aufgaben sind effektive menschliche Unterhaltungen in der Regel der Austausch von kurzen Informationen. Häufig werden Elemente in der Diskussion zwischen den Parteien festgelegt und dann indirekt durch abgekürzte Antworten darauf verwiesen. Diese Formen der Abkürzung sind von Vorteil, weil sie effizient sind, und sie impliziert auch, dass der Sprecher und der Hörer einen gemeinsamen Kontext haben; das heißt, dass sie kommunizieren. Die Verwendung geeigneter Abkürzungsformen macht auch einen Dialog natürlicher.
Eine Form der Konversationskürzel ist die Verwendung von Kontraktionen. Wenn sie nicht verwendet werden, lassen sie einen Sprecher formaler und starrer und manchmal weniger menschlich erscheinen. Die meisten menschlichen Unterhaltungen zeigen mehr Freiheiten in den linguistischen Regeln als geschriebener Text.
Eine weitere gängige Form der Abkürzung in Unterhaltungen ist anaphora, die Verwendung von Pronomen. Wenn z. B. jemand fragt: "Haben Sie heute Bill gesehen?" Antworten, die "ihn" durch "Bill" ersetzen, sind natürlicher, als den Namen erneut zu wiederholen. Die Ersetzung ist ein Hinweis darauf, dass die Parteien im Dialog einen gemeinsamen Kontext davon teilen , wer "er" ist. Denken Sie daran, dass sich das Wort "Ich" auf die Figur bezieht, wenn sie es sagt.
Der freigegebene Kontext wird auch durch die Verwendung von linguistischen Auslassungspunkten kommuniziert, der Abschneidung vieler Wörter in der ursprünglichen Abfrage. Beispielsweise könnte der Listener antworten: "Ja, ich habe ihn gesehen" und so den gemeinsamen Kontext zeigen , wann oder sogar mit einem einfachen "Ja" reagiert, das den gemeinsamen Kontext von Wer und Wann veranschaulicht.
Implizites Verständnis kann auch durch andere Formen von abgekürzten Konversationsstilen vermittelt werden, bei denen Inhalte ohne Wiederholung abgeleitet werden, wie im folgenden Beispiel gezeigt:
Benutzer: Ich möchte eine Pizza im Chicago-Stil.
Charakter: Mit "Extra Cheese"?
Wenn jemand sagt, "Es ist heiß hier", ist der Ausdruck verständlich und erfordert keine weiteren Details, wenn Sie wissen, wo sich der Sprecher befindet. Wenn der Kontext jedoch nicht gut etabliert oder mehrdeutig ist, kann das Entfernen aller kontextbezogenen Verweise dazu führen, dass der Benutzer verwirrt ist.
Wenn Sie abgekürzte Kommunikation verwenden, sollten Sie immer den Kontext des Benutzers und den Inhaltstyp berücksichtigen. Es empfiehlt sich, längere Beschreibungen für neue und unbekannte Informationen zu verwenden. Versuchen Sie jedoch selbst bei langen beschreibenden Informationen, es in kleinere Blöcke aufzuteilen. Dadurch haben Sie die Möglichkeit, die Animation zu ändern, während die Figur spricht. Es bietet auch eine größere Möglichkeit für den Benutzer, den Zeichen zu unterbrechen, insbesondere bei Verwendung von Spracheingaben.
Konsistenz ist bei der Sprachausgabe wichtig. Seltsame Sprachmuster oder Prosodie können als Herabstufung der Intelligenz des Charakters interpretiert werden. Ebenso kann der Wechsel zwischen TTS und aufgezeichneter Sprache dazu führen, dass Benutzer den Charakter als seltsam interpretieren oder mehr als eine Persönlichkeit besitzen. Lippensynchrone Mundbewegungen können die Sprachverständlichkeit verbessern. Der Microsoft-Agent unterstützt automatisch die Lippensynchronisierung für TTS-Engines, die den erforderlichen SAPI-Schnittstellen entsprechen. Die Lippensynchronisierung wird jedoch auch für aufgezeichnete Sprache unterstützt. Sounddateien können auch mit dem Microsoft Linguistic Sound Editing Tool verbessert werden.