Optionen für die Absichtserkennung und Entitätsextraktion für Ihre intelligenten Anwendungs-Workloads

Artikel
02/06/2025

Absichtserkennung und Entitätsextraktion sind Schlüsselkomponenten für das Verständnis natürlicher Sprache.

Bei der Absichtserkennung geht es darum, herauszufinden, welches Ziel oder welchen Zweck der Benutzende mit seiner Eingabe verfolgt. Wenn ein Benutzender beispielsweise sagt: „Ich möchte einen Flug buchen“, ist seine Absicht, einen Flug zu buchen. Die Absichtserkennung hilft dem Agenten, zu verstehen, welche Aktion er ausgehend von der Anforderung des Benutzenden ausführen muss.

Zur Entitätsextraktion gehört das Identifizieren und Extrahieren bestimmter Informationen aus der Benutzereingabe. Bei Entitäten kann es sich um Daten wie Datumsangaben, Namen, Standorte oder andere relevante Daten handeln. Zum Beispiel enthält der Satz „Buche einen Flug nach New York am 15. September“ die Entitäten „New York“ und „15. September“.

Ein Agent verwendet die Absicht, um das Ziel des Benutzenden zu verstehen, und die Entitäten, um die spezifischen Details zu identifizieren, die er zum Erledigen der Aufgabe braucht. Mit der Absichtserkennung und der Entitätsextraktion kann der Agent daher auf Benutzeranfragen genaue und effiziente Antworten geben.

Beim Entwerfen Ihres Workloads für intelligente Anwendungen müssen Sie die beste Option für die Absichtserkennung und Entitätsextraktion auswählen, um sicherzustellen, dass Ihr Workload für intelligente Anwendungen eine positive Benutzererfahrung bietet.

Definitionen

Begriff	Definition
NLU	Das Verständnis natürlicher Sprache ist ein Teilbereich der Verarbeitung natürlicher Sprache in der KI, die sich auf das maschinelle Leseverstehen konzentriert.
CLU	Conversational Language Understanding ist ein Feature von Azure KI, das die Erstellung benutzerdefinierter NLU-Modelle ermöglicht.
LLM	Ein großes Sprachmodell ist eine Art von KI-Modell, das entwickelt wurde, um menschliche Sprache zu verstehen und zu generieren.
GPT	Die generativen vortrainierten Transformer sind eine Familie großer Sprachmodelle, welche die Transformerarchitektur verwenden, um Text, der wie von einem Menschen wirkt, zu verstehen und zu generieren.
Dynamische Verkettung	Die dynamische Verkettung ist eine Methode zur Automatisierung von Triggern für generative Aktionen. Anstatt jedes mögliche Thema oder jede mögliche Triggerausdrücke manuell festzulegen, kann die KI durch die dynamische Verkettung basierend auf dem Kontext der Unterhaltung bestimmen, welche Themen oder Plug-In-Aktionen aufgerufen werden müssen.

Bei der Auswahl der richtigen Option für die Absichtserkennung und Entitätsextraktion in Ihrem Workload für intelligente Anwendungen müssen Sie mehrere Punkte berücksichtigen:

Vordefinierte im Vergleich zu benutzerdefinierten Entitäten: Bewerten Sie, ob die von Microsoft Copilot Studio bereitgestellten vordefinierten Entitäten Ihren Anforderungen entsprechen. Vordefinierte Entitäten decken allgemeine Informationstypen wie Datumsangaben, Zahlen und Namen ab. Wenn Ihre Anwendung domänenspezifisches Wissen erfordert, müssen Sie möglicherweise benutzerdefinierte Entitäten erstellen.
Komplexität von Benutzereingaben: Berücksichtigen Sie die Komplexität und Variabilität von Benutzereingaben. Für einfache Szenarien können vordefinierte Entitäten ausreichen. Für komplexere Interaktionen sind womöglich benutzerdefinierte Entitäten und erweiterte Konfigurationen wie reguläre Ausdrücke (RegEx) erforderlich.
Slot-Filling: Ermitteln Sie, ob Ihre Anwendung ein proaktives Slot-Filling erfordert, bei dem der Agent aktiv nach fehlenden Informationen aus Benutzereingaben sucht und diese ergänzt. Das Slot-Filling kann die Benutzererfahrung verbessern, da so die Notwendigkeit von Folgefragen reduziert wird.
Leistung und Skalierbarkeit: Bewerten Sie die Leistung und Skalierbarkeit der von Ihnen gewählten Methode. Benutzerdefinierte Entitäten und komplexe Konfigurationen erfordern oft mehr Rechenleistung und können sich auf die Reaktionszeiten auswirken.
Einfache Wartung: Berücksichtigen Sie die einfache Wartung und Aktualisierung Ihrer Entitäten. Vordefinierte Entitäten sind einfacher zu verwalten, während benutzerdefinierte Entitäten fortlaufende Anpassungen erfordern, wenn sich Ihre Anwendung weiterentwickelt.

Die Wahl zwischen standardmäßiger NLU, Azure-CLU oder dynamischer Verkettung

In Copilot Studio kann das Auslösen von Themen oder Aktionen damit erreicht werden, dass das standardmäßige NLU-Modell verwendet wird, es mit einem benutzerdefinierten Azure-CLU-Modell kombiniert oder überschrieben wird oder das NLU-Modell vollständig durch dynamische Verkettung, ein auf dem großen GPT-Sprachmodell basierenden Modell, ersetzt wird.

	NLU-Standardmodell	Angepasstes Azure CLU Modell	Dynamische Verkettung
Pro	Standardmäßiges, vortrainiertes und damit sofort einsatzbereites Modell mit vielen vordefinierten Entitätstypen. Die Konfiguration erfolgt durch Hinzufügen von Triggerausdrücken und benutzerdefinierten Entitäten (entweder geschlossene Listen mit Werten und Synonymen oder reguläre Ausdrücke).	Unterstützt mehr Sprachen mit nativen Modellen. Unterstützt die Anpassung des Modells für Absichtsauslösung für eine bessere Absichtserkennung oder um spezifische Branchenanforderungen zu erfüllen. Ermöglicht die Extraktion komplexer Entitäten (z. B. desselben Typs). Für die Entitätsextraktion kann auch die Copilot Studio Standard-NLU verwendet werden.	Verwendet ein großes GPT-Sprachmodell und wird für ein breiteres Datenspektrum vorab trainiert. Kann mit mehreren Absichten umgehen und Themen und/oder Plug-Ins verketten. Generiert automatisch Fragen für fehlende Eingaben und beantwortet komplexe Entitäten und Fragen aus dem Gesprächskontext. Die Konfiguration erfolgt durch Beschreiben von Themen, Plug-In-Aktionen, Ein- und Ausgaben.
Contra	Erkennung einzelner Absichten pro Abfrage. Kann nicht erweitert werden. Sie können das Verhalten des Modells nicht ändern und keine Feinabstimmung des Modells vornehmen. Es wird so bereitgestellt, wie es ist. Wenn Sie mehrere Entitäten desselben Typs füllen, ist für jede Abfrage eine Mehrdeutigkeitsvermeidung erforderlich (z. B. von und nach Städten).	Erkennung einzelner Absichten pro Abfrage. Die Konfiguration erfolgt gegen Aufpreis in Azure. Hat seine eigenen Dienstgrenzwerte, die bewertet werden müssen. Azure CLU-Absichten und Copilot Studio -Themen müssen sorgfältig synchronisiert werden.	Da es sich um eine generative KI-Funktion handelt, ist die Lizenzverbrauchsrate von Nachrichten höher als bei der regulären Themenauslösung.

Triggerausdrücke und Slot-Filling

Nutzen Sie bei der Entwicklung intelligenter Anwendungs-Workloads native Funktionen, um die Absichtserkennung zu verbessern und Unterhaltungen zu optimieren. Beginnen Sie damit, Thementriggerausdrücke aus vorhandenen FAQ-Datenbanken und Chat-Transkripten zu identifizieren, um sicherzustellen, dass die erwarteten Phrasen relevant und korrekt sind. Überlegen Sie, wie Sie Entitäten verwenden werden. Geben Sie z. B. an, ob Sie reguläre Ausdrücke verwenden, um Auftrags-IDs zu finden, vordefinierte Entitäten für E-Mails oder geschlossene Listen für Vorgangstypen mit Synonymen. Planen Sie außerdem, wie Sie Thementrigger mit Beispielausdrücken testen, um die Genauigkeit Ihrer Prozesse für die Absichtserkennung und Entitätsextraktion zu überprüfen und zu verfeinern. Weitere Informationen finden Sie unter Bereitstellung und Testüberlegungen.

Triggerausdrücke

Triggerphrasen trainieren Ihr Agent NLU-Modell. Sie helfen den Agenten, Benutzeräußerungen zu erkennen und genau darauf zu reagieren, indem sie bestimmte Ausdrücke festlegen, die bestimmte Themen auslösen. Die richtige Konfiguration dieser Triggerphrasen stellt sicher, dass der Agent die Absicht des Benutzers richtig identifizieren und angemessen reagieren kann. Wenn der Agent sich nicht sicher ist, welches Thema ausgelöst werden soll, kann er bis zu drei potenzielle Themenkandidaten vorschlagen (Systemthema für mehrere passende Themen) oder auf eine Standardantwort zurückgreifen, wenn kein Thema identifiziert wird. Dieser Mechanismus trägt dazu bei, den Gesprächsfluss aufrechtzuerhalten und stellt sicher, dass der Agent eine Vielzahl von Benutzereingaben effektiv verarbeiten kann.

Entitätsextraktion und Slot-Filling

Die Entitätsextraktion und das Füllen von Lücken sind wichtige Bestandteile bei der Entwicklung wirksamer Agenten. Diese Prozesse ermöglichen es den Agenten, Informationen effizient zu erfassen und zu nutzen, indem relevante Details aus Benutzerabfragen identifiziert und extrahiert werden.

Bei der Entitätsextraktion werden die Eingaben des Benutzers analysiert, um bestimmte Informationen zu identifizieren. Aus der Abfrage „Ich möchte drei große blaue T-Shirts bestellen“ sollte das NLU-Modell des Agenten beispielsweise die folgenden Entitäten extrahieren:

Menge: 3
Farbe: Blau
Größe: Groß
Artikeltyp: T-Shirt

Beim Füllen von Lücken werden diese extrahierten Entitäten verwendet, um die erforderlichen Informationen für eine bestimmte Aufgabe zu vervollständigen. In diesem Beispiel erkennt der Agent das Thema als Auftrag und füllt die erforderlichen Slots mit den extrahierten Entitäten aus. Der Agent ist in der Lage, die Anfrage des Benutzenden zu verstehen, ohne weitere Fragen zu stellen, wodurch die Interaktion optimiert wird.

Die Entitätsextraktion und das Slot-Filling ermöglichen es Agenten, komplexe Anfragen effektiver zu bearbeiten, genaue und kontextbezogene Antworten zu geben und die Benutzererfahrung zu verbessern.

Erfahren Sie mehr:

Integration in Microsoft Copilot Studio mit Azure CLU

Durch die Integration eines CLU-Modells in einen Copilot Studio Agenten können die Funktionen des Agenten erheblich erweitert werden. Diese Integration beinhaltet die Zuordnung von Azure CLU-Absichten zu Copilot Studio Themen, sodass die Agenten die Benutzerabsichten genauer verstehen und darauf reagieren können. Darüber hinaus können Copilot Studio vordefinierte Entitäten zusammen mit Azure CLU-Entitäten verwendet werden, wodurch ein robustes Framework für die Entitätsextraktion bereitgestellt wird.

Wenn Sie sich mit dieser Integration befassen, müssen Sie feststellen, ob Ihr Workload für intelligente Anwendungen Azure CLU erfordert. Beispielsweise unterstützt Azure CLU mehr Sprachen, branchenspezifische Wörterbücher und die Extraktion komplexer Entitäten, was für Ihre Anwendung vielleicht unerlässlich ist. Benutzerdefinierte Entitätsextraktionen mit Azure CLU können auch das stille oder glückliche Füllen von Lücken ermöglichen, sodass der Agent Szenarien wie das Identifizieren von Quell- und Zielstädten in einer einzigen Phrase verarbeiten kann, ohne Folgefragen zu stellen.

Ein weiterer wichtiger Aspekt besteht darin, sicherzustellen, dass die Kontingente und Grenzwerte des Azure-CLU-Diensts mit der Nutzung Ihres Agents übereinstimmen. Wenn Sie z. B. weniger als 1.000 Anrufe pro Minute erwarten, die eine Absichtserkennung erfordern, können Sie Azure CLU mit der Ebene S einrichten. Diese Konfiguration stellt sicher, dass Ihr Agent die erwartete Arbeitsbelastung bewältigen kann, ohne die Dienstgrenzen zu überschreiten oder unerwartete Kosten zu verursachen.

Erfahren Sie mehr:

Überlegungen zu Themenstrukturen

Eine effektive Strukturierung der Themen ist wichtig, damit Unterhaltungen natürlich und reibungslos fließen können. Themen sind diskrete Konversationspfade, die es Benutzern ermöglichen, in Kombination reibungslos mit den Agenten zu interagieren. Im Folgenden finden Sie einige wichtige Überlegungen zum Entwerfen von Themenstrukturen:

Trigger-basierte Themen: Diese Themen werden basierend auf Benutzeräußerungen aktiviert und dienen als Einstiegspunkte. Legen Sie klare Triggerausdrücke für diese Themen fest. Wenn sich Triggerausdrücke über mehrere Themen hinweg überschneiden, sollten Sie die Implementierung eines Sammelthemas in Betracht ziehen, das nach dem Stellen klärender Fragen zum entsprechenden Thema weiterleiten kann. Bei der Entitätsextraktion und dem Slot-Filling können diese klärenden Fragen übersprungen werden, wenn die erforderlichen Informationen bereits bereitgestellt wurden.
Umleitungsbasierte Themen: Diese Themen werden durch Umleitungsaktionen, -aktivitäten oder -ereignisse ausgelöst und können von mehreren anderen Themen aufgerufen werden. Sie sollten so konzipiert sein, dass sie wiederverwendbar und modular sind, und Ein- und Ausgabevariablen haben, um eine nahtlose Integration in verschiedene Unterhaltungspfade zu ermöglichen.
Themen mit doppeltem Trigger: Einige Themen können entweder durch Absichtserkennung oder durch eine explizite Weiterleitung ausgelöst werden. Diese Flexibilität ermöglicht dynamischere und reaktionsschnellere Gespräche.
Unterhaltungsverstärkung und Fallback: Erstellen Sie Fallbackthemen für Situationen, in denen kein passendes Thema durch die Abfrage des Benutzers ausgelöst wird. Diese Themen können allgemeine Antworten geben oder relevante Themen vorschlagen, um den Gesprächsfluss aufrechtzuerhalten.

Design-Ansatz:

Benutzerdefinierte Themen für Schlüsselszenarien: Entwickeln Sie einige benutzerdefinierte Themen für Schlüsselszenarien mit relevanten Triggerphrasen und Weiterleitungen. Verwenden Sie eine über- und untergeordnete Themenstruktur, um komplexe Interaktionen zu verwalten. Implementieren Sie für nicht erkannte Intentionen generative Antworten und Fallback-Mechanismen.
Themen zur Begriffsklärung: Planen Sie die Verwendung von Themen zur Begriffsklärung für Vorgänge, die klärende Fragen erfordern. Beispielsweise müssen bei Benutzerkontovorgängen möglicherweise die Art des Vorgangs (z. B. Erstellen, Entsperren, Sperren) und das beteiligte System (z. B. SAP, ServiceNow, Microsoft) geklärt werden.
Vermeiden von Duplikaten: Um zu vermeiden, dass Inhalte dupliziert werden, erstellen Sie wiederverwendbare Themen für Dialogpfade, die wiederholt werden müssen. Diese wiederverwendbaren Themen können von einem übergeordneten Thema aufgerufen werden. Nach Abschluss der Unterhaltung kann die Logik des übergeordneten Themas fortgesetzt werden.

Erfahren Sie mehr:

Bewährte Methoden für Themen

Umgang mit nicht erkannten Absichten

Die effektive Verwaltung nicht erkannter Absichten sorgt für eine reibungslose Benutzererfahrung. Unerkannte Absichten treten auf, wenn die Agentur eine Benutzeräußerung nicht versteht und nicht über genügend Vertrauen verfügt, um ein vorhandenes Thema auszulösen. Im Folgenden finden Sie einige Vorschläge für den Umgang mit diesen Szenarien:

Verwalten nicht erkannter Absichten: Leiten Sie zunächst nicht erkannte Absichten an das Thema Conversational Boosting System weiter, das auf öffentlichen Websites und Unternehmensressourcen wie SharePoint Websites nach Antworten sucht. Wenn keine relevanten Informationen gefunden werden, kann das System mithilfe einer benutzerdefinierten Systemeingabeaufforderung mit dem Azure OpenAI GPT-4 Modell auf eine ChatGPT-ähnliche Erfahrung zurückgreifen. Dieser Ansatz stellt sicher, dass Benutzende auch dann hilfreiche Antworten erhalten, wenn Anfragen ungeplant sind.
Integration mit externen Systemen: Überlegen Sie, ob Sie im Rahmen Ihrer Fallbackstrategie eine Integration mit externen Systemen durchführen. Zum Beispiel die Integration in das Azure-Modell OpenAI GPT-4 mithilfe von HTTP-Anforderungen, um eine konforme ChatGPT-ähnliche Erfahrung bereitzustellen.
Überwachung der Fallback-Nutzung: Überprüfen Sie regelmäßig den Prozentsatz der Unterhaltungen, die auf Fallback stoßen. Nutzen Sie diese Erkenntnisse, um bestehende Themen anzureichern oder neue zu erstellen, um sicherzustellen, dass die Agenten ihre Verständnis- und Reaktionsfähigkeiten kontinuierlich verbessert.
Fallbackthema und generative Antworten: Das Fallback-Systemthema wird ausgelöst, wenn kein passendes Thema identifiziert wird. Wenn generative Antworten aktiviert sind, wird das Thema zur Unterhaltungssteigerung zuerst bei unbekannten Absichtsereignissen ausgelöst, gefolgt vom Fallback-Thema nach Bedarf. Dieser mehrschichtige Ansatz hilft dabei, nicht erkannte Absichten effektiv zu verwalten.
Unterhaltungsverstärkung und Fallback verwenden: Verwenden Sie generative Antworten, um verschiedene Datenquellen zu durchsuchen oder in andere Systeme wie Azure Cognitive Service for Language zu integrieren. Dieser Dienst kann große Mengen an Frage-Antwort-Paaren verarbeiten und enthält ein Chatmodell für zufällige Fragen.
Kernszenarien und benutzerdefinierte Themen: Stellen Sie sicher, dass Kernszenarien und -themen gut definiert sind und über benutzerdefinierte Themen behandelt werden. Definieren Sie die Ergebnisse dieser Themen klar und deutlich, um einen strukturierten und effizienten Gesprächsfluss aufrechtzuerhalten.

Lokalisierung und Sprachen

Berücksichtigen Sie beim Erstellen eines Agenten die Sprachen und Märkte, die Ihr Workload für intelligente Anwendungen unterstützen muss. Lokalisierung und Sprachunterstützung sind entscheidende Faktoren, um sicherzustellen, dass Ihr intelligenter Anwendungs-Workload die Anforderungen unterschiedlicher Benutzergruppen erfüllt. Hier sind einige Vorschläge:

Ein Agent pro Sprache: Bei diesem Ansatz wird für jede Sprache ein separater Agent erstellt. Es stellt sicher, dass jeder Agent vollständig für seine spezifische Sprache optimiert ist. Es kann jedoch ressourcenintensiv sein, mehrere Agenten zu verwalten.
Ein Agent für mehrere Sprachen (konfigurierte Übersetzungen): Bei diesem Ansatz unterstützt ein einzelner Agent mehrere Sprachen, wobei Übersetzungen als Teil der Agent-Konfiguration bereitgestellt werden. Dieser Ansatz erfordert, dass die Übersetzungen jedes Mal aktualisiert werden, wenn der Agent aktualisiert oder neue Inhalte hinzugefügt werden. Er bietet ein ausgewogenes Verhältnis zwischen Ressourceneffizienz und Sprachunterstützung, erfordert jedoch eine sorgfältige Verwaltung der Aktualisierungen von Übersetzungen.
Ein Agent für mehrere Sprachen (Echtzeitübersetzungen): Diese Methode verwendet einen Relais-Agent, um Echtzeitübersetzungen zur Laufzeit bereitzustellen. Dies ermöglicht die schnelle Bereitstellung weiterer Sprachen und reduziert den Bedarf an häufigen Übersetzungsaktualisierungen. Es führt jedoch eine Abhängigkeit vom Relais-Agent und einer Echtzeitübersetzungsschicht ein, z. B. Azure Service Copilot und Azure Cognitive Services Translator.

Wichtige Überlegungen:

Sprachen und Märkte: Die Sprachen und Märkte, die Ihr Agent unterstützen muss, beeinflussen Ihre Lokalisierungsstrategie.
Einfacher vs. mehrsprachiger Agent: Entscheiden Sie, ob Sie einen einzelnen Agenten entwickeln möchten, der mehrere Sprachen unterstützt oder separate Agenten für jede Sprache entwickeln. Diese Entscheidung hängt von Faktoren wie Ressourcenverfügbarkeit, Wartungsmöglichkeiten und der Komplexität der beteiligten Sprachen ab.
Übersetzungszeitpunkt: Überlegen Sie, ob Übersetzungen während der Konfigurationsphase festgelegt oder zur Laufzeit in Echtzeit bereitgestellt werden sollen. Konfigurierte Übersetzungen bieten Stabilität und Kontrolle, während Echtzeitübersetzungen Flexibilität und eine schnelle Bereitstellung ermöglichen.

Erfahren Sie mehr:

Freigeben über

Optionen für die Absichtserkennung und Entitätsextraktion für Ihre intelligenten Anwendungs-Workloads

Definitionen

Die Wahl zwischen standardmäßiger NLU, Azure-CLU oder dynamischer Verkettung

Triggerausdrücke und Slot-Filling

Triggerausdrücke

Entitätsextraktion und Slot-Filling

Integration in Microsoft Copilot Studio mit Azure CLU

Überlegungen zu Themenstrukturen

Umgang mit nicht erkannten Absichten

Lokalisierung und Sprachen

Feedback

Zusätzliche Ressourcen