Freigeben über


Entitätskomponenten in der benutzerdefinierten Textanalyse für Gesundheit

In der benutzerdefinierten Textanalyse für Gesundheit sind Entitäten relevante Informationen, die aus Ihrem unstrukturierten Eingabetext extrahiert werden. Eine Entität kann mit verschiedenen Methoden extrahiert werden. Sie kann über den Kontext gelernt, aus einer Liste abgeglichen oder von einer vordefinierten erkannten Entität erkannt werden. Jede Entität in Ihrem Projekt besteht aus einer oder mehreren dieser Methoden, die als Komponenten Ihrer Entität definiert sind. Wenn eine Entität von mehreren Komponenten definiert wird, können sich ihre Vorhersagen überlappen. Sie können das Verhalten einer Entitätsvorhersage bei Überschneidung ihrer Komponenten steuern, indem Sie einen festen Satz von Optionen in den Entitätsoptionen verwenden.

Komponententypen

Eine Entitätskomponente bestimmt, wie Sie die Entität extrahieren können. Eine Entität kann eine Komponente enthalten, die die einzige Methode festlegt, die zum Extrahieren der Entität verwendet wird, oder mehrere Komponenten, um die Möglichkeiten zu erweitern, mit denen die Entität definiert und extrahiert wird.

Die Entitäten der Textanalyse für Gesundheit werden automatisch als Entitäten mit vordefinierten Komponenten in Ihr Projekt geladen. Sie können Listenkomponenten für Entitäten mit vordefinierten Komponenten definieren, aber keine gelernten Komponenten hinzufügen. Analog dazu können Sie neue Entitäten mit gelernten Komponenten und Listenkomponenten erstellen, aber sie nicht mit zusätzlichen vordefinierten Komponenten auffüllen.

„Gelernt“-Komponente

Die gelernte Komponente verwendet die Entitätstags, mit der Sie Ihren Text beschriften, um ein durch maschinelles Lernen trainiertes Modell zu trainieren. Das Modell lernt, basierend auf dem Kontext innerhalb des Texts vorherzusagen, wo sich die Entität befindet. Ihre Bezeichnungen enthalten Beispiele dafür, wo die Entität in Text erwartet wird, basierend auf der Bedeutung der umgebenden Wörter und als die Wörter, die beschriftet wurden. Diese Komponente wird nur definiert, wenn Sie Ihren Daten für die Entität Bezeichnungen hinzufügen. Wenn Sie keine Daten beschriften, ist keine gelernte Komponente vorhanden.

Die Entitäten der Textanalyse für Gesundheit, die standardmäßig über vordefinierte Komponenten verfügen, können nicht mit gelernten Komponenten erweitert werden. Das bedeutet, dass sie keine weitere Bezeichnung erfordern oder akzeptieren, um zu funktionieren.

Ein Screenshot, der ein Beispiel für „Gelernt“-Komponenten für Entitäten zeigt.

Listenkomponente

Die Listenkomponente stellt einen festen, abgeschlossenen Satz verwandter Wörter zusammen mit ihren Synonymen dar. Die Komponente führt einen genauen Textabgleich mit der Liste der Werte aus, die Sie als Synonyme angeben. Jedes Synonym gehört zu einem „Listenschlüssel“, der als normalisierter Standardwert für das Synonym verwendet werden kann, der in der Ausgabe zurückgegeben wird, wenn die Listenkomponente abgeglichen wird. Listenschlüssel werden nicht für den Abgleich verwendet.

In mehrsprachigen Projekten kann für die einzelnen Sprachen jeweils eine andere Gruppe von Synonymen angegeben werden. Bei Verwendung der Vorhersage-API können Sie die Sprache in der Eingabeanforderung angeben, sodass nur die Synonyme abgeglichen werden, die dieser Sprache zugeordnet sind.

Ein Screenshot, der ein Beispiel für Listenkomponenten für Entitäten zeigt.

Vordefinierte Komponente

Die Entitäten der Textanalyse für Gesundheit werden automatisch als Entitäten mit vordefinierten Komponenten in Ihr Projekt geladen. Sie können Listenkomponenten für Entitäten mit vordefinierten Komponenten definieren, aber keine gelernten Komponenten hinzufügen. Analog dazu können Sie neue Entitäten mit gelernten Komponenten und Listenkomponenten erstellen, aber sie nicht mit zusätzlichen vordefinierten Komponenten auffüllen. Entitäten mit vordefinierten Komponenten sind vortrainiert und können Informationen zu ihren Kategorien ohne Bezeichnungen extrahieren.

Ein Screenshot, der ein Beispiel für vordefinierte Komponenten für Entitäten zeigt.

Entitätsoptionen

Wenn mehrere Komponenten für eine Entität definiert sind, können sich ihre Vorhersagen überlappen. Wenn eine Überschneidung auftritt, wird die endgültige Vorhersage jeder Entität durch eine der folgenden Optionen bestimmt.

Komponenten kombinieren

Kombinieren Sie Komponenten als eine Entität, wenn sie sich überschneiden, indem Sie die Vereinigung aller Komponenten übernehmen.

Verwenden Sie diese Option, um alle Komponenten zu kombinieren, wenn sie sich überschneiden. Bei kombinierten Komponenten erhalten Sie sämtliche Zusatzinformationen, die an eine Liste oder vordefinierte Komponente gebunden sind (sofern vorhanden).

Beispiel

Angenommen, Sie verfügen über eine Entität namens „Software“, die eine Listenkomponente mit dem Eintrag „Proseware OS“ enthält. In Ihren Eingabedaten haben Sie „I want to buy Proseware OS 9“ (Ich möchte Proseware OS 9 kaufen) mit „Proseware OS 9“ als Software gekennzeichnet:

Screenshot mit Überlappung einer „Gelernt“-und einer Listenentität.

Dank des Kombinierens von Komponenten wird die Entität mit dem vollständigen Kontext als „Proseware OS 9“ zurückgegeben – zusammen mit dem Schlüssel aus der Listenkomponente:

Screenshot des Ergebnisses einer kombinierten Komponente.

Angenommen, bei der gleichen Äußerung wurde von der gelernten Komponente nur „OS 9“ vorhergesagt:

Screenshot einer Äußerung mit der Vorhersage „OS9“ von der „Gelernt“-Komponente.

Dank des Kombinierens von Komponenten wird die Entität trotzdem als „Proseware OS 9“ mit dem Schlüssel aus der Listenkomponente zurückgegeben:

Screenshot der zurückgegebenen Software-Entität.

Komponenten nicht kombinieren

Jede Komponente mit Überschneidung wird als separate Instanz der Entität zurückgegeben. Wenden Sie Ihre eigene Logik nach der Vorhersage mit dieser Option an.

Beispiel

Angenommen, Sie verfügen über eine Entität namens „Software“, die eine Listenkomponente mit dem Eintrag „Proseware Desktop“ enthält. In Ihren beschrifteten Daten haben Sie „I want to buy Proseware Desktop Pro“ (Ich möchte Proseware Desktop Pro kaufen) mit „Proseware Desktop Pro“ als Software beschriftet:

Screenshot mit einem Beispiel für Überlappung einer „Gelernt“-und einer Listenentität.

Wenn Sie keine Komponenten kombinieren, wird die Entität zweimal zurückgegeben:

Screenshot der zweimal zurückgegebenen Entität.

Verwenden von Komponenten und Optionen

Mit Komponenten können Sie Ihre Entität flexibel auf mehrere Arten definieren. Durch Kombinieren von Komponenten stellen Sie sicher, dass jede Komponente dargestellt wird, und Sie verringern die Anzahl von Entitäten, die in Ihren Vorhersagen zurückgegeben werden.

Eine gängige Methode besteht darin, eine vordefinierte Komponente mit einer Liste von Werten zu erweitern, die von der vordefinierten Komponente möglicherweise nicht unterstützt werden. Wenn Sie beispielsweise über eine Entität vom Typ Medication Name (Medikamentenname) verfügen, der die vordefinierte Komponente Medication.Name hinzugefügt wurde, werden von der Entität möglicherweise nicht alle spezifischen Medikamentennamen für Ihre Domäne vorhergesagt. Sie können die Werte der Entität „Medication Name“ (Medikamentenname) mithilfe einer Listenkomponente erweitern und so die vordefinierte Komponente mit Ihren eigenen Medikamentennamen erweitern.

In anderen Fällen möchten Sie möglicherweise eine Entität über den Kontext extrahieren – beispielsweise ein medizinisches Gerät. In diesem Fall würden Sie eine Bezeichnung für die gelernte Komponente des medizinischen Geräts verwenden, um zu ermitteln, wo sich ein medizinisches Gerät befindet (auf der Grundlage der Position innerhalb des Satzes). Möglicherweise verfügen Sie auch über eine Liste vorab bekannter medizinischer Produkte, die immer extrahiert werden sollen. Wenn Sie beide Komponenten in einer Entität kombinieren, können Sie beide Optionen für die Entität erhalten.

Wenn Sie keine Komponenten kombinieren, kann jede Komponente als unabhängiger Entitätsextraktor fungieren. Diese Option ermöglicht es beispielsweise, die aus einer Liste extrahierten Entitäten von den Entitäten zu trennen, die über die gelernten oder vordefinierten Komponenten extrahiert werden, um sie unterschiedlich zu behandeln.

Nächste Schritte