Verwenden der Erkennung benannter Entitäten
Das NER-Feature kann unstrukturierten Text auswerten und benannte Entitäten aus Texten in mehreren vordefinierten Kategorien extrahieren, z. B. Person, Standort, Ereignis, Produkt und Organisation.
Entwicklungsoptionen
Zur Verwendung der Erkennung benannter Entitäten übermitteln Sie unformatierten, unstrukturierten Text zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne zusätzliche Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird. Es gibt zwei Möglichkeiten, die Erkennung benannter Entitäten zu verwenden:
Entwicklungsoption | BESCHREIBUNG |
---|---|
Language Studio | Language Studio ist eine webbasierte Plattform, mit der Sie ohne Azure-Konto und mit Ihren eigenen Daten die Verknüpfung von Entitäten mit Textbeispielen ausprobieren können, wenn Sie sich registrieren. Weitere Informationen finden Sie auf der Language Studio-Website oder im Language Studio-Schnellstart. |
REST-API oder Clientbibliothek (Azure SDK) | Integrieren Sie die Erkennung benannter Entitäten mithilfe der REST-API oder der Clientbibliothek, die in einer Vielzahl von Sprachen verfügbar ist, in Ihre Anwendungen. Weitere Informationen finden Sie im Schnellstart zur Erkennung benannter Entitäten. |
Festlegen der Art der Datenverarbeitung (optional)
Eingabesprachen
Bei der Übermittlung von Dokumenten zur Verarbeitung können Sie angeben, in welcher der unterstützten Sprachen die Dokumente geschrieben sind. Wenn Sie keine Sprache angeben, wird für die Extraktion von Schlüsselbegriffen standardmäßig Englisch verwendet. Die API gibt möglicherweise Offsets in der Antwort zurück, um verschiedene mehrsprachige und Emoji-Codierungen zu unterstützen.
Übermitteln der Daten
Die Analyse erfolgt, wenn die Anforderung eingeht. Die synchrone Verwendung des NER-Features ist zustandslos. Auf Ihrem Konto werden keine Daten gespeichert, und die Ergebnisse werden sofort in der Antwort zurückgegeben.
Wenn Sie dieses Feature asynchron verwenden, sind die API-Ergebnisse ab der Erfassung der Anforderung wie in der Antwort angegeben 24 Stunden lang verfügbar. Nach diesem Zeitraum werden die Ergebnisse endgültig gelöscht und stehen nicht mehr zum Abruf zur Verfügung.
Die API versucht, die definierten Entitätskategorien für eine bestimmte Dokumentsprache zu erkennen.
Abrufen von NER-Ergebnissen
Wenn Sie Ergebnisse von der NER erhalten, können Sie diese an eine App streamen oder die Ausgabe in einer Datei im lokalen System speichern. Die API-Antwort enthält erkannte Entitäten, einschließlich ihrer Kategorien und Unterkategorien sowie Konfidenzbewertungen.
Auswählen der zurückzugebenden Entitäten
Die API versucht, die definierten Entitätstypen und -tags für eine bestimmte Dokumentsprache zu erkennen. Die Entitätstypen und Tags ersetzen die Struktur der Kategorien und Unterkategorien, die in den älteren Modellen zur Definition von Entitäten verwendet wurden, und bieten mehr Flexibilität. Sie können auch angeben, welche Entitäten erkannt und zurückgegeben werden. Verwenden Sie die optionalen Parameter includeList
und excludeList
mit den entsprechenden Entitätstypen. Das folgende Beispiel würde nur Location
erkennen. Sie können einen oder mehrere Entitätstypen für die Rückgabe angeben. Aufgrund der für diese Version eingeführten Typen- und Tagshierarchie haben Sie die Flexibilität, wie folgt nach verschiedenen Granularitätsebenen zu filtern:
Eingabe:
Hinweis
In diesem Beispiel wird nur der Entitätstyp Location (Standort) zurückgegeben.
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
In den obigen Beispielen würden Entitäten zurückgegeben, die unter den Entitätstyp Location
fallen, z. B. die gekennzeichneten Entitäten GPE
, Structural
und Geological
wie durch Entitätstypen und Tags beschrieben. Wir können die zurückgegebenen Entitäten auch weiter filtern, indem wir mithilfe eines der Entitätstags für den Entitätstyp Location
verwenden, z. B. nur nach dem Tag GPE
filtern, wie hier beschrieben:
"parameters":
{
"includeList" :
[
"GPE"
]
}
Diese Methode gibt alle Location
-Entitäten zurück, die nur unter das Tag GPE
fallen, und ignoriert alle anderen Entitäten, die unter den Typ Location
fallen, der mit einem anderen Entitätstag gekennzeichnet ist, wie die mit Structural
oder Geological
gekennzeichneten Location
-Entitäten. Mit dem Parameter excludeList
könnten wir unsere Ergebnisse auch weiter aufschlüsseln. Gekennzeichnete GPE
-Entitäten können mit den folgenden Tags gekennzeichnet werden: City
, State
, CountryRegion
, Continent
. Wir könnten beispielsweise die Tags Continent
und CountryRegion
in unserem Beispiel ausschließen:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
Mit diesen Parametern können wir erfolgreich nur nach Location
-Entitätstypen filtern, da das im Parameter includeList
enthaltene Entitätstag GPE
unter den Typ Location
fällt. Anschließend filtern wir nur nach geopolitischen Entitäten und schließen alle Entitäten aus, die mit den Tags Continent
oder CountryRegion
gekennzeichnet sind.
Zusätzliche Ausgabeattribute
Um Benutzern mehr Einblicke in die Typen einer Entität zu bieten und eine höhere Benutzerfreundlichkeit zu ermöglichen, unterstützt NER diese Attribute in der Ausgabe:
Name des Attributs | type | Definition |
---|---|---|
type |
String | Der spezifischste Typ der erkannten Entität. Beispielsweise ist „Seattle“ eine City , eine GPE (geopolitische Entität) und eine Location . Die granularste Klassifizierung für „Seattle“ ist, dass es sich um eine City handelt. Der Typ für den Text „Seattle“ wäre City . |
tags |
Liste (Tags) | Eine Liste von Tagobjekten, die die Affinität der erkannten Entität zu einer Hierarchie oder einer anderen Gruppierung ausdrücken. Ein Tag enthält zwei Felder: 1. name : Ein eindeutiger Name für das Tag.2. confidenceScore : Die zugeordnete Konfidenzbewertung für ein Tag zwischen 0 und 1.Dieser eindeutige tagName wird verwendet, um die Parameter inclusionList und exclusionList zu filtern. |
metadata |
Objekt | Metadaten umfassen ein Objekt, das weitere Daten zum erkannten Entitätstyp enthält. Es ändert sich basierend auf dem Feld metadataKind . |
Beispielausgabe
Diese Beispielausgabe enthält ein Beispiel der weiteren Ausgabeattribute.
{
"kind": "EntityRecognitionResults",
"results": {
"documents": [
{
"id": "1",
"entities": [
{
"text": "Microsoft",
"category": "Organization",
"type": "Organization",
"offset": 0,
"length": 9,
"confidenceScore": 0.97,
"tags": [
{
"name": "Organization",
"confidenceScore": 0.97
}
]
},
{
"text": "One",
"category": "Quantity",
"type": "Number",
"subcategory": "Number",
"offset": 21,
"length": 3,
"confidenceScore": 0.9,
"tags": [
{
"name": "Number",
"confidenceScore": 0.8
},
{
"name": "Quantity",
"confidenceScore": 0.8
},
{
"name": "Numeric",
"confidenceScore": 0.8
}
],
"metadata": {
"metadataKind": "NumberMetadata",
"numberKind": "Integer",
"value": 1.0
}
}
],
"warnings": []
}
],
"errors": [],
"modelVersion": "2023-09-01"
}
}
Angeben des NER-Modells
Standardmäßig wendet dieses Feature das neueste verfügbare KI-Modell für Ihren Text an. Sie können Ihre API-Anforderungen auch für die Verwendung einer bestimmten Modellversion konfigurieren.
Grenzwerte für Dienste und Daten
Informationen zur Größe und Anzahl der Anforderungen, die Sie pro Minute und pro Sekunde senden können, finden Sie im Artikel Diensteinschränkungen.