Freigeben über


Verwenden der Erkennung benannter Entitäten

Das NER-Feature kann unstrukturierten Text auswerten und benannte Entitäten aus Texten in mehreren vordefinierten Kategorien extrahieren, z. B. Person, Standort, Ereignis, Produkt und Organisation.

Entwicklungsoptionen

Zur Verwendung der Erkennung benannter Entitäten übermitteln Sie unformatierten, unstrukturierten Text zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne zusätzliche Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird. Es gibt zwei Möglichkeiten, die Erkennung benannter Entitäten zu verwenden:

Entwicklungsoption BESCHREIBUNG
Language Studio Language Studio ist eine webbasierte Plattform, mit der Sie ohne Azure-Konto und mit Ihren eigenen Daten die Verknüpfung von Entitäten mit Textbeispielen ausprobieren können, wenn Sie sich registrieren. Weitere Informationen finden Sie auf der Language Studio-Website oder im Language Studio-Schnellstart.
REST-API oder Clientbibliothek (Azure SDK) Integrieren Sie die Erkennung benannter Entitäten mithilfe der REST-API oder der Clientbibliothek, die in einer Vielzahl von Sprachen verfügbar ist, in Ihre Anwendungen. Weitere Informationen finden Sie im Schnellstart zur Erkennung benannter Entitäten.

Festlegen der Art der Datenverarbeitung (optional)

Eingabesprachen

Bei der Übermittlung von Dokumenten zur Verarbeitung können Sie angeben, in welcher der unterstützten Sprachen die Dokumente geschrieben sind. Wenn Sie keine Sprache angeben, wird für die Extraktion von Schlüsselbegriffen standardmäßig Englisch verwendet. Die API gibt möglicherweise Offsets in der Antwort zurück, um verschiedene mehrsprachige und Emoji-Codierungen zu unterstützen.

Übermitteln der Daten

Die Analyse erfolgt, wenn die Anforderung eingeht. Die synchrone Verwendung des NER-Features ist zustandslos. Auf Ihrem Konto werden keine Daten gespeichert, und die Ergebnisse werden sofort in der Antwort zurückgegeben.

Wenn Sie dieses Feature asynchron verwenden, sind die API-Ergebnisse ab der Erfassung der Anforderung wie in der Antwort angegeben 24 Stunden lang verfügbar. Nach diesem Zeitraum werden die Ergebnisse endgültig gelöscht und stehen nicht mehr zum Abruf zur Verfügung.

Die API versucht, die definierten Entitätskategorien für eine bestimmte Dokumentsprache zu erkennen.

Abrufen von NER-Ergebnissen

Wenn Sie Ergebnisse von der NER erhalten, können Sie diese an eine App streamen oder die Ausgabe in einer Datei im lokalen System speichern. Die API-Antwort enthält erkannte Entitäten, einschließlich ihrer Kategorien und Unterkategorien sowie Konfidenzbewertungen.

Auswählen der zurückzugebenden Entitäten

Die API versucht, die definierten Entitätstypen und -tags für eine bestimmte Dokumentsprache zu erkennen. Die Entitätstypen und Tags ersetzen die Struktur der Kategorien und Unterkategorien, die in den älteren Modellen zur Definition von Entitäten verwendet wurden, und bieten mehr Flexibilität. Sie können auch angeben, welche Entitäten erkannt und zurückgegeben werden. Verwenden Sie die optionalen Parameter includeList und excludeList mit den entsprechenden Entitätstypen. Das folgende Beispiel würde nur Locationerkennen. Sie können einen oder mehrere Entitätstypen für die Rückgabe angeben. Aufgrund der für diese Version eingeführten Typen- und Tagshierarchie haben Sie die Flexibilität, wie folgt nach verschiedenen Granularitätsebenen zu filtern:

Eingabe:

Hinweis

In diesem Beispiel wird nur der Entitätstyp Location (Standort) zurückgegeben.

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

In den obigen Beispielen würden Entitäten zurückgegeben, die unter den Entitätstyp Location fallen, z. B. die gekennzeichneten Entitäten GPE, Structural und Geological wie durch Entitätstypen und Tags beschrieben. Wir können die zurückgegebenen Entitäten auch weiter filtern, indem wir mithilfe eines der Entitätstags für den Entitätstyp Location verwenden, z. B. nur nach dem Tag GPE filtern, wie hier beschrieben:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }
    

Diese Methode gibt alle Location-Entitäten zurück, die nur unter das Tag GPE fallen, und ignoriert alle anderen Entitäten, die unter den Typ Location fallen, der mit einem anderen Entitätstag gekennzeichnet ist, wie die mit Structural oder Geological gekennzeichneten Location-Entitäten. Mit dem Parameter excludeList könnten wir unsere Ergebnisse auch weiter aufschlüsseln. Gekennzeichnete GPE-Entitäten können mit den folgenden Tags gekennzeichnet werden: City, State, CountryRegion, Continent. Wir könnten beispielsweise die Tags Continent und CountryRegion in unserem Beispiel ausschließen:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

Mit diesen Parametern können wir erfolgreich nur nach Location-Entitätstypen filtern, da das im Parameter includeList enthaltene Entitätstag GPE unter den Typ Location fällt. Anschließend filtern wir nur nach geopolitischen Entitäten und schließen alle Entitäten aus, die mit den Tags Continent oder CountryRegion gekennzeichnet sind.

Zusätzliche Ausgabeattribute

Um Benutzern mehr Einblicke in die Typen einer Entität zu bieten und eine höhere Benutzerfreundlichkeit zu ermöglichen, unterstützt NER diese Attribute in der Ausgabe:

Name des Attributs type Definition
type String Der spezifischste Typ der erkannten Entität.

Beispielsweise ist „Seattle“ eine City, eine GPE (geopolitische Entität) und eine Location. Die granularste Klassifizierung für „Seattle“ ist, dass es sich um eine City handelt. Der Typ für den Text „Seattle“ wäre City.
tags Liste (Tags) Eine Liste von Tagobjekten, die die Affinität der erkannten Entität zu einer Hierarchie oder einer anderen Gruppierung ausdrücken.

Ein Tag enthält zwei Felder:
1. name: Ein eindeutiger Name für das Tag.
2. confidenceScore: Die zugeordnete Konfidenzbewertung für ein Tag zwischen 0 und 1.

Dieser eindeutige tagName wird verwendet, um die Parameter inclusionList und exclusionList zu filtern.
metadata Objekt Metadaten umfassen ein Objekt, das weitere Daten zum erkannten Entitätstyp enthält. Es ändert sich basierend auf dem Feld metadataKind.

Beispielausgabe

Diese Beispielausgabe enthält ein Beispiel der weiteren Ausgabeattribute.

{ 
    "kind": "EntityRecognitionResults", 
    "results": { 
        "documents": [ 
            { 
                "id": "1", 
                "entities": [ 
                    { 
                        "text": "Microsoft", 
                        "category": "Organization", 
                        "type": "Organization", 
                        "offset": 0, 
                        "length": 9, 
                        "confidenceScore": 0.97, 
                        "tags": [ 
                            { 
                                "name": "Organization", 
                                "confidenceScore": 0.97 
                            } 
                        ] 
                    }, 
                    { 
                        "text": "One", 
                        "category": "Quantity", 
                        "type": "Number", 
                        "subcategory": "Number", 
                        "offset": 21, 
                        "length": 3, 
                        "confidenceScore": 0.9, 
                        "tags": [ 
                            { 
                                "name": "Number", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Quantity", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Numeric", 
                                "confidenceScore": 0.8 
                            } 
                        ], 
                        "metadata": { 
                            "metadataKind": "NumberMetadata", 
                            "numberKind": "Integer", 
                            "value": 1.0 
                        } 
                    } 
                ], 
                "warnings": [] 
            } 
        ], 
        "errors": [], 
        "modelVersion": "2023-09-01" 
    } 
} 

Angeben des NER-Modells

Standardmäßig wendet dieses Feature das neueste verfügbare KI-Modell für Ihren Text an. Sie können Ihre API-Anforderungen auch für die Verwendung einer bestimmten Modellversion konfigurieren.

Grenzwerte für Dienste und Daten

Informationen zur Größe und Anzahl der Anforderungen, die Sie pro Minute und pro Sekunde senden können, finden Sie im Artikel Diensteinschränkungen.

Nächste Schritte

Erkennung benannter Entitäten (Übersicht)