Erkennen und Redigieren personenbezogener Informationen (PII) in Unterhaltungen
Das Gesprächs-PII-Feature kann Unterhaltungen auswerten, um vertrauliche Informationen (PII) aus den Inhalten in mehrere vordefinierte Kategorien zu extrahieren und sie zu redigieren. Diese API funktioniert sowohl für transkribierten Text, auf den in Form von Transkripten verwiesen wird, als auch für Chats. Für Transkripte ermöglicht die API auch das Redigieren von Audiosegmenten, die PII enthalten, indem sie die Informationen zur Dauer dieser Audiosegmente bereitstellen.
Festlegen der Art der Datenverarbeitung (optional)
Angeben des PII-Erkennungsmodells
Standardmäßig verwendet dieses Feature das neueste verfügbare KI-Modell für Ihre Eingabe. Sie können Ihre API-Anforderungen auch für die Verwendung einer bestimmten Modellversion konfigurieren.
Sprachunterstützung
Weitere Details finden Sie auf der Seite zur PII-Sprachunterstützung. Derzeit unterstützt das allgemein verfügbare PII-Modell für Konversationen nur die englische Sprache. Das Vorschaumodell und die API unterstützen die gleichen Listensprachen wie die anderen Sprachdienste.
Unterstützung für Regionen
Die PII-API für Konversationen unterstützt alle Azure-Regionen, die vom Sprachdienst unterstützt werden.
Übermitteln der Daten
Hinweis
Informationen zum Formatieren von Konversationstext, der mit Language Studio übermittelt werden soll, finden Sie im Artikel zu Language Studio.
Sie können die Eingabe als Liste von Unterhaltungselementen an die API übermitteln. Die Analyse erfolgt, wenn die Anforderung eingeht. Da es sich um eine asynchrone API handelt, kann es zu einer Verzögerung zwischen dem Senden einer API-Anforderung und dem Erhalt der Ergebnisse kommen. Informationen zur Größe und Anzahl von Anforderungen, die Sie pro Minute und Sekunde senden können, finden Sie in den nachstehend aufgeführten Datengrenzwerten.
Wenn Sie das asynchrone Feature verwenden, sind die API-Ergebnisse ab Erfassen der Anforderung wie in der Antwort angegeben 24 Stunden lang verfügbar. Nach diesem Zeitraum werden die Ergebnisse endgültig gelöscht und stehen nicht mehr zum Abruf zur Verfügung.
Wenn Sie Daten an die Unterhaltungs-PII übermitteln, kann eine Unterhaltung (Chat oder gesprochen) pro Anforderung gesendet werden.
Die API versucht, alle definierten Entitätskategorien für eine bestimmte Unterhaltungseingabe zu erkennen. Wenn Sie angeben möchten, welche Entitäten erkannt und zurückgegeben werden sollen, verwenden Sie den optionalen Parameter piiCategories
mit den entsprechenden Entitätskategorien.
Bei gesprochenen Transkripten werden die erkannten Entitäten im angegebenen redactionSource
-Parameterwert zurückgegeben. Derzeit lauten die für redactionSource
unterstützten Werte text
, lexical
, itn
und maskedItn
(die den Formaten display
\displayText
, lexical
, itn
und maskedItn
der Spracherkennungs-REST-API entsprechen). Darüber hinaus stellt diese API für die gesprochene Transkripteingabe auch Informationen zur Audiodauer bereit, um das Maskieren von Audios zu ermöglichen. Verwenden Sie das optionale includeAudioRedaction
-Flag mit dem Wert true
, um das Feature „audioRedaction“ zu nutzen. Das Redigieren des Audios wird auf der Basis des lexikalischen Eingabeformats durchgeführt.
Hinweis
Unterhaltung mit personenbezogenen Informationen unterstützt jetzt 40.000 Zeichen als Dokumentgröße.
Abrufen von PII-Ergebnissen
Wenn Sie Ergebnisse von der PII-Erkennung erhalten, können Sie diese an eine App streamen oder die Ausgabe in einer Datei im lokalen System speichern. Die API-Antwort enthält erkannte Entitäten, einschließlich ihrer Kategorien und Unterkategorien sowie Konfidenzbewertungen. Die Textzeichenfolge mit den maskierten PII-Entitäten wird ebenfalls zurückgegeben.
Beispiele
Navigieren Sie im Azure-Portal zur Übersichtsseite Ihrer Ressource.
Wählen Sie im Menü auf der linken Seite Schlüssel und Endpunkt aus. Sie benötigen einen der Schlüssel und den Endpunkt, um Ihre API-Anforderungen zu authentifizieren.
Laden Sie das Clientbibliothekspaket für die Sprache Ihrer Wahl herunter, und installieren Sie es:
Sprache Paketversion .NET 1.0.0 Python 1.0.0 Weitere Informationen zum Client und zum Rückgabeobjekt finden Sie in der folgenden Referenzdokumentation:
Grenzwerte für Dienste und Daten
Informationen zur Größe und Anzahl der Anforderungen, die Sie pro Minute und pro Sekunde senden können, finden Sie im Artikel Diensteinschränkungen.