Freigeben über


Benutzerdefinierte Kategorien (Vorschau)

Mit Azure KI Inhaltssicherheit können Sie eigene Inhaltsmoderationskategorien erstellen und verwalten, um eine verbesserte Moderation und Filterung zu ermöglichen, die Ihren spezifischen Richtlinien oder Anwendungsfällen entspricht.

Anpassungsmöglichkeiten

Es gibt mehrere Möglichkeiten zum Definieren und Verwenden von benutzerdefinierten Kategorien, die in diesem Abschnitt vorgestellt und verglichen werden.

API Funktionalität
API für benutzerdefinierte Kategorien (Standard) Verwenden Sie ein anpassbares Machine Learning-Modell, um eine benutzerdefinierte Kategorie zu erstellen, abzurufen, abzufragen und zu löschen. Oder listen Sie alle benutzerdefinierten Kategorien für weitere Anmerkungsaufgaben auf.
API für benutzerdefinierte Kategorien (Schnell) Verwenden Sie ein großes Sprachmodell (LLM), um schnell bestimmte Inhaltsmuster in neuen Inhaltsvorfällen zu erlernen.

API für benutzerdefinierte Kategorien (Standard)

Mit der API für benutzerdefinierte Kategorien (Standard) können Kund*innen Kategorien definieren, die für ihre Anforderungen spezifisch sind, Beispieldaten bereitstellen, ein benutzerdefiniertes Machine Learning-Modell trainieren und diese verwenden, um neue Inhalte gemäß den gelernten Kategorien zu klassifizieren.

Dies ist der Standardworkflow zum Anpassen mit Machine Learning-Modellen. Abhängig von der Qualität der Trainingsdaten kann ein solches Modell sehr gute Leistungsniveaus erreichen. Es kann jedoch bis zu mehrere Stunden dauern, um das Modell zu trainieren.

Diese Implementierung funktioniert bei Textinhalten, nicht bei Bildinhalten.

API für benutzerdefinierte Kategorien (schnell)

Die API für benutzerdefinierte Kategorien (Schnell) ist so konzipiert, dass sie schneller und flexibler als die Standardmethode ist. Sie soll zur Identifizierung, Analyse und Beseitigung von sowie der Wiederherstellung nach Cybervorfällen, die unangemessene oder schädliche Inhalte auf Onlineplattformen umfassen, eingesetzt werden.

Ein Incident kann eine Reihe von neuen Inhaltsmustern (Text, Bild oder anderen Modalitäten) umfassen, die gegen Microsoft-Communityrichtlinien oder die eigenen Richtlinien und Erwartungen der Kunden verstoßen. Diesen Incidents muss schnell und präzise entgegengewirkt werden, um potenzielle Probleme mit Livewebsites oder Schäden für Benutzer und Communitys zu vermeiden.

Diese Implementierung funktioniert für Textinhalte und Bildinhalte.

Tipp

Eine Möglichkeit zum Umgang mit neuen Inhaltsincidents besteht darin, Blocklisten zu verwenden. Diese ermöglichen jedoch nur exakten Textabgleich und keinen Bildabgleich. Die API für benutzerdefinierte Kategorien (Schnell) bietet die folgenden erweiterten Funktionen:

  • semantischer Textabgleich mithilfe der Einbettungssuche mit einem schlanken Klassifizierer
  • Bildabgleich mit einem schlanken Objektverfolgungsmodell und Einbettungssuche

Funktionsweise

Die Funktion für benutzerdefinierte Kategorien von Azure KI Inhaltssicherheit verwendet einen mehrstufigen Prozess zum Erstellen, Trainieren und Verwenden von benutzerdefinierten Inhaltsklassifizierungsmodellen. So sieht der Workflow aus:

Schritt 1: Definition und Einrichtung

Wenn Sie eine benutzerdefinierte Kategorie definieren, müssen Sie der KI vermitteln, welche Art von Inhalten Sie identifizieren möchten. Dies umfasst die Bereitstellung eines eindeutigen Kategorienamens und eine detaillierte Definition, die die Eigenschaften des Inhalts enthält.

Anschließend sammeln Sie ein ausgewogenes Dataset mit positiven und (optional) negativen Beispielen, um die KI dabei zu unterstützen, die Nuancen Ihrer Kategorie zu erlernen. Diese Daten sollten repräsentativ für die Vielfalt der Inhalte sein, die das Modell in einem realen Szenario findet.

Schritt 2: Modelltraining

Nachdem Sie Ihr Dataset vorbereitet und Kategorien definiert haben, trainiert der Azure KI Inhaltssicherheit-Dienst ein neues Machine Learning-Modell. Dieses Modell verwendet Ihre Definitionen und hochgeladenen Datasets, um eine Datenerweiterung mithilfe eines großen Sprachmodells durchzuführen. Dadurch wird das Trainingsdatenset größer und von höherer Qualität. Während des Trainings analysiert das KI-Modell die Daten und lernt, zwischen Inhalten zu unterscheiden, die mit der angegebenen Kategorie übereinstimmen und Inhalten, ihr die nicht entsprechen.

Schritt 3: Modellrückschluss

Nach dem Training müssen Sie das Modell auswerten, um sicherzustellen, dass es Ihre Genauigkeitsanforderungen erfüllt. Testen Sie das Modell mit neuen Inhalten, die es noch nicht kennt. In der Bewertungsphase können Sie ermitteln, welche Anpassungen Sie möglicherweise vornehmen müssen, um das Modell in einer Produktionsumgebung einzusetzen.

Schritt 4: Modellverwendung

Sie verwenden die analyzeCustomCategory-API, um Textinhalte zu analysieren und zu bestimmen, ob sie der von Ihnen definierten benutzerdefinierten Kategorie entsprechen. Der Dienst gibt einen Booleschen Wert zurück, der angibt, ob der Inhalt zur angegebenen Kategorie passt.

Begrenzungen

Verfügbarkeit der Sprache

Die APIs für benutzerdefinierte Kategorien unterstützen alle Sprachen, die von der Inhaltssicherheitstextmoderation unterstützt werden. Informationen hierzu finden Sie unter Sprach- und Stimmunterstützung für den Speech-Dienst.

Eingabebeschränkungen

In der folgenden Tabelle finden Sie die Eingabebeschränkungen der API für benutzerdefinierte Kategorien (Schnell):

Objekt Einschränkung
Unterstützte Sprachen Nur auf Englisch
Anzahl der Kategorien pro Benutzer*in 3
Anzahl der Versionen pro Kategorie 3
Anzahl gleichzeitiger Builds (Prozesse) pro Kategorie 1
Rückschlussvorgänge pro Sekunde 5
Anzahl der Beispiele in einer Kategorieversion Positivbeispiele (erforderlich): mindestens 50, maximal 5.000
Insgesamt (sowohl Negativ- als auch Positivbeispiele): 10.000
Es sind keine duplizierten Beispiele zulässig.
Beispieldateigröße maximal 128.000 Byte
Länge eines Textbeispiels maximal 125.000 Zeichen
Länge einer Kategoriedefinition maximal 1.000 Zeichen
Länge eines Kategorienamens maximal 128 Zeichen
Länge einer Blob-URL maximal 500 Zeichen