Freigeben über


Standardrichtlinien für die Inhaltssicherheit

Azure OpenAI Service enthält Standardsicherheitsrichtlinien, die auf alle Modelle angewendet werden, mit Ausnahme von Azure OpenAI Whisper. Diese Konfigurationen bieten Ihnen standardmäßig eine verantwortungsvolle Umgebung, die Inhaltsfiltermodelle, Blockierlisten, Prompttransformation, Inhaltsanmeldeinformationen und mehr enthält.

Die Standardsicherheitsrichtlinien zielen darauf ab, Risiken verschiedener Kategorien wie Hass und Fairness, sexuelle, Inhalte, Gewalt, Selbstverletzungen, geschützte Materialinhalte und Einschleusungsangriffe durch Benutzerprompts zu mindern. Weitere Informationen zur Inhaltsfilterung finden Sie in unserer Dokumentation, in der Kategorien und Schweregraden beschrieben werden.

Alle Sicherheitsrichtlinien sind konfigurierbar. Weitere Informationen zur Konfigurierbarkeit finden Sie in unserer Dokumentation zum Konfigurieren der Inhaltsfilterung.

Textmodelle

Textmodelle in Azure OpenAI Service können sowohl Text als auch Code erfassen und generieren. Diese Modelle nutzen die Textinhaltsfilter von Azure, um schädliche Inhalte zu erkennen und zu vermeiden. Dieses System funktioniert sowohl bei Prompts als auch bei Vervollständigungen.

Risikokategorie Eingabeaufforderung/Abschluss Schwellenwert für den Schweregrad
Hass und Fairness Prompts und Vervollständigungen Medium
Gewalt Prompts und Vervollständigungen Medium
Sexuell Prompts und Vervollständigungen Medium
Selbstverletzung Prompts und Vervollständigungen Medium
Einschleusungsangriff durch Benutzerprompts (Jailbreak) Eingabeaufforderungen N/V
Geschütztes Material – Text Vervollständigungen N/V
Geschütztes Material – Code Vervollständigungen N/V

Vision-Modelle

Vision-fähige Chatmodelle

Risikokategorie Eingabeaufforderung/Abschluss Schwellenwert für den Schweregrad
Hass und Fairness Prompts und Vervollständigungen Medium
Gewalt Prompts und Vervollständigungen Medium
Sexuell Prompts und Vervollständigungen Medium
Selbstverletzung Prompts und Vervollständigungen Medium
Identifizierung von Einzelpersonen und Rückschlüsse vertraulicher Attribute Eingabeaufforderungen N/V
Einschleusungsangriff durch Benutzerprompts (Jailbreak) Eingabeaufforderungen N/V

Bildgenerierungsmodelle

Risikokategorie Eingabeaufforderung/Abschluss Schwellenwert für den Schweregrad
Hass und Fairness Prompts und Vervollständigungen Niedrig
Gewalt Prompts und Vervollständigungen Niedrig
Sexuell Prompts und Vervollständigungen Niedrig
Selbstverletzung Prompts und Vervollständigungen Niedrig
Inhaltsnachweise Vervollständigungen N/V
Täuschendes Generieren politischer Kandidaten Eingabeaufforderungen N/V
Darstellungen von Personen des öffentlichen Lebens Eingabeaufforderungen N/V
Einschleusungsangriff durch Benutzerprompts (Jailbreak) Eingabeaufforderungen N/V
Geschütztes Material – Kunst und Studio-Charaktere Eingabeaufforderungen N/V
Anstößige Ausdrücke Eingabeaufforderungen N/V

Zusätzlich zu den oben genannten Sicherheitskonfigurationen bietet Azure OpenAI DALL-E standardmäßig auch die Prompttransformation. Diese Transformation wird für alle Prompts durchgeführt, um die Sicherheit Ihrer ursprünglichen Prompts zu verbessern, insbesondere in den Risikokategorien Vielfalt, täuschendes Generieren politischer Kandidaten, Darstellungen von Personen des öffentlichen Lebens, geschützte Materialien und andere.