Standardrichtlinien für die Inhaltssicherheit

Artikel
03/03/2025

Azure OpenAI Service enthält Standardsicherheitsrichtlinien, die auf alle Modelle angewendet werden, mit Ausnahme von Azure OpenAI Whisper. Diese Konfigurationen bieten Ihnen standardmäßig eine verantwortungsvolle Umgebung, die Inhaltsfiltermodelle, Blockierlisten, Prompttransformation, Inhaltsanmeldeinformationen und mehr enthält.

Die Standardsicherheitsrichtlinien zielen darauf ab, Risiken verschiedener Kategorien wie Hass und Fairness, sexuelle, Inhalte, Gewalt, Selbstverletzungen, geschützte Materialinhalte und Einschleusungsangriffe durch Benutzerprompts zu mindern. Weitere Informationen zur Inhaltsfilterung finden Sie in unserer Dokumentation, in der Kategorien und Schweregraden beschrieben werden.

Alle Sicherheitsrichtlinien sind konfigurierbar. Weitere Informationen zur Konfigurierbarkeit finden Sie in unserer Dokumentation zum Konfigurieren der Inhaltsfilterung.

Textmodelle

Textmodelle in Azure OpenAI Service können sowohl Text als auch Code erfassen und generieren. Diese Modelle nutzen die Textinhaltsfilter von Azure, um schädliche Inhalte zu erkennen und zu vermeiden. Dieses System funktioniert sowohl bei Prompts als auch bei Vervollständigungen.

Risikokategorie	Eingabeaufforderung/Abschluss	Schwellenwert für den Schweregrad
Hass und Fairness	Prompts und Vervollständigungen	Medium
Gewalt	Prompts und Vervollständigungen	Medium
Sexuell	Prompts und Vervollständigungen	Medium
Selbstverletzung	Prompts und Vervollständigungen	Medium
Einschleusungsangriff durch Benutzerprompts (Jailbreak)	Eingabeaufforderungen	N/V
Geschütztes Material – Text	Vervollständigungen	N/V
Geschütztes Material – Code	Vervollständigungen	N/V

Vision-Modelle

Vision-fähige Chatmodelle

Risikokategorie	Eingabeaufforderung/Abschluss	Schwellenwert für den Schweregrad
Hass und Fairness	Prompts und Vervollständigungen	Medium
Gewalt	Prompts und Vervollständigungen	Medium
Sexuell	Prompts und Vervollständigungen	Medium
Selbstverletzung	Prompts und Vervollständigungen	Medium
Identifizierung von Einzelpersonen und Rückschlüsse vertraulicher Attribute	Eingabeaufforderungen	N/V
Einschleusungsangriff durch Benutzerprompts (Jailbreak)	Eingabeaufforderungen	N/V

Bildgenerierungsmodelle

Risikokategorie	Eingabeaufforderung/Abschluss	Schwellenwert für den Schweregrad
Hass und Fairness	Prompts und Vervollständigungen	Niedrig
Gewalt	Prompts und Vervollständigungen	Niedrig
Sexuell	Prompts und Vervollständigungen	Niedrig
Selbstverletzung	Prompts und Vervollständigungen	Niedrig
Inhaltsnachweise	Vervollständigungen	N/V
Täuschendes Generieren politischer Kandidaten	Eingabeaufforderungen	N/V
Darstellungen von Personen des öffentlichen Lebens	Eingabeaufforderungen	N/V
Einschleusungsangriff durch Benutzerprompts (Jailbreak)	Eingabeaufforderungen	N/V
Geschütztes Material – Kunst und Studio-Charaktere	Eingabeaufforderungen	N/V
Anstößige Ausdrücke	Eingabeaufforderungen	N/V

Zusätzlich zu den oben genannten Sicherheitskonfigurationen bietet Azure OpenAI DALL-E standardmäßig auch die Prompttransformation. Diese Transformation wird für alle Prompts durchgeführt, um die Sicherheit Ihrer ursprünglichen Prompts zu verbessern, insbesondere in den Risikokategorien Vielfalt, täuschendes Generieren politischer Kandidaten, Darstellungen von Personen des öffentlichen Lebens, geschützte Materialien und andere.

Freigeben über

Standardrichtlinien für die Inhaltssicherheit

Textmodelle

Vision-Modelle

Vision-fähige Chatmodelle

Bildgenerierungsmodelle

Feedback

Zusätzliche Ressourcen