Standardrichtlinien für die Inhaltssicherheit
Azure OpenAI Service enthält Standardsicherheitsrichtlinien, die auf alle Modelle angewendet werden, mit Ausnahme von Azure OpenAI Whisper. Diese Konfigurationen bieten Ihnen standardmäßig eine verantwortungsvolle Umgebung, die Inhaltsfiltermodelle, Blockierlisten, Prompttransformation, Inhaltsanmeldeinformationen und mehr enthält.
Die Standardsicherheitsrichtlinien zielen darauf ab, Risiken verschiedener Kategorien wie Hass und Fairness, sexuelle, Inhalte, Gewalt, Selbstverletzungen, geschützte Materialinhalte und Einschleusungsangriffe durch Benutzerprompts zu mindern. Weitere Informationen zur Inhaltsfilterung finden Sie in unserer Dokumentation, in der Kategorien und Schweregraden beschrieben werden.
Alle Sicherheitsrichtlinien sind konfigurierbar. Weitere Informationen zur Konfigurierbarkeit finden Sie in unserer Dokumentation zum Konfigurieren der Inhaltsfilterung.
Textmodelle
Textmodelle in Azure OpenAI Service können sowohl Text als auch Code erfassen und generieren. Diese Modelle nutzen die Textinhaltsfilter von Azure, um schädliche Inhalte zu erkennen und zu vermeiden. Dieses System funktioniert sowohl bei Prompts als auch bei Vervollständigungen.
Risikokategorie | Eingabeaufforderung/Abschluss | Schwellenwert für den Schweregrad |
---|---|---|
Hass und Fairness | Prompts und Vervollständigungen | Medium |
Gewalt | Prompts und Vervollständigungen | Medium |
Sexuell | Prompts und Vervollständigungen | Medium |
Selbstverletzung | Prompts und Vervollständigungen | Medium |
Einschleusungsangriff durch Benutzerprompts (Jailbreak) | Eingabeaufforderungen | N/V |
Geschütztes Material – Text | Vervollständigungen | N/V |
Geschütztes Material – Code | Vervollständigungen | N/V |
Vision-Modelle
Vision-fähige Chatmodelle
Risikokategorie | Eingabeaufforderung/Abschluss | Schwellenwert für den Schweregrad |
---|---|---|
Hass und Fairness | Prompts und Vervollständigungen | Medium |
Gewalt | Prompts und Vervollständigungen | Medium |
Sexuell | Prompts und Vervollständigungen | Medium |
Selbstverletzung | Prompts und Vervollständigungen | Medium |
Identifizierung von Einzelpersonen und Rückschlüsse vertraulicher Attribute | Eingabeaufforderungen | N/V |
Einschleusungsangriff durch Benutzerprompts (Jailbreak) | Eingabeaufforderungen | N/V |
Bildgenerierungsmodelle
Risikokategorie | Eingabeaufforderung/Abschluss | Schwellenwert für den Schweregrad |
---|---|---|
Hass und Fairness | Prompts und Vervollständigungen | Niedrig |
Gewalt | Prompts und Vervollständigungen | Niedrig |
Sexuell | Prompts und Vervollständigungen | Niedrig |
Selbstverletzung | Prompts und Vervollständigungen | Niedrig |
Inhaltsnachweise | Vervollständigungen | N/V |
Täuschendes Generieren politischer Kandidaten | Eingabeaufforderungen | N/V |
Darstellungen von Personen des öffentlichen Lebens | Eingabeaufforderungen | N/V |
Einschleusungsangriff durch Benutzerprompts (Jailbreak) | Eingabeaufforderungen | N/V |
Geschütztes Material – Kunst und Studio-Charaktere | Eingabeaufforderungen | N/V |
Anstößige Ausdrücke | Eingabeaufforderungen | N/V |
Zusätzlich zu den oben genannten Sicherheitskonfigurationen bietet Azure OpenAI DALL-E standardmäßig auch die Prompttransformation. Diese Transformation wird für alle Prompts durchgeführt, um die Sicherheit Ihrer ursprünglichen Prompts zu verbessern, insbesondere in den Risikokategorien Vielfalt, täuschendes Generieren politischer Kandidaten, Darstellungen von Personen des öffentlichen Lebens, geschützte Materialien und andere.