Stratégies de sécurité du contenu par défaut
Azure OpenAI Service inclut la sécurité par défaut appliquée à tous les modèles, à l’exclusion d’Azure OpenAI Whisper. Ces configurations vous offrent une expérience responsable par défaut, notamment les modèles de filtrage de contenu, les listes de blocage, la transformation de prompts, les informations d’identification de contenu et autres.
La sécurité par défaut vise à atténuer les risques tels que la haine et l’impartialité, la sexualité, la violence, l’automutilation, le contenu matériel protégé et les attaques par injection de prompts utilisateur. Pour en savoir plus sur le filtrage de contenu, consultez notre documentation décrivant les catégories et les niveaux de gravité, ici.
Toute la sécurité est configurable. Pour en savoir plus sur la configuration, consultez notre documentation sur la configuration du filtrage de contenu.
Modèles texte : GPT-4, GPT-3.5
Les modèles de texte dans Azure OpenAI Service peuvent accepter et générer du texte et du code. Ces modèles tirent parti des modèles de filtrage de contenu texte d’Azure pour détecter et bloquer le contenu dangereux. Ce système fonctionne à la fois sur les prompts et l’achèvement.
Catégorie de risque | Invite/Complétion | Seuil de gravité |
---|---|---|
Haine et équité | Prompts et achèvements | Moyenne |
Violence | Prompts et achèvements | Moyenne |
Sexuel | Prompts et achèvements | Moyenne |
Automutilation | Prompts et achèvements | Moyenne |
Attaque par injection de prompts utilisateur (Jailbreak) | Invites | S/O |
Matériel protégé – Texte | Saisies semi-automatiques | S/O |
Matériel protégé – Code | Saisies semi-automatiques | S/O |
Modèles Vision : GPT-4o, GPT-4 Turbo, DALL-E 3, DALL-E 2
GPT-4o et GPT-4 Turbo
Catégorie de risque | Invite/Complétion | Seuil de gravité |
---|---|---|
Haine et équité | Prompts et achèvements | Moyenne |
Violence | Prompts et achèvements | Moyenne |
Sexuel | Prompts et achèvements | Moyenne |
Automutilation | Prompts et achèvements | Moyenne |
Identification des individus et inférence d’attributs sensibles | Invites | S/O |
Attaque par injection de prompts utilisateur (Jailbreak) | Invites | S/O |
DALL-E 3 et DALL-E 2
Catégorie de risque | Invite/Complétion | Seuil de gravité |
---|---|---|
Haine et équité | Prompts et achèvements | Bas |
Violence | Prompts et achèvements | Bas |
Sexuel | Prompts et achèvements | Bas |
Automutilation | Prompts et achèvements | Bas |
Informations d’identification du contenu | Saisies semi-automatiques | S/O |
Génération trompeuse de candidats politiques | Invites | S/O |
Représentations de figures publiques | Invites | S/O |
Attaque par injection de prompts utilisateur (Jailbreak) | Invites | S/O |
Matériel protégé – Caractères d’art et de studio | Invites | S/O |
Des propos injurieux | Invites | S/O |
Outre les configurations de sécurité ci-dessus, Azure OpenAI DALL-E est également fourni avec la transformation de prompt par défaut. Cette transformation se produit sur tous les prompts pour améliorer la sécurité de votre prompt d’origine, en particulier dans les catégories de risques de diversité, de génération trompeuse de candidats politiques, de représentations de figures publiques, de matériel protégé et autres.