Stratégies de sécurité du contenu par défaut

Article
03/03/2025

Azure OpenAI Service intègre des stratégies de sécurité par défaut appliqués à tous les modèles, à l’exception d’Azure OpenAI Whisper. Ces configurations vous offrent une expérience responsable par défaut, notamment les modèles de filtrage de contenu, les listes de blocage, la transformation de prompts, les informations d’identification de contenu et autres.

La sécurité par défaut vise à atténuer les risques dans différentes catégories tels que ceux liés à la haine et l’impartialité, la sexualité, la violence, l’automutilation, au contenu matériel protégé, ainsi que les attaques par injection d’invite utilisateur. Pour en savoir plus sur le filtrage de contenu, consultez notre documentation décrivant les catégories et les niveaux de gravité.

Toutes les stratégies de sécurité sont configurables. Pour en savoir plus sur la configuration, consultez notre documentation sur la configuration du filtrage de contenu.

Modèles de texte

Les modèles de texte dans Azure OpenAI Service peuvent accepter et générer du texte et du code. Ces modèles tirent parti des modèles de filtrage de contenu texte d’Azure pour détecter et bloquer le contenu dangereux. Ce système fonctionne à la fois sur les invites et l’achèvement.

Catégorie de risque	Invite/Complétion	Seuil de gravité
Haine et équité	Prompts et achèvements	Moyenne
Violence	Prompts et achèvements	Moyenne
Sexuel	Prompts et achèvements	Moyenne
Automutilation	Prompts et achèvements	Moyenne
Attaque par injection de prompts utilisateur (Jailbreak)	Invites	S/O
Matériel protégé – Texte	Saisies semi-automatiques	S/O
Matériel protégé – Code	Saisies semi-automatiques	N/A

Modèles Vision

Modèles de conversation compatibles avec Vision

Catégorie de risque	Invite/Complétion	Seuil de gravité
Haine et équité	Prompts et achèvements	Moyenne
Violence	Prompts et achèvements	Moyenne
Sexuel	Prompts et achèvements	Moyenne
Automutilation	Prompts et achèvements	Moyenne
Identification des individus et inférence d’attributs sensibles	Invites	S/O
Attaque par injection de prompts utilisateur (Jailbreak)	Invites	N/A

Modèle de génération d’images

Catégorie de risque	Invite/Complétion	Seuil de gravité
Haine et équité	Prompts et achèvements	Bas
Violence	Prompts et achèvements	Bas
Sexuel	Prompts et achèvements	Bas
Automutilation	Prompts et achèvements	Bas
Informations d’identification du contenu	Saisies semi-automatiques	S/O
Génération trompeuse de candidats politiques	Invites	S/O
Représentations de figures publiques	Invites	S/O
Attaque par injection de prompts utilisateur (Jailbreak)	Invites	S/O
Matériel protégé – Caractères d’art et de studio	Invites	S/O
Des propos injurieux	Invites	S/O

Outre les configurations de sécurité ci-dessus, Azure OpenAI DALL-E est également fourni avec la transformation de prompt par défaut. Cette transformation se produit sur tous les prompts pour améliorer la sécurité de votre prompt d’origine, en particulier dans les catégories de risques de diversité, de génération trompeuse de candidats politiques, de représentations de figures publiques, de matériel protégé et autres.

Partager via

Stratégies de sécurité du contenu par défaut

Modèles de texte

Modèles Vision

Modèles de conversation compatibles avec Vision

Modèle de génération d’images

Commentaires

Ressources supplémentaires