Stratégies de sécurité du contenu par défaut de l’inférence de modèle Azure AI

Article
01/29/2025

L’inférence de modèle Azure AI inclut une sécurité par défaut appliquée à tous les modèles, à l’exclusion d’Azure OpenAI Whisper. Ces configurations vous offrent une expérience responsable par défaut.

La sécurité par défaut vise à atténuer les risques tels que ceux liés à la haine et l’impartialité, la sexualité, la violence, l’automutilation, au contenu matériel protégé, ainsi que les attaques par injection d’invite utilisateur. Pour en savoir plus sur le filtrage de contenu, lisez notre documentation décrivant les catégories et les niveaux de gravité.

Ce document décrit la configuration par défaut.

Conseil

Par défaut, tous les modèles de déploiements utilisent la configuration par défaut. Toutefois, vous pouvez configurer le filtrage de contenu par modèle de déploiement comme expliqué dans Configuration du filtrage de contenu.

Modèles de texte

Les modèles de texte dans l’inférence de modèle Azure AI peuvent accepter et générer du texte et du code. Ces modèles appliquent les modèles de filtrage de contenu de texte d’Azure pour détecter et empêcher un contenu dangereux. Ce système fonctionne à la fois sur les prompts et l’achèvement.

Catégorie de risque	Invite/Complétion	Seuil de gravité
Haine et équité	Prompts et achèvements	Moyenne
Violence	Prompts et achèvements	Moyenne
Sexuel	Prompts et achèvements	Moyenne
Automutilation	Prompts et achèvements	Moyenne
Attaque par injection de prompts utilisateur (Jailbreak)	Invites	S/O
Matériel protégé – Texte	Saisies semi-automatiques	S/O
Matériel protégé – Code	Saisies semi-automatiques	N/A

Vision et conversation avec des modèles de vision

Les modèles de vision peuvent accepter en entrée du texte et des images en même temps. Les fonctionnalités de filtrage de contenu par défaut varient par modèle et fournisseur.

Azure OpenAI : GPT-4o et GPT-4 Turbo

Catégorie de risque	Invite/Complétion	Seuil de gravité
Haine et équité	Prompts et achèvements	Moyenne
Violence	Prompts et achèvements	Moyenne
Sexuel	Prompts et achèvements	Moyenne
Automutilation	Prompts et achèvements	Moyenne
Identification des individus et inférence d’attributs sensibles	Invites	S/O
Attaque par injection de prompts utilisateur (Jailbreak)	Invites	N/A

Azure OpenAI : DALL-E 3 et DALL-E 2

Catégorie de risque	Invite/Complétion	Seuil de gravité
Haine et équité	Prompts et achèvements	Bas
Violence	Prompts et achèvements	Bas
Sexuel	Prompts et achèvements	Bas
Automutilation	Prompts et achèvements	Bas
Informations d’identification du contenu	Saisies semi-automatiques	S/O
Génération trompeuse de candidats politiques	Invites	S/O
Représentations de figures publiques	Invites	S/O
Attaque par injection de prompts utilisateur (Jailbreak)	Invites	S/O
Matériel protégé – Caractères d’art et de studio	Invites	S/O
Des propos injurieux	Invites	N/A

Outre les configurations de sécurité précédentes, Azure OpenAI DALL-E est également fourni avec une transformation d’invite par défaut. Cette transformation se produit sur tous les prompts pour améliorer la sécurité de votre prompt d’origine, en particulier dans les catégories de risques de diversité, de génération trompeuse de candidats politiques, de représentations de figures publiques, de matériel protégé et autres.

Meta : Llama-3.2-11B-Vision-Instruct et Llama-3.2-90B-Vision-Instruct

Les filtres de contenu s’appliquent uniquement aux invites de texte et aux complétions. Les images ne sont pas soumises à une modération du contenu.

Microsoft : Phi-3.5-vision-instruct

Les filtres de contenu s’appliquent uniquement aux invites de texte et aux complétions. Les images ne sont pas soumises à une modération du contenu.

Étapes suivantes

Configurer des filtres de contenu dans l’inférence de modèle Azure AI

Partage via