Partage via


Stratégies de sécurité du contenu par défaut de l’inférence de modèle Azure AI

L’inférence de modèle Azure AI inclut une sécurité par défaut appliquée à tous les modèles, à l’exclusion d’Azure OpenAI Whisper. Ces configurations vous offrent une expérience responsable par défaut.

La sécurité par défaut vise à atténuer les risques tels que ceux liés à la haine et l’impartialité, la sexualité, la violence, l’automutilation, au contenu matériel protégé, ainsi que les attaques par injection d’invite utilisateur. Pour en savoir plus sur le filtrage de contenu, lisez notre documentation décrivant les catégories et les niveaux de gravité.

Ce document décrit la configuration par défaut.

Conseil

Par défaut, tous les modèles de déploiements utilisent la configuration par défaut. Toutefois, vous pouvez configurer le filtrage de contenu par modèle de déploiement comme expliqué dans Configuration du filtrage de contenu.

Modèles de texte

Les modèles de texte dans l’inférence de modèle Azure AI peuvent accepter et générer du texte et du code. Ces modèles appliquent les modèles de filtrage de contenu de texte d’Azure pour détecter et empêcher un contenu dangereux. Ce système fonctionne à la fois sur les prompts et l’achèvement.

Catégorie de risque Invite/Complétion Seuil de gravité
Haine et équité Prompts et achèvements Moyenne
Violence Prompts et achèvements Moyenne
Sexuel Prompts et achèvements Moyenne
Automutilation Prompts et achèvements Moyenne
Attaque par injection de prompts utilisateur (Jailbreak) Invites S/O
Matériel protégé – Texte Saisies semi-automatiques S/O
Matériel protégé – Code Saisies semi-automatiques N/A

Vision et conversation avec des modèles de vision

Les modèles de vision peuvent accepter en entrée du texte et des images en même temps. Les fonctionnalités de filtrage de contenu par défaut varient par modèle et fournisseur.

Azure OpenAI : GPT-4o et GPT-4 Turbo

Catégorie de risque Invite/Complétion Seuil de gravité
Haine et équité Prompts et achèvements Moyenne
Violence Prompts et achèvements Moyenne
Sexuel Prompts et achèvements Moyenne
Automutilation Prompts et achèvements Moyenne
Identification des individus et inférence d’attributs sensibles Invites S/O
Attaque par injection de prompts utilisateur (Jailbreak) Invites N/A

Azure OpenAI : DALL-E 3 et DALL-E 2

Catégorie de risque Invite/Complétion Seuil de gravité
Haine et équité Prompts et achèvements Bas
Violence Prompts et achèvements Bas
Sexuel Prompts et achèvements Bas
Automutilation Prompts et achèvements Bas
Informations d’identification du contenu Saisies semi-automatiques S/O
Génération trompeuse de candidats politiques Invites S/O
Représentations de figures publiques Invites S/O
Attaque par injection de prompts utilisateur (Jailbreak) Invites S/O
Matériel protégé – Caractères d’art et de studio Invites S/O
Des propos injurieux Invites N/A

Outre les configurations de sécurité précédentes, Azure OpenAI DALL-E est également fourni avec une transformation d’invite par défaut. Cette transformation se produit sur tous les prompts pour améliorer la sécurité de votre prompt d’origine, en particulier dans les catégories de risques de diversité, de génération trompeuse de candidats politiques, de représentations de figures publiques, de matériel protégé et autres.

Meta : Llama-3.2-11B-Vision-Instruct et Llama-3.2-90B-Vision-Instruct

Les filtres de contenu s’appliquent uniquement aux invites de texte et aux complétions. Les images ne sont pas soumises à une modération du contenu.

Microsoft : Phi-3.5-vision-instruct

Les filtres de contenu s’appliquent uniquement aux invites de texte et aux complétions. Les images ne sont pas soumises à une modération du contenu.

Étapes suivantes