Stratégies de sécurité du contenu par défaut de l’inférence de modèle Azure AI
L’inférence de modèle Azure AI inclut une sécurité par défaut appliquée à tous les modèles, à l’exclusion d’Azure OpenAI Whisper. Ces configurations vous offrent une expérience responsable par défaut.
La sécurité par défaut vise à atténuer les risques tels que ceux liés à la haine et l’impartialité, la sexualité, la violence, l’automutilation, au contenu matériel protégé, ainsi que les attaques par injection d’invite utilisateur. Pour en savoir plus sur le filtrage de contenu, lisez notre documentation décrivant les catégories et les niveaux de gravité.
Ce document décrit la configuration par défaut.
Conseil
Par défaut, tous les modèles de déploiements utilisent la configuration par défaut. Toutefois, vous pouvez configurer le filtrage de contenu par modèle de déploiement comme expliqué dans Configuration du filtrage de contenu.
Modèles de texte
Les modèles de texte dans l’inférence de modèle Azure AI peuvent accepter et générer du texte et du code. Ces modèles appliquent les modèles de filtrage de contenu de texte d’Azure pour détecter et empêcher un contenu dangereux. Ce système fonctionne à la fois sur les prompts et l’achèvement.
Catégorie de risque | Invite/Complétion | Seuil de gravité |
---|---|---|
Haine et équité | Prompts et achèvements | Moyenne |
Violence | Prompts et achèvements | Moyenne |
Sexuel | Prompts et achèvements | Moyenne |
Automutilation | Prompts et achèvements | Moyenne |
Attaque par injection de prompts utilisateur (Jailbreak) | Invites | S/O |
Matériel protégé – Texte | Saisies semi-automatiques | S/O |
Matériel protégé – Code | Saisies semi-automatiques | N/A |
Vision et conversation avec des modèles de vision
Les modèles de vision peuvent accepter en entrée du texte et des images en même temps. Les fonctionnalités de filtrage de contenu par défaut varient par modèle et fournisseur.
Azure OpenAI : GPT-4o et GPT-4 Turbo
Catégorie de risque | Invite/Complétion | Seuil de gravité |
---|---|---|
Haine et équité | Prompts et achèvements | Moyenne |
Violence | Prompts et achèvements | Moyenne |
Sexuel | Prompts et achèvements | Moyenne |
Automutilation | Prompts et achèvements | Moyenne |
Identification des individus et inférence d’attributs sensibles | Invites | S/O |
Attaque par injection de prompts utilisateur (Jailbreak) | Invites | N/A |
Azure OpenAI : DALL-E 3 et DALL-E 2
Catégorie de risque | Invite/Complétion | Seuil de gravité |
---|---|---|
Haine et équité | Prompts et achèvements | Bas |
Violence | Prompts et achèvements | Bas |
Sexuel | Prompts et achèvements | Bas |
Automutilation | Prompts et achèvements | Bas |
Informations d’identification du contenu | Saisies semi-automatiques | S/O |
Génération trompeuse de candidats politiques | Invites | S/O |
Représentations de figures publiques | Invites | S/O |
Attaque par injection de prompts utilisateur (Jailbreak) | Invites | S/O |
Matériel protégé – Caractères d’art et de studio | Invites | S/O |
Des propos injurieux | Invites | N/A |
Outre les configurations de sécurité précédentes, Azure OpenAI DALL-E est également fourni avec une transformation d’invite par défaut. Cette transformation se produit sur tous les prompts pour améliorer la sécurité de votre prompt d’origine, en particulier dans les catégories de risques de diversité, de génération trompeuse de candidats politiques, de représentations de figures publiques, de matériel protégé et autres.
Meta : Llama-3.2-11B-Vision-Instruct et Llama-3.2-90B-Vision-Instruct
Les filtres de contenu s’appliquent uniquement aux invites de texte et aux complétions. Les images ne sont pas soumises à une modération du contenu.
Microsoft : Phi-3.5-vision-instruct
Les filtres de contenu s’appliquent uniquement aux invites de texte et aux complétions. Les images ne sont pas soumises à une modération du contenu.