你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 模型推理的默认内容安全策略
Azure AI 模型推理包括应用于所有模型的默认安全性,不包括 Azure OpenAI Whisper。 默认情况下,这些配置会提供负责任的体验。
默认安全性旨在缓解仇恨和公平、性、暴力、自我伤害、受保护材料内容和用户提示注入攻击等风险。 若要了解有关内容筛选的详细信息,请参阅介绍类别和严重性级别的文档。
本文档介绍默认配置。
提示
默认情况下,所有模型部署都使用默认配置。 但是,可以按模型部署配置内容筛选,如配置内容筛选中所述。
文本模型
Azure AI 模型推理中的文本模型可以采用并生成文本和代码。 这些模型应用 Azure 的文本内容筛选模型来检测和防止有害内容。 此系统同时适用于提示和补全。
风险类别 | 提示/完成 | 严重性阈值 |
---|---|---|
仇恨和公平性 | 提示和补全 | 中 |
暴力 | 提示和补全 | 中 |
性 | 提示和补全 | 中 |
自残 | 提示和补全 | 中 |
用户提示注入攻击(越狱) | 提示 | 空值 |
受保护材料 – 文本 | 完成 | 空值 |
受保护材料 – 代码 | 完成 | 空值 |
视觉和与视觉模型聊天
视觉模型可以同时将文本和图像作为输入的一部分。 默认内容筛选功能因模型和提供程序而异。
Azure OpenAI:GPT-4o 和 GPT-4 Turbo
风险类别 | 提示/完成 | 严重性阈值 |
---|---|---|
仇恨和公平性 | 提示和补全 | 中 |
暴力 | 提示和补全 | 中 |
性 | 提示和补全 | 中 |
自残 | 提示和补全 | 中 |
个体身份识别和敏感特性推断 | 提示 | 空值 |
用户提示注入攻击(越狱) | 提示 | 空值 |
Azure OpenAI:DALL-E 3 和 DALL-E 2
风险类别 | 提示/完成 | 严重性阈值 |
---|---|---|
仇恨和公平性 | 提示和补全 | 低 |
暴力 | 提示和补全 | 低 |
性 | 提示和补全 | 低 |
自残 | 提示和补全 | 低 |
内容凭据 | 完成 | 空值 |
政治候选人信息的欺骗性生成 | 提示 | 空值 |
公共人物刻画 | 提示 | 空值 |
用户提示注入攻击(越狱) | 提示 | 空值 |
受保护材料 – 艺术和工作室字符 | 提示 | 空值 |
亵渎内容 | 提示 | 空值 |
除了前述安全配置之外,Azure OpenAI DALL-E 还默认附带提示转换。 这种转换发生在所有提示上,以提高原始提示的安全性,特别是在多元化、政治候选人信息的欺骗性生成、公共人物刻画和受保护材料等风险类别中。
Meta:Llama-3.2-11B-Vision-Instruct 和 Llama-3.2-90B-Vision-Instruct
内容筛选器仅适用于文本提示和完成。 图像不受内容审核的约束。
Microsoft: Phi-3.5-vision-instruct
内容筛选器仅适用于文本提示和完成。 图像不受内容审核的约束。