你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI 模型推理的默认内容安全策略

Azure AI 模型推理包括应用于所有模型的默认安全性,不包括 Azure OpenAI Whisper。 默认情况下,这些配置会提供负责任的体验。

默认安全性旨在缓解仇恨和公平、性、暴力、自我伤害、受保护材料内容和用户提示注入攻击等风险。 若要了解有关内容筛选的详细信息,请参阅介绍类别和严重性级别的文档

本文档介绍默认配置。

提示

默认情况下,所有模型部署都使用默认配置。 但是,可以按模型部署配置内容筛选,如配置内容筛选中所述。

文本模型

Azure AI 模型推理中的文本模型可以采用并生成文本和代码。 这些模型应用 Azure 的文本内容筛选模型来检测和防止有害内容。 此系统同时适用于提示和补全。

风险类别 提示/完成 严重性阈值
仇恨和公平性 提示和补全
暴力 提示和补全
提示和补全
自残 提示和补全
用户提示注入攻击(越狱) 提示 空值
受保护材料 – 文本 完成 空值
受保护材料 – 代码 完成 空值

视觉和与视觉模型聊天

视觉模型可以同时将文本和图像作为输入的一部分。 默认内容筛选功能因模型和提供程序而异。

Azure OpenAI:GPT-4o 和 GPT-4 Turbo

风险类别 提示/完成 严重性阈值
仇恨和公平性 提示和补全
暴力 提示和补全
提示和补全
自残 提示和补全
个体身份识别和敏感特性推断 提示 空值
用户提示注入攻击(越狱) 提示 空值

Azure OpenAI:DALL-E 3 和 DALL-E 2

风险类别 提示/完成 严重性阈值
仇恨和公平性 提示和补全
暴力 提示和补全
提示和补全
自残 提示和补全
内容凭据 完成 空值
政治候选人信息的欺骗性生成 提示 空值
公共人物刻画 提示 空值
用户提示注入攻击(越狱) 提示 空值
受保护材料 – 艺术和工作室字符 提示 空值
亵渎内容 提示 空值

除了前述安全配置之外,Azure OpenAI DALL-E 还默认附带提示转换。 这种转换发生在所有提示上,以提高原始提示的安全性,特别是在多元化、政治候选人信息的欺骗性生成、公共人物刻画和受保护材料等风险类别中。

Meta:Llama-3.2-11B-Vision-Instruct 和 Llama-3.2-90B-Vision-Instruct

内容筛选器仅适用于文本提示和完成。 图像不受内容审核的约束。

Microsoft: Phi-3.5-vision-instruct

内容筛选器仅适用于文本提示和完成。 图像不受内容审核的约束。

后续步骤