你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
默认内容安全策略
Azure OpenAI 服务包括应用于所有模型的默认安全性,但不包括 Azure OpenAI Whisper。 这些配置默认提供负责任的体验,包括内容筛选模型、阻止列表、提示转换和内容凭据等。
默认安全性旨在缓解仇恨和公平、性、暴力、自我伤害、受保护材料内容和用户提示注入攻击等风险。 若要了解有关内容筛选的详细信息,请访问此处介绍类别和严重性级别的文档。
所有安全性都是可配置的。 若要了解有关可配置性的详细信息,请访问有关如何配置内容筛选的文档。
文本模型:GPT-4、GPT-3.5
Azure OpenAI 服务中的文本模型可以接收和生成文本和代码。 这些模型利用 Azure 的文本内容筛选模型来检测和防止有害内容。 此系统同时适用于提示和补全。
风险类别 | 提示/完成 | 严重性阈值 |
---|---|---|
仇恨和公平性 | 提示和补全 | 中 |
暴力 | 提示和补全 | 中 |
性 | 提示和补全 | 中 |
自残 | 提示和补全 | 中 |
用户提示注入攻击(越狱) | 提示 | 空值 |
受保护材料 – 文本 | 完成 | 空值 |
受保护材料 – 代码 | 完成 | 空值 |
视觉模型:GPT-4o、GPT-4 Turbo、DALL-E 3、DALL-E 2
GPT-4o 和 GPT-4 Turbo
风险类别 | 提示/完成 | 严重性阈值 |
---|---|---|
仇恨和公平性 | 提示和补全 | 中 |
暴力 | 提示和补全 | 中 |
性 | 提示和补全 | 中 |
自残 | 提示和补全 | 中 |
个体身份识别和敏感特性推断 | 提示 | 空值 |
用户提示注入攻击(越狱) | 提示 | 空值 |
DALL-E 3 和 DALL-E 2
风险类别 | 提示/完成 | 严重性阈值 |
---|---|---|
仇恨和公平性 | 提示和补全 | 低 |
暴力 | 提示和补全 | 低 |
性 | 提示和补全 | 低 |
自残 | 提示和补全 | 低 |
内容凭据 | 完成 | 空值 |
政治候选人信息的欺骗性生成 | 提示 | 空值 |
公共人物刻画 | 提示 | 空值 |
用户提示注入攻击(越狱) | 提示 | 空值 |
受保护材料 – 艺术和工作室字符 | 提示 | 空值 |
亵渎内容 | 提示 | 空值 |
除了上述安全配置之外,Azure OpenAI DALL-E 还默认附带提示转换。 这种转换发生在所有提示上,以提高原始提示的安全性,特别是在多元化、政治候选人信息的欺骗性生成、公共人物刻画和受保护材料等风险类别中。