Azure AI 模型推斷的預設內容安全原則
Azure AI 模型推斷包含套用至所有模型的預設安全性,不包括 Azure OpenAI Whisper。 這些設定預設會為您提供負責任的體驗。
預設安全旨在降低仇恨和公平性、性、暴力、自我傷害、受保護材料內容和使用者提示插入式攻擊等風險。 若要深入瞭解內容篩選,請閱讀 說明類別和嚴重性層級的檔。
本檔描述預設組態。
提示
根據預設,所有模型部署都會使用預設組態。 不過,您可以設定每個模型部署的內容篩選,如設定內容篩選中所述。
文字模型
Azure AI 模型推斷中的文字模型可以同時採用併產生文字和程序代碼。 這些模型會套用 Azure 的文字內容篩選模型,以偵測並防止有害內容。 此系統適用於提示和完成。
風險類別 | 提示/完成 | 嚴重性臨界值 |
---|---|---|
仇恨和公平性 | 提示和完成 | 中 |
暴力 | 提示和完成 | 中 |
兩性 | 提示和完成 | 中 |
自殘 | 提示和完成 | 中 |
使用者提示插入式攻擊 (越獄) | 提示 | N/A |
受(版權)保護素材 - 文字 | 完成 | N/A |
受(版權)保護素材 - 程式碼 | 完成 | N/A |
視覺和與視覺模型聊天
視覺模型可以同時接受文字和影像作為輸入的一部分。 默認內容篩選功能會因模型和提供者而異。
Azure OpenAI:GPT-4o 和 GPT-4 Turbo
風險類別 | 提示/完成 | 嚴重性臨界值 |
---|---|---|
仇恨和公平性 | 提示和完成 | 中 |
暴力 | 提示和完成 | 中 |
兩性 | 提示和完成 | 中 |
自殘 | 提示和完成 | 中 |
個人識別和敏感性屬性推斷 | 提示 | N/A |
使用者提示插入式攻擊 (越獄) | 提示 | N/A |
Azure OpenAI:DALL-E 3 和 DALL-E 2
風險類別 | 提示/完成 | 嚴重性臨界值 |
---|---|---|
仇恨和公平性 | 提示和完成 | 低 |
暴力 | 提示和完成 | 低 |
兩性 | 提示和完成 | 低 |
自殘 | 提示和完成 | 低 |
內容憑證 | 完成 | N/A |
欺騙性產生政治候選人 | 提示 | N/A |
描述公眾人物 | 提示 | N/A |
使用者提示插入式攻擊 (越獄) | 提示 | N/A |
受(版權)保護素材 – 藝術和工作室字元 | 提示 | N/A |
不雅內容 | 提示 | N/A |
除了先前的安全性設定之外,Azure OpenAI DALL-E 預設也隨附 提示轉換 。 所有提示都會進行轉換,以提高原始提示的安全,特別是在多樣化、欺騙性產生政治候選人、描述公眾人物、受(版權)保護的素材等等的風險類別。
Meta:Llama-3.2-11B-Vision-指示和 Llama-3.2-90B-Vision-指示
內容篩選僅適用於文字提示和完成。 影像不受 帳篷模式 約束。
Microsoft:Phi-3.5-vision-指示
內容篩選僅適用於文字提示和完成。 影像不受約束 帳篷模式。