預設內容安全原則
Azure OpenAI 服務包含套用至所有模型的預設安全,不包括 Azure OpenAI Whisper。 依預設,這些設定會為您提供負責任的體驗,包括 內容篩選模型、封鎖清單、提示轉換、內容認證等等。
預設安全旨在降低風險,例如,仇恨和公平、性、暴力、自殘、受保護材料內容和使用者提示插入攻擊等。 若要深入了解內容篩選,請在這裡參閱說明類別和嚴重性層級的文件。
所有安全皆可設定。 若要深入了解可設定性,請參閱設定內容篩選的文件。
文字模型:GPT-4、GPT-3.5
Azure OpenAI 服務中的文字模型可以接受並產生文字和程式碼。 這些模型會利用 Azure 的文字內容篩選模型來偵測並防止有害內容。 此系統適用於提示和完成。
風險類別 | 提示/完成 | 嚴重性臨界值 |
---|---|---|
仇恨和公平性 | 提示和完成 | 中 |
暴力 | 提示和完成 | 中 |
兩性 | 提示和完成 | 中 |
自殘 | 提示和完成 | 中 |
使用者提示插入式攻擊 (越獄) | 提示 | N/A |
受(版權)保護素材 - 文字 | 完成 | N/A |
受(版權)保護素材 - 程式碼 | 完成 | N/A |
Vision 模型:GPT-4o、GPT-4 Turbo、DALL-E 3、DALL-E 2
GPT-4o 與 GPT-4 Turbo
風險類別 | 提示/完成 | 嚴重性臨界值 |
---|---|---|
仇恨和公平性 | 提示和完成 | 中 |
暴力 | 提示和完成 | 中 |
兩性 | 提示和完成 | 中 |
自殘 | 提示和完成 | 中 |
個人識別和敏感性屬性推斷 | 提示 | N/A |
使用者提示插入式攻擊 (越獄) | 提示 | N/A |
DALL-E 3 和 DALL-E 2
風險類別 | 提示/完成 | 嚴重性臨界值 |
---|---|---|
仇恨和公平性 | 提示和完成 | 低 |
暴力 | 提示和完成 | 低 |
兩性 | 提示和完成 | 低 |
自殘 | 提示和完成 | 低 |
內容憑證 | 完成 | N/A |
欺騙性產生政治候選人 | 提示 | N/A |
描述公眾人物 | 提示 | N/A |
使用者提示插入式攻擊 (越獄) | 提示 | N/A |
受(版權)保護素材 – 藝術和工作室字元 | 提示 | N/A |
不雅內容 | 提示 | N/A |
除了上述安全設定之外,依預設,Azure OpenAI DALL-E 也隨附提示轉換。 所有提示都會進行轉換,以提高原始提示的安全,特別是在多樣化、欺騙性產生政治候選人、描述公眾人物、受(版權)保護的素材等等的風險類別。