既定のコンテンツ安全性ポリシー
Azure OpenAI Service には、(Azure OpenAI Whisper を除く) すべてのモデルに適用される既定の安全性が含まれています。 これらの構成により、コンテンツ フィルタリング モデル、ブロックリスト、プロンプト変換、コンテンツ資格情報など、責任あるエクスペリエンスが既定で提供されます。
既定の安全性は、憎悪、公平性、性的、暴力、自傷行為、保護されたマテリアル コンテンツ、ユーザー プロンプト インジェクション攻撃などのリスクを軽減することを目的としています。 コンテンツ フィルタリングの詳細については、カテゴリと重大度レベルを説明しているこちらのドキュメントにアクセスしてください。
すべての安全性は構成可能です。 構成可能性の詳細については、コンテンツ フィルタリングの構成に関するドキュメントにアクセスしてください。
テキスト モデル: GPT-4、GPT-3.5
Azure OpenAI Service でのテキスト モデルは、テキストとコードの両方を取り込んで生成できます。 これらのモデルは、Azure のテキスト コンテンツ フィルタリング モデルを利用して、有害なコンテンツを検出して防止します。 このシステムは、プロンプトと入力候補の両方に対して動作します。
リスク カテゴリ | プロンプト/完了 | 重大度しきい値 |
---|---|---|
ヘイトと公平性 | プロンプトと入力候補 | Medium |
暴力 | プロンプトと入力候補 | Medium |
性的 | プロンプトと入力候補 | Medium |
自傷行為 | プロンプトと入力候補 | Medium |
ユーザー プロンプト インジェクション攻撃 (脱獄) | プロンプト | 該当なし |
保護されたマテリアル – テキスト | 入力候補 | 該当なし |
保護されたマテリアル – コード | 入力候補 | 該当なし |
Vision モデル: GPT-4o、GPT-4 Turbo、DALL-E 3、DALL-E 2
GPT-4o および GPT-4 Turbo
リスク カテゴリ | プロンプト/完了 | 重大度しきい値 |
---|---|---|
ヘイトと公平性 | プロンプトと入力候補 | Medium |
暴力 | プロンプトと入力候補 | Medium |
性的 | プロンプトと入力候補 | Medium |
自傷行為 | プロンプトと入力候補 | Medium |
個人の識別と機密属性の推論 | プロンプト | 該当なし |
ユーザー プロンプト インジェクション攻撃 (脱獄) | プロンプト | 該当なし |
DALL-E 3 および DALL-E 2
リスク カテゴリ | プロンプト/完了 | 重大度しきい値 |
---|---|---|
ヘイトと公平性 | プロンプトと入力候補 | 低 |
暴力 | プロンプトと入力候補 | 低 |
性的 | プロンプトと入力候補 | 低 |
自傷行為 | プロンプトと入力候補 | 低 |
コンテンツ資格情報 | 入力候補 | 該当なし |
政治的候補者に対する欺瞞的な生成 | プロンプト | 該当なし |
有名人の描写 | プロンプト | 該当なし |
ユーザー プロンプト インジェクション攻撃 (脱獄) | プロンプト | 該当なし |
保護されたマテリアル – アートおよびスタジオ キャラクター | プロンプト | 該当なし |
不適切な表現 | プロンプト | 該当なし |
上記の安全性構成に加えて、Azure OpenAI DALL-E には既定でプロンプト変換も用意されています。 この変換は、特に多様性、政治的候補者に対する欺瞞的な生成、有名人の描写、保護されたマテリアルなどのリスク カテゴリにおいて、元のプロンプトの安全性を高めるために、すべてのプロンプトに対して発生します。