モザイク AI ゲートウェイ
重要
この機能はパブリック プレビュー段階にあります。
この記事では、サポートされるジェネレーティブAIモデルと関連するモデル提供エンドポイントへのアクセスを管理・監視するDatabricksソリューション、モザイク AI ゲートウェイについて説明します。
モザイク AI ゲートウェイとは?
モザイク AI ゲートウェイ は、組織内の生成 AI モデルの使用と管理を合理化するように設計されています。 これは、エンドポイントにサービスを提供するモデルに、ガバナンス、モニタリング、本番環境への対応をもたらす一元化されたサービスです。 また、AIトラフィックを実行、保護、管理し、組織のAI採用を民主化、加速することができます。
すべてのデータは、 Unity カタログの Delta テーブルに記録されます。
AI Gateway データから分析情報の視覚化を開始するには、gitHub から サンプル AI Gateway ダッシュボード をダウンロードします。 このダッシュボードでは、使用状況追跡とペイロード ログ推論テーブルのデータが活用されます。
JSON ファイルをダウンロードしたら、ダッシュボードをワークスペースにインポートします。 ダッシュボードをインポートする手順については、「ダッシュボード ファイルをインポートする」を参照してください。
AIゲートウェイでは、次の機能をサポートしています。
- アクセス許可とレート制限 アクセス権を持つユーザーとアクセス権の量を制御します。
- ペイロード ログ推論テーブルを使用してモデル API に送信されるデータの監視および監査。
- 使用状況の追跡システム テーブルを使用してエンドポイントの運用上の使用状況と関連するコストの監視。
- AI Guardrails 要求と応答で不要なデータと安全でないデータを回避します。
- トラフィック ルーティング 配置中および配置後の運用停止を最小限に抑えます。
モザイク AI ゲートウェイでは、有効な機能ごとの料金が発生します。 プレビュー期間中、これらの有料機能には、AI Guardrails、ペイロードのログ記録、使用状況の追跡などがあります。 クエリのアクセス許可、レート制限、トラフィック ルーティングなどの機能は無料です。 新機能については、料金が発生する場合があります。
次の表は、有料 AI ゲートウェイ機能の 100 万 (M) トークンレートあたりの Databricks ユニット (DBU) を示しています。 料金は、 Serverless Real-time Inference
SKU の下に表示されます。
機能 | DBU レート |
---|---|
AI ガードレール | M トークンあたり 21.429 DBU |
ペイロードのログ | M トークンあたり 2.857 DBU |
使用状況の追跡 | M トークンあたり 0.571 DBU |
AI ガードレール
AI Guardrails を使用すると、ユーザーはモデル・サービング・エンドポイント・レベルでデータ・コンプライアンスを構成および実施し、基礎となるモデルに送信されるリクエストの有害なコンテンツを削減することができます。 不適切な要求と応答はブロックされ、既定のメッセージがユーザーに返されます。 エンドポイントを提供するモデルでガードレールを構成する方法を参照してください。
重要
AI Guardrail は、Foundation Model API のトークンごとの支払いをサポートする リージョンでのみ使用できます。
次の表は、構成可能なガードレールをまとめたものです。
ガードレール | Definition |
---|---|
安全フィルター処理 | 安全フィルターは、モデルが、暴力犯罪、自傷行為、ヘイト スピーチなどの安全でない有害なコンテンツとやり取りするのを防ぎます。 AI ゲートウェイの安全フィルターは Meta Llama 3 で構築されています。 Databricks は、Llama Guard 2-8b を安全フィルターとして使用します。 Llama Guard セーフティ フィルターの詳細と、セーフティ フィルターに適用されるトピックについては、 Meta Llama Guard 2 8B モデル カードを参照してください。 Meta Llama 3 は LLAMA 3 Community License の下でライセンスされています (Copyright © Meta Platforms, Inc. All Rights Reserved.)。 お客様は、該当するモデル ライセンスへのコンプライアンスを遵守する責任を負います。 |
個人を特定できる情報 (PII) の検出 | お客様は、ユーザーの名前、住所、クレジット カード番号などの機密情報を検出できます。 この機能では、AI Gateway は Presidio を使用して、米国の PII カテゴリ (クレジット カード番号、電子メール アドレス、電話番号、銀行口座番号、社会保障番号) を検出します。 PII 分類子は、構造化データと非構造化データの機密情報または PII を識別するのに役立ちます。 ただし、自動検出メカニズムを使用しているため、サービスがすべての機密情報を検出する保証はありません。 そのため、追加のシステムと保護を採用する必要があります。 これらの分類方法は、主に米国の PII のカテゴリ (米国の電話番号、社会保障番号など) を対象とします。 |
トピックのモデレーション | 許可されている一連のトピックを一覧表示する機能。 チャット要求が指定されると、このガードレールは、そのトピックが許可されたトピックにない場合に要求にフラグを設定します。 |
キーワード のフィルター処理 | お客様は、入力と出力の両方に異なる無効なキーワードのセットを指定できます。 キーワード フィルター処理の可能性のあるユース ケースの ひとつは、モデルが競合他社について話し合わない場合です。 このガードレールでは、キーワードまたは文字列の照合を使用して、要求または応答のコンテンツにキーワードが存在するかどうかを決定します。 |
RD ゲートウェイの使用
サービス UI を使用して、エンドポイントにサービスを提供するモデルで AI ゲートウェイ 機能を構成できます。 エンドポイントを提供 モデルでの AI ゲートウェイの構成を参照してください。
制限事項
プレビュー期間中は、次の制限事項が適用されます:
- AI ゲートウェイ は、 外部モデルを提供するエンドポイントにサービスを提供するモデルでのみサポート。
- ガードレールを使用する場合、要求バッチ サイズ (埋め込みバッチ サイズ、完了バッチ サイズ、またはチャット要求の
n
パラメーター) は 16 を超えないものとします。