モザイク AI ゲートウェイ

[アーティクル]
01/31/2025

重要

モザイク AI ゲートウェイとは？

Mosaic AI Gateway は、組織内の生成 AI モデルとエージェントの使用と管理を合理化するように設計されています。これは、エンドポイントにサービスを提供するモデルに、ガバナンス、モニタリング、本番環境への対応をもたらす一元化されたサービスです。また、AIトラフィックを実行、保護、管理し、組織のAI採用を民主化、加速することができます。

すべてのデータは、 Unity カタログの Delta テーブルに記録されます。

AI Gateway データから分析情報の視覚化を開始するには、gitHub からサンプル AI Gateway ダッシュボードをダウンロードします。このダッシュボードでは、使用状況追跡とペイロードログ推論テーブルのデータが活用されます。

JSON ファイルをダウンロードしたら、ダッシュボードをワークスペースにインポートします。ダッシュボードをインポートする手順については、「ダッシュボードファイルをインポートする」を参照してください。

サポートされている機能

次の表では、使用可能な AI Gateway の機能と、それらをサポートするエンドポイントの種類を提供するモデルを定義します。

機能	Definition	外部モデルエンドポイント	Foundation Model API によってプロビジョニングされたスループットエンドポイント	モザイクAI（エーアイ）エージェント
アクセス許可とレート制限	アクセス権を持つユーザーとアクセス権の量を制御します。	✓	✓
ペイロードのログ	推論テーブルを使用してモデル API に送信されるデータ監視および監査します。	✓	✓	✓
使用状況の追跡	システムテーブルを使用して、エンドポイントの運用上の使用状況と関連コストを監視します。	✓	✓
AI ガードレール	要求と応答で不要なデータや安全でないデータを防止します。「AI ガードレール」を参照してください。	✓	✓
トラフィックルーティング	デプロイ中とデプロイ後の運用停止を最小限に抑えます。	✓	✓

モザイク AI ゲートウェイでは、有効な機能ごとの料金が発生します。プレビュー期間中、これらの有料機能には、AI Guardrails、ペイロードのログ記録、使用状況の追跡などがあります。クエリのアクセス許可、レート制限、トラフィックルーティングなどの機能は無料です。新機能については、料金が発生する場合があります。

次の表は、有料 AI ゲートウェイ機能の 100 万 (M) トークンレートあたりの Databricks ユニット (DBU) を示しています。料金は、 Serverless Real-time Inference SKU の下に表示されます。

機能	DBU レート
AI ガードレール	M トークンあたり 21.429 DBU
ペイロードのログ	M トークンあたり 2.857 DBU
使用状況の追跡	M トークンあたり 0.571 DBU

AI ガードレール

AI Guardrails を使用すると、ユーザーはモデル・サービング・エンドポイント・レベルでデータ・コンプライアンスを構成および実施し、基礎となるモデルに送信されるリクエストの有害なコンテンツを削減することができます。不適切な要求と応答はブロックされ、既定のメッセージがユーザーに返されます。エンドポイントを提供するモデルでガードレールを構成する方法を参照してください。

重要

AI Guardrail は、Foundation Model API のトークンごとの支払いをサポートするリージョンでのみ使用できます。

次の表は、構成可能なガードレールをまとめたものです。「制限事項」を参照してください。

ガードレール	Definition
安全フィルター処理	安全フィルターは、モデルが、暴力犯罪、自傷行為、ヘイトスピーチなどの安全でない有害なコンテンツとやり取りするのを防ぎます。 AI ゲートウェイの安全フィルターは Meta Llama 3 で構築されています。 Databricks は、Llama Guard 2-8b を安全フィルターとして使用します。 Llama Guard セーフティフィルターの詳細と、セーフティフィルターに適用されるトピックについては、 Meta Llama Guard 2 8B モデルカードを参照してください。 Meta Llama 3 は LLAMA 3 Community License の下でライセンスされています (Copyright © Meta Platforms, Inc. All Rights Reserved.)。お客様は、該当するモデルライセンスへのコンプライアンスを遵守する責任を負います。
個人を特定できる情報 (PII) の検出	お客様は、ユーザーの名前、住所、クレジットカード番号などの機密情報を検出できます。この機能では、AI Gateway は Presidio を使用して、米国の PII カテゴリ (クレジットカード番号、電子メールアドレス、電話番号、銀行口座番号、社会保障番号) を検出します。 PII 分類子は、構造化データと非構造化データの機密情報または PII を識別するのに役立ちます。ただし、自動検出メカニズムを使用しているため、サービスがすべての機密情報を検出する保証はありません。そのため、追加のシステムと保護を採用する必要があります。これらの分類方法は、主に米国の PII のカテゴリ (米国の電話番号、社会保障番号など) を対象とします。
トピックのモデレーション	許可されている一連のトピックを一覧表示する機能。チャット要求が指定されると、このガードレールは、そのトピックが許可されたトピックにない場合に要求にフラグを設定します。
キーワードのフィルター処理	お客様は、入力と出力の両方に異なる無効なキーワードのセットを指定できます。キーワードフィルター処理の可能性のあるユースケースのひとつは、モデルが競合他社について話し合わない場合です。このガードレールでは、キーワードまたは文字列の照合を使用して、要求または応答のコンテンツにキーワードが存在するかどうかを決定します。

RD ゲートウェイの使用

サービス UI を使用して、エンドポイントにサービスを提供するモデルで AI ゲートウェイ機能を構成できます。エンドポイントを提供モデルでの AI ゲートウェイの構成を参照してください。

の制限事項

プレビュー期間中は、次の制限事項が適用されます:

AI ゲートウェイは、次の場合にのみサポートされます。
- Foundation Model API のプロビジョニングされたスループットのモデル提供エンドポイント。
- 外部モデルをサービス提供するエンドポイントを提供するモデル。
- モザイクAIエージェントにサービスを提供するためのエンドポイントをホストするモデル。
AI ガードレールを使用する場合、要求バッチサイズ (埋め込みバッチサイズ、完了バッチサイズ、チャット要求の n パラメーター) は 16 を超えないものとします。
プロビジョニングされたスループットワークロードでは、AI ゲートウェイ対応推論テーブルを使用したレート制限とペイロードログのみがサポートされます。
AI Gateway 対応推論テーブルの制限を参照してください。
関数呼び出し使用し、AI ガードレールを指定した場合、それらのガードレールは関数の要求と中間応答には適用されません。ただし、最終的な出力応答にはガードレールが適用されます。

次の方法で共有

モザイク AI ゲートウェイ