バッチ推論と予測用のモデルをデプロイする

[アーティクル]
02/21/2025

この記事では、Databricks がバッチ推論に推奨する内容について説明します。

Azure Databricks で提供されるリアルタイムモデルについては、「Mosaic AI Model Servingを使用してモデルをデプロイする」を参照してください。

バッチ推論にai_queryを使用する

重要

Databricks では、バッチ推論に ai_query でを使用することをお勧めします。 ai_query は、SQL を使用してエンドポイントにサービスを提供する既存のモデルに対してクエリを実行できる組み込みの Databricks SQL 関数です。数十億のトークンの範囲でデータセットを確実かつ一貫して処理することが検証されています。この AI 関数の詳細についてはai_query関数を参照してください。

迅速な実験のために、ai_query は、ワークスペースで事前に構成トークンごとの支払いエンドポイントを使用したバッチ LLM 推論に使用できます。

大規模なデータまたは運用データに対してバッチ LLM 推論を実行する準備ができたら、Databricks では、パフォーマンスを向上させるためにプロビジョニングされたスループットエンドポイントを使用することをお勧めします。

プロビジョニング済みスループットのエンドポイントを作成するには、プロビジョンドスループット基盤モデル API を参照してください。
の指示に従って ai_queryを用いたバッチ LLM 推論を実行してください。

従来の ML モデルのバッチ推論の例については、次のノートブックを参照してください。

名前付きエンティティ認識ノートブックに BERT を使用したバッチ推論

ノートブックを取得する

次の方法で共有

バッチ推論と予測用のモデルをデプロイする

バッチ推論にai_queryを使用する

名前付きエンティティ認識ノートブックに BERT を使用したバッチ推論

フィードバック

その他のリソース