次の方法で共有


Foundation Model API によってプロビジョニングされたスループットを使用したバッチ推論

この記事では、 Foundation Model API および ai_query を使用して、プロビジョニングされたスループット エンドポイントでバッチ推論を実行するノートブックの例を示します。

要件

  • Foundation Model API のサポートされているリージョン内のワークスペース。
  • 次のいずれかです。
    • コンピューティング サイズ i3.2xlarge 以上の実行 Databricks Runtime 15.4 ML LTS 以上で、少なくとも 2 人のワーカーを持つ汎用コンピューティング。
    • 中以上の SQL ウェアハウス。

バッチ推論を実行する

一般に、バッチ推論を設定するには、次の 2 つの手順が必要です。

  1. バッチ推論に使用するエンドポイントの作成。
  2. ai_queryを使用してバッチ要求を構築し、それらの要求をバッチ推論エンドポイントに送信する。

サンプル ノートブックでは、これらの手順について説明し、Meta Llama 3.1 70B モデルを使用したバッチ推論を示します。

プロビジョニングされたスループット エンドポイント ノートブックを使用したバッチ推論

ノートブックを入手

その他のリソース