Foundation Model Fine-tuning API を使用してトレーニング実行を作成する

[アーティクル]
01/14/2025

重要

この機能は、次のリージョンでパブリックプレビュー段階です: centralus、eastus、eastus2、northcentralus、westus

この記事では、Foundation Model Fine-tuning (現在はモザイク AI モデルトレーニングの一部) API を使用してトレーニング実行を作成および構成する方法について説明し、API 呼び出しで使用されるすべてのパラメーターについて説明します。 UI を使用して実行を作成することもできます。手順については、「 Foundation Model Fine-tuning UI を使用してトレーニング実行を作成するを参照してください。

要件

「要件」を参照してください。

トレーニングの実行を作成する

プログラムでトレーニングの実行を作成するには、create() 関数を使用します。この関数では、指定されたデータセットのモデルをトレーニングし、最終的な Composer チェックポイントを推論用の Hugging Face 形式のチェックポイントに変換します。

必要な入力は、トレーニングするモデル、トレーニングデータセットの場所、モデルを登録する場所です。また、評価を実行し、実行のハイパーパラメーターを変更できる省略可能なパラメーターもあります。

実行が完了すると、完了した実行と最終チェックポイントが保存され、モデルがクローンされ、そのクローンが推論用のモデルバージョンとして Unity Catalog に登録されます。

(Unity Catalog 内のクローンされたモデルバージョンではなく) 完了した実行のモデルと Composer チェックポイントと Hugging Face チェックポイントが MLflow に保存されます。 Composer チェックポイントは、継続的な微調整タスクに使用できます。

関数の引数の詳細については、「create()」を参照してください。

from databricks.model_training import foundation_model as fm

run = fm.create(
  model='meta-llama/Llama-3.2-3B-Instruct',
  train_data_path='dbfs:/Volumes/main/mydirectory/ift/train.jsonl', # UC Volume with JSONL formatted data
  # Public HF dataset is also supported
  # train_data_path='mosaicml/dolly_hhrlhf/train'
  register_to='main.mydirectory', # UC catalog and schema to register the model to
)

トレーニングの実行を構成する

次の表は、 foundation_model.create() 関数のパラメーターをまとめたものです。

パラメーター	必須	タイプ	説明設定
`model`	x	str	使用するモデルの名前。「サポートされているモデル」を参照してください。
`train_data_path`	x	str	トレーニングデータの場所。これは、Unity Catalog 内の場所 (`<catalog>.<schema>.<table>` または `dbfs:/Volumes/<catalog>/<schema>/<volume>/<dataset>.jsonl`)、あるいは HuggingFace データセットにすることができます。 `INSTRUCTION_FINETUNE` の場合、データは、`prompt` と `response` フィールドを含む各行で書式設定する必要があります。 `CONTINUED_PRETRAIN` の場合、これは `.txt` ファイルのフォルダーです。データサイズの推奨事項については、「Foundation Model Fine-tuning のPrepare data for accepted data formats and Recommended data size for model trainingを参照してください。
`register_to`	x	str	簡単にデプロイできるようにトレーニング後にモデルが登録される Unity Catalog のカタログとスキーマ (`<catalog>.<schema>` または `<catalog>.<schema>.<custom-name>`)。 `custom-name` が指定されていない場合、これは既定で実行名になります。
`data_prep_cluster_id`		str	Spark データ処理に使用するクラスターのクラスター ID。これは、トレーニングデータが Delta テーブルにある命令トレーニングタスクに必要です。クラスター ID を見つける方法については、「クラスター ID の取得」を参照してください。
`experiment_path`		str	トレーニング実行の出力 (メトリックとチェックポイント) が保存される MLflow 実験へのパス。既定では、ユーザーの個人用ワークスペース内の実行名になります (つまり、`/Users/<username>/<run_name>`)。
`task_type`		str	実行するタスクの種類。 `CHAT_COMPLETION` (既定値)、`CONTINUED_PRETRAIN`、または `INSTRUCTION_FINETUNE` にすることができます。
`eval_data_path`		str	評価データのリモートの場所 (存在する場合)。 `train_data_path` と同じ形式に従う必要があります。
`eval_prompts`		List[str]	評価中に応答を生成するプロンプト文字列の一覧。既定値は `None` (プロンプトを生成しない) です。モデルがチェックポイント処理されるたびに、結果が実験に記録されます。次の生成パラメーターを持つすべてのモデルチェックポイントで生成が行われます: `max_new_tokens: 100`、`temperature: 1`、`top_k: 50`、`top_p: 0.95`、`do_sample: true`。
`custom_weights_path`		str	トレーニング用のカスタムモデルチェックポイントのリモートの場所。既定値は `None` です。これは、選択したモデルの元の事前トレーニング済みの重みから実行が開始されていることを意味します。カスタムの重みが指定されている場合、モデルの元の事前トレーニング済みの重みではなく、これらの重みが使用されます。これらの重みは Composer チェックポイントである必要があり、指定された `model` のアーキテクチャと一致している必要があります。カスタムモデルの重みの Build を参照してください
`training_duration`		str	実行の合計期間。既定値は 1 エポック (`1ep`) です。複数のエポック (`10ep`) または複数のトークン (`1000000tok`) で指定できます。
`learning_rate`		str	モデルトレーニングの学習率。 Llama 3.1 405B Instruct 以外のすべてのモデルでは、既定の学習率は `5e-7` です。 Llama 3.1 405B Instruct では、既定の学習率は `1.0e-5` です。オプティマイザーは DecoupledLionW で、ベータ値は 0.99 および 0.95、重み減衰はありません。学習率スケジューラは LinearWithWarmupSchedule で、ウォームアップはトレーニング期間全体の 2%、最終的な学習率の乗数は 0 です。
`context_length`		str	データサンプルの最大シーケンス長。これは、長すぎるデータを切り捨て、短いシーケンスをまとめてパッケージ化して効率を高めるために使用されます。既定値は、8192 トークンか、指定されたモデルの最大コンテキスト長のいずれか小さい方です。このパラメーターを使用してコンテキスト長を構成できますが、各モデルの最大コンテキスト長を超える構成はサポートされていません。各モデルでサポートされるコンテキストの最大長については、「サポートされているモデル」を参照してください。
`validate_inputs`		Boolean	トレーニングジョブを送信する前に、入力パスへのアクセスを検証するかどうか。既定値は `True` です。

カスタムモデルの重みを基にする

Foundation Model Fine-tuning では、モデルをトレーニングおよびカスタマイズするために、オプションのパラメーター custom_weights_path を使用してカスタムウェイトを追加できます。

開始するには、前のトレーニング実行のcustom_weights_pathチェックポイントパスにを設定します。チェックポイントパスは、前の MLflow 実行の Artifacts タブにあります。チェックポイントフォルダー名は、 ep29-ba30/など、特定のスナップショットのバッチとエポックに対応します。

前の MLflow 実行の [成果物] タブ

前回の実行の最新のチェックポイントを指定するには、 custom_weights_path を Composer チェックポイントに設定します。たとえば、custom_weights_path=dbfs:/databricks/mlflow-tracking/<experiment_id>/<run_id>/artifacts/<run_name>/checkpoints/latest-sharded-rank0.symlink のようにします。
以前のチェックポイントを指定するには、custom_weights_pathを、.distcpなどの目的のチェックポイントに対応するcustom_weights_path=dbfs:/databricks/mlflow-tracking/<experiment_id>/<run_id>/artifacts/<run_name>/checkpoints/ep#-ba# ファイルを含むフォルダーへのパスに設定します。

次に、modelに渡したチェックポイントの基本モデルと一致するように、custom_weights_path パラメーターを更新します。

次の例では、 ift-meta-llama-3-1-70b-instruct-ohugkq は、 meta-llama/Meta-Llama-3.1-70Bを微調整する前の実行です。 ift-meta-llama-3-1-70b-instruct-ohugkqから最新のチェックポイントを微調整するには、次のようにmodel変数とcustom_weights_path変数を設定します。

from databricks.model_training import foundation_model as fm

run = fm.create(
model = 'meta-llama/Meta-Llama-3.1-70B'
custom_weights_path = 'dbfs:/databricks/mlflow-tracking/2948323364469837/d4cd1fcac71b4fb4ae42878cb81d8def/artifacts/ift-meta-llama-3-1-70b-instruct-ohugkq/checkpoints/latest-sharded-rank0.symlink'
... ## other parameters for your fine-tuning run

)

微調整実行で他のパラメーターを構成する方法についてはトレーニング実行の構成に関するページを参照してください。

クラスター ID を取得する

クラスター ID を取得するには:

Databricks ワークスペースの左側のナビゲーションバーで、[コンピューティング] をクリックします。
テーブルで、クラスターの名前をクリックします。
右上隅にある [] をクリックし、ドロップダウンメニューから [JSON の表示] を選択します。
クラスター JSON ファイルが表示されます。ファイルの最初の行であるクラスター ID をコピーします。

実行の状態を取得する

実行の進行状況は、Databricks UI の実験ページまたは API コマンド get_events() を使用して追跡できます。詳細については、「 Foundation Model の微調整実行の表示、管理、分析を参照してください。

get_events() からの出力例:

API を使用して実行状態を取得する

実験ページのサンプルの実行の詳細:

実験 UI から実行状態を取得する

次のステップ

トレーニングの実行が完了した後、MLflow でメトリックを確認し、推論のためにモデルをデプロイできます。「 Tutorial: Foundation Model Fine-tuning run を作成してデプロイする」の手順 5 から 7 を参照。

データの準備、トレーニング実行の構成のファインチューニング、デプロイの手順を示す手順ファインチューニングの例については、「手順ファインチューニング: 固有表現認識」デモノートブックを参照してください。

ノートブックの例

次のノートブックは、Meta Llama 3.1 405B Instruct モデルを使用して合成データを生成し、そのデータを使用してモデルをファインチューニングする方法の例を示しています。

Llama 3.1 405B Instruct ノートブックを使用して合成データを生成する

ノートブックを入手

次の方法で共有

Foundation Model Fine-tuning API を使用してトレーニング実行を作成する

要件

トレーニングの実行を作成する

トレーニングの実行を構成する

カスタムモデルの重みを基にする

クラスター ID を取得する

実行の状態を取得する

次のステップ

ノートブックの例

Llama 3.1 405B Instruct ノートブックを使用して合成データを生成する

その他のリソース

フィードバック

その他のリソース

次の方法で共有

Foundation Model Fine-tuning API を使用してトレーニング実行を作成する

要件

トレーニングの実行を作成する

トレーニングの実行を構成する

カスタム モデルの重みを基にする

クラスター ID を取得する

実行の状態を取得する

次のステップ

ノートブックの例

Llama 3.1 405B Instruct ノートブックを使用して合成データを生成する

その他のリソース

フィードバック

その他のリソース

カスタムモデルの重みを基にする