Microsoft Fabric でモデルのトレーニングとスコア付けを行う

完了

データを取り込み、調査し、前処理したら、そのデータを使用してモデルをトレーニングできます。 モデルのトレーニングは反復的なプロセスであり、作業を追跡できるようにする必要があります。

Microsoft Fabric は、作業を簡単に追跡してログに記録できるために MLflow と統合され、いつでも作業を確認して、最終的なモデルをトレーニングするための最善のアプローチを決定できます。 作業を追跡すると、結果を簡単に再現できます。

追跡する作業は、実験として追跡できます。

実験について理解する

追跡するモデルをノートブックでトレーニングするたびに、Microsoft Fabric で実験を作成できます。

実験は複数の実行で構成できます。 各実行は、機械学習モデルのトレーニングなど、ノートブックで実行したタスクを表します。

たとえば、売上予測用の機械学習モデルをトレーニングするために、同じアルゴリズムを使用してさまざまなトレーニング データセットを試すことができます。 異なるデータセットを使用してモデルをトレーニングするたびに、新しい実験実行を作成します。 その後、実験実行を比較して、最もパフォーマンスの高いモデルを判断できます。

メトリックの追跡を開始する

実験実行を比較するために、各実行のパラメーター、メトリック、成果物を追跡できます。

実験実行で追跡するすべてのパラメーター、メトリック、成果物が実験の概要に表示されます。 [実行の詳細] タブで実験実行を個別に表示したり、[実行の一覧] で複数の実行を比較したりできます。

Microsoft Fabric の実験の概要のスクリーンショット。

MLflow で作業を追跡することで、モデル トレーニングの反復を比較し、ユース ケースに最適なモデルとなった構成を判断できます。

モデルについて理解する

モデルをトレーニングした後、スコアリングに使用する必要があります。 スコアリングでは、新しいデータのモデルを使用して予測や分析情報を生成します。 MLflow でモデルをトレーニングして追跡すると、モデルとそのメタデータを表す成果物が実験実行内に格納されます。 これらの成果物は、Microsoft Fabric でモデルとして保存できます。

モデル成果物を登録モデルとして Microsoft Fabric に保存することで、モデルを簡単に管理できます。 新しいモデルをトレーニングし、同じ名前で保存するたびに、新しいバージョンをモデルに追加します。

Microsoft Fabric のモデルの概要のスクリーンショット。

モデルを使用して分析情報を生成する

予測を生成するためにモデルを使用する場合は、Microsoft Fabric で PREDICT 関数を使用できます。 PREDICT 関数は、MLflow モデルと簡単に統合できるように構築されており、モデルを使用してバッチ予測を生成できます。

たとえば、毎週、複数の店舗から売上データを受け取るとします。 履歴データに基づき、過去数週間の売上に基づいて次の週の売上を予測できるモデルをトレーニングしました。 MLflow でモデルを追跡し、Microsoft Fabric に保存しました。 新しい週次売上データが取り込まれるたびに、PREDICT 関数を使用して、モデルで次の週の予測を生成できるようにします。 予測売上データはレイクハウスのテーブルとして格納されます。これは、ビジネス ユーザーが使用する Power BI レポートで視覚化されます。