モデルの使用方法

完了

モデルをトレーニングするためのこれらのパーツの組み合わせ方法を変更しましょう。

モデルのトレーニングと使用

モデルのトレーニングと使用を区別することが重要です。

モデルの "使用" とは、入力を提供し、推定または予測を受け取ることを意味します。 このプロセスは、モデルをトレーニングするときと、私たちまたは顧客が実際の環境でモデルを使用するときの両方で行われます。 通常、モデルの使用に要する時間は数秒未満です。

データがモデルに入力された後、推定に移る機械学習モデルを示す図。

これに対して、モデルのトレーニングは、モデルの動作を改善するプロセスです。 トレーニングでは、モデル、目的関数、オプティマイザーを特別なループ内で使用する必要があります。 トレーニングが完了するまで、数分または数日かかる場合があります。 通常、モデルのトレーニングは 1 回だけ行います。 モデルは、トレーニングが完了すると、さらに変更を加えることなく、必要なだけ何回でも使用することができます。

機械学習モデルのライフサイクルを示す最終的なトレーニングの図。

たとえば、雪崩救助犬の店のシナリオでは、パブリック データセットを使用してモデルをトレーニングする必要があります。 データセットにより、モデルがハーネスのサイズに基づいて犬用ブーツのサイズを予測できるように、モデルが変更されます。 モデルのトレーニングが完了したら、モデルをオンライン ストアの一部として使用し、顧客が犬に合った犬用ブーツを購入していることを確認します。

実際に使用するデータとトレーニング用データ

データセットは、物体や物に関する情報のコレクションであることを思い出してください。 たとえば、あるデータセットには、次のような犬に関する情報が含まれます。

犬の ID ブーツのサイズ ハーネスのサイズ 犬の色 Breed
0 27 12 Brown セントバーナード
1 26 11 Black Labrador
2 25 10 White Labrador
3 29 14 Black ブラック シェパード

このモデルを使用する場合、モデルが入力として受け入れるデータの列のみが必要です。 これらの列は、特徴と呼ばれます。 このシナリオで、モデルがハーネスのサイズを受け入れ、ブーツのサイズを推定する場合、特徴はハーネスのサイズです

トレーニング中、目的関数は通常、モデルの出力と、正しい答えが何であるかの両方を知る必要があります。 これらの値は、ラベルと呼ばれます。 このシナリオで、モデルを使用してブーツのサイズを予測する場合、ブーツのサイズがラベルです

つまり、モデルを使用するために必要なのは特徴のみですが、トレーニング中は通常、特徴とラベルの両方が必要です。 このシナリオでのトレーニング中には、特徴であるハーネスのサイズとラベルであるブーツのサイズの両方が必要です。 Web サイトでモデルを使用する場合は、特徴であるハーネスのサイズを知るだけで済みます。この後、モデルによって、使用するためのブーツのサイズが推定されます。

トレーニング終了後の作業 実行できる操作

モデルのトレーニングが完了したら、モデルだけをファイルに保存できます。 元のデータ、目的関数、モデルのオプティマイザーは必要なくなります。 モデルを使用する場合は、ディスクから読み込み、新しいデータを提供して、予測を取得できます。

次の演習では、実際の環境と同様に、モデルを保存し、ディスクからロードして、使用する練習を行います。 オンライン ストアのシナリオを完了するために、モデルの出力を使用して、顧客が間違ったサイズの犬用ブーツを購入しているように思われる場合に顧客に警告する練習も行います。