機械学習モデルとは
モデルは機械学習の中核となるコンポーネントであり、私たちが最終的に構築しようとしているものです。 モデルでは、写真から人の年齢を推定したり、ソーシャル メディアで何を見たいかを予測したり、ロボット アームをどこに移動する必要があるかを決定したりすることができます。 このシナリオでは、ハーネスのサイズに基づいて犬に最適なブーツのサイズを推定できるモデルを構築します。
モデルは、さまざまな方法で構築できます。 たとえば、航空機の飛行方法をシミュレートする従来のモデルは、物理学と工学の知識を使用して、人間によって構築されます。 機械学習モデルは特殊です。うまく機能するように人が編集するものではありません。機械学習モデルはデータによって形成されます。 これらは経験から学習します。
モデルに関する考え方
モデルは、データを入力として受け取り、出力を生成する関数と考えることができます。 より具体的には、モデルは入力データを使用して他の何かを推定します。 たとえば、このシナリオでは、ハーネスのサイズが与えられ、ブーツのサイズを推定するモデルを作成します。
ハーネスのサイズと犬用ブーツのサイズはデータです。モデルの一部ではありません。 ハーネスのサイズは入力で、犬用ブーツのサイズは出力です。
多くの場合、モデルは単純なコード
多くの場合、モデルは、既に使い慣れている単純な関数と意味のある違いはありません。 他のコードと同様に、ロジックとパラメーターが含まれます。 たとえば、ロジックは、"ハーネスのサイズに parameter_1 を乗算する" となります。
ここで、parameter_1 が 2.5 の場合、モデルにより、ハーネスのサイズに 2.5 が乗算され、その結果が返されます。
モデルの選択
モデルには数多くの種類があり、単純なものもあれば、複雑なものもあります。
すべてのコードと同様に、多くの場合、モデルは単純な方が信頼性が高く、理解するのも容易ですが、複雑なモデルは目覚ましい成果を達成する可能性があります。 どの種類のモデルを選択すべきかは、目標によって異なります。 たとえば、医学者は、信頼性が高く直観的であるため、比較的単純なモデルを使用することが少なくありません。 これに対し、AI ベースのロボットは、通常、複雑なモデルに依存します。
機械学習の最初のステップは、使用するモデルの種類を選択することです。 そのため、内部ロジックに基づいてモデルを選択します。 たとえば、ハーネスのサイズから犬用ブーツのサイズを推定するには、2 つのパラメーターを使用するモデルを選択します。
パラメーター値ではなく、論理的にどのように機能するかに基づいてモデルを選択したことに注意してください。 実際、この時点では、パラメーターは特定の値に設定されていません。
パラメーターは、トレーニング中に検出されます。
人間のデザイナーは、パラメーターの値を選択しません。 代わりに、パラメーターの値は、最初の推定値に設定され、その後、トレーニングと呼ばれる自動学習プロセス中に調整されます。
2 つのパラメーター モデルを使用するモデルを選択したので、パラメーターにランダムな推定値を提供して開始します。
これらのランダムなパラメーターは、モデルがブーツのサイズの推定に適していないことを意味するため、トレーニングを行います。 トレーニング中、これらのパラメーターは、より適切な結果を得るために 2 つの新しい値に自動的に変更されます。
このプロセスの具体的なしくみについては、学習の過程で段階的に説明します。