基礎モデルを微調整するタイミングを理解する

完了

オープンソースの事前トレーニング済み基礎モデルを使用することで、リソースを節約できます。 場合によっては、特定のニーズに対応するために基礎モデルを微調整する必要があります。

モデル カタログで基礎モデルを探索する

基礎モデルは、さまざまなユース ケースのベースとして機能するように既にトレーニングされている大規模な機械学習モデルです。

Azure Machine Learning では、モデル カタログを検索してオープンソースの基礎モデルを探索できます。 必要な基礎モデルの種類は、モデルの用途によって異なります。

一般に、基礎モデルは大量のデータでトレーニングされ、言語の理解、テキストの生成、コンテキストの予測などの一般的なタスクを実行するのに適しています。 ただし、特定のタスクまたはドメインに合わせたモデルが必要な場合、最適な選択肢ではない可能性があります。 そのような場合は、タスク固有のデータに基づいて基礎モデルを微調整することで、特定の要件を満たし、より良い結果を得るのに役立ちます。

特定のタスクの基礎モデルの微調整

基礎モデルは既に要件を満たしている可能性がありますが、基礎モデルの微調整が必要な場合があります。

基礎モデルは、インターネットからのさまざまなテキストで事前にトレーニングされており、一般的な言語を十分理解できます。 しかし、微調整すると、モデルの知識を特定のタスクまたはドメインに合わせて調整し、そのパフォーマンスを最適化し、その特定のコンテキストで優れていることを確かめることができます。

基礎モデルを微調整できる一般的なタスクをいくつか以下に示します。

  • テキスト分類: コンテンツまたはコンテキストに基づいて、特定のテキストを定義済みのクラスまたはカテゴリに分類します。
  • トークン分類: テキスト内の個々のトークンまたは単語に特定のラベルまたはタグを割り当てます。名前付きエンティティの認識などのタスクでよく使用されます。
  • 質問の回答: 自然言語で提起された質問に対する正確で関連性のある回答を提供します。
  • 概要作成: 長いテキストの簡潔で一貫した要約を作成し、重要な情報を取り込みます。
  • 翻訳: 意味とコンテキストを維持しながら、ある言語から別の言語にテキストを変換します。

基礎モデルは既に事前トレーニングされているため、基礎モデルを微調整するには、より小さなタスク固有のデータセットが必要です。 モデルを微調整すると、モデルを最初からトレーニングする場合よりも、必要なデータとコンピューティングが少なくなる可能性があります。

Azure Machine Learning でモデル カタログからの基礎モデルを微調整することができます。 モデルを微調整するには、小さなデータセットと GPU クラスターのみが必要です。