次の方法で共有


音声モデルをカスタマイズする

Note

発音トレーニングを含む音声モデルのカスタマイズは、Video Indexer Azure 試用版アカウントと Resource Manager アカウントでのみサポートされます。 クラシック アカウントではサポートされていません。 アカウントの種類を無償で更新する方法のガイダンスについては、「 Azure AI Video Indexer アカウントの更新を参照してください。 カスタム言語エクスペリエンスの使用に関するガイダンスについては、「 言語モデルをカスタマイズするを参照してください。

Azure AI Video Indexer を使用すると、音声モデルの作成に使用されるデータセットをアップロードすることで、音声認識をカスタマイズするカスタム音声モデルを作成できます。 この記事では、Video Indexer Web サイトを使った手順を説明します。 「API を使用して音声モデルをカスタマイズする」で説明しているように API を使用することもできます。

カスタム音声モデルの詳細な概要とベスト プラクティスについては、「Azure AI Video Indexer を使用して音声モデルをカスタマイズする」を参照してください。

前提条件

データセットを作成する

すべてのカスタム モデルにデータセットを含める必要がある場合は、データセットを作成および管理する方法のプロセスから始めます。

  1. Model のカスタマイズ ボタンを選択します。
  2. [ Speech (新規) タブを選択します。
  3. [データセット アップロード] を選択
  4. Dataset の種類ドロップダウン メニューから Plain text または Pronunciation を選択します。 すべての音声モデルにはプレーン テキスト データセットが必要であり、必要に応じて発音データセットを持たせることができます。
  5. Browseを選択し、データセット ファイルを選択します。 選択できるのは 1 つだけです。
  6. モデルの Language を選択します。 このモデルでのインデックス作成を計画しているメディア ファイルで読み上げる言語を選択します。 データセット名にはファイルの名前が事前に設定されていますが、名前は変更できます。
  7. 必要に応じて、データセットの説明を追加できます。 これは、複数のデータセットが必要な場合に、各データセットを区別するのに役立ちます。
  8. [アップロード] を選択します。 データセットの作成が完了したら、それを使用して新しいモデルのトレーニングと作成を行うことができます。

データセットの確認と更新

データセットとそのプロパティは、次の方法で表示できます。

  • データセット名をクリックする
  • データセットの上にマウス ポインターを置く
  • 省略記号の選択

次に、 View Dataset を選択します。

その後、データセットの名前、説明、言語、および状態に加えて、次のプロパティを表示できます。

行数: ファイル内の行の合計数うち正常に読み込まれた行の数を示します。 ファイル全体が正常に読み込まれた場合、数値は一致します (たとえば、10/10 を正規化)。 数値が一致しない場合 (たとえば、正規化された 10 行中 7 行) は、一部の行のみが正常に読み込まれ、残りの行にエラーが発生したことを意味します。 エラーの一般的な原因は、発音ファイル内の各単語間にタブを配置しないなど、行の書式設定の問題です。 トレーニング記事のプレーンテキストと発音データを見直すことは、問題発見に役立つはずです。 原因をトラブルシューティングするには、レポートに含まれているエラーの詳細を確認します。 [レポートの表示] を選択すると、正常に読み込まれない行 (errorKind) に関するエラーの詳細が表示されます。 これは、[レポート] タブを選択して表示することもできます。

データセット ID: 各データセットには一意の GUID があります。これは、データセットを参照する操作に API を使用する場合に必要です。

プレーン テキスト (正規化): 読み込まれたデータセット ファイルの正規化されたテキストが含まれます。 正規化されたテキストとは、フォーマットされていないプレーンな形式で認識されたテキストのことです。

詳細の編集: データセットの名前または説明を編集するには、データセットの上にマウス ポインターを置いたときに省略記号を選択し、[詳細の編集] を選択します。 これで、データセットの名前と説明を編集できるようになります。

Note

データセットがアップロードされると、データセット内のデータを編集または更新することはできません。 データセット内のデータを編集または更新する必要がある場合は、データセットをダウンロードし、編集を実行し、ファイルを保存して、新規のデータセット ファイルをアップロードします。

ダウンロード: データセット ファイルをダウンロードするには、データセットの上にマウス ポインターを置いたときに省略記号を選択し、[ダウンロード] を選択します。 または、データセットを表示するときに、[ダウンロード] を選択し、データセット ファイルまたはアップロード レポートを JSON 形式でダウンロードすることもできます。

削除: データセットを削除するには、データセットの上にマウス ポインターを置いたときに省略記号を選択し、[削除] を選択します。

カスタム音声モデルを作成する

データセットは、モデルの作成とトレーニングで使用されます。 プレーンテキスト データセットを作成したら、カスタム音声モデルを作成して使用を開始できます。

カスタム音声モデルを作成して使用する場合は、次の点に注意してください:

  • 新しいモデルには、少なくとも 1 つのプレーン テキスト データセットを含める必要があります。また、複数のプレーン テキスト データセットを含めることができます。
  • 発音データセットを含めるかどうかは任意であり、複数含めることはできません。
  • モデルが作成されると、そのモデルにデータセットを追加したり、データセットに変更を加えたりすることはできません。 データセットを追加または変更する必要がある場合は、新しいモデルを作成します。
  • カスタム音声モデルを使用してビデオのインデックスを作成し、モデルを削除した場合、インデックスの再作成を実行しない限り、トランスクリプトは影響を受けません。
  • カスタム モデルのトレーニングに使用されたデータセットを削除した場合、音声モデルはデータセットによって既にトレーニングされているため、音声モデルが削除されるまで引き続き使用されます。
  • カスタム モデルを削除しても、モデルを使用して既にインデックスが作成されているビデオの文字起こしには影響しません。

モデルをトレーニングする

Note

一旦モデルが作成されると、データセットを追加することはできません。 モデルには、同じ言語のデータセットのみを含めることができます。

モデルをトレーニングするには、データセット タブを使うのと、モデル タブを使うのと 2 つの方法があります。

[データセット] タブを使用してモデルをトレーニングする

  1. データセットの一覧を表示します。
  2. プレーンテキスト データセットを選択します。 新しいモデルのトレーニング上のアイコンを選択できます。
  3. [新しいモデルのトレーニング 選択します
  4. モデルの名前、言語を入力し、必要に応じて説明を追加します。
  5. Datasets タブを選択します
  6. モデルに含めるデータセットを選択します。
  7. [作成とトレーニング] を選択します。

[モデル] タブを使用してモデルをトレーニングする

  1. [モデル] タブを選択します。
  2. [新しいモデル トレーニング アイコンを選択します。
  3. モデルの一部にするデータセットを選択します。
  4. モデルの名前、言語を入力し、必要に応じて説明を追加します。
  5. [データセット] タブを選択します。
  6. モデルに含めるデータセットを選択します。
  7. [作成とトレーニング] を選択します。

モデルの確認と更新

モデルの表示: モデルとそのプロパティを表示するには、モデルの名前をクリックするか、モデルの上にマウス ポインターを置き、省略記号をクリックして [モデルの表示] を選択します。

その後、[詳細] タブに、モデルの名前、説明、言語、および状態に加えて、次のプロパティが表示されます。

モデル ID: 各モデルには一意の GUID があり、モデルを参照する操作に API を使用する場合に必要です。

作成日: モデルが作成された日付。

詳細の編集: モデルの名前または説明を編集するには、モデルの上にマウス ポインターを置いたときに省略記号を選択し、[詳細の編集] を選択します。 これで、モデルの名前と説明を編集できるようになります。

Note

編集できるのは、モデルの名前と説明だけです。 データセットに変更を加えたり、データセットを追加したりする場合は、新しいモデルを作成する必要があります。

削除: モデルを削除するには、データセットの上にマウス ポインターを置いたときに省略記号を選択し、[削除] を選択します。

含まれているデータセット: [含まれるデータセット] タブを選択して、モデルのデータセットを表示します。

ビデオのインデックス作成時にカスタム言語モデルを使用する

カスタム言語モデルは、インデックス作成ジョブに既定では使用されないため、インデックスのアップロードプロセス中に選択する必要があります。

  1. アップロード プロセス中に、 language ドロップダウン メニューからカスタム言語モデル ソースを選択します。
  2. [アップロード] を選択します。

カスタム モデルでビデオのインデックスを再作成する場合も、同じ手順が適用されます。