次の方法で共有


Azure AI Video Indexer の言語サポート

この記事では、Video Indexer の言語オプションに関する説明と、各オプションの言語サポートの一覧を示します。 Video Indexer の機能、翻訳、言語識別、カスタマイズ、および Video Indexer Web サイトの言語設定について、それぞれの言語サポートの情報が記載されています。

シナリオ別の対応言語

このセクションでは、Video Indexer の言語オプションに関する説明と、各オプションでサポートされている言語の一覧表を示します。

重要

API を使用したインデックス作成では、一覧に記載されているすべての言語について翻訳がサポートされています。

列の説明

  • サポートされているソース言語 – メディア ファイル内の音声に含まれる、文字起こし、翻訳、検索のサポート対象言語。

  • 言語識別 - インデックス作成に言語識別が使用される際、Video Indexer でその言語の自動検出が可能かどうか。 詳細については、「Azure AI Video Indexer を使用して音声言語を自動的に識別する」および「言語識別」セクションを参照してください。

  • カスタマイズ (言語モデル) - Video Indexer で言語モデルをカスタマイズする際にその言語を使用できるかどうか。 詳細については、「Azure AI Video Indexer で言語モデルをカスタマイズする」を参照してください。

  • 発音 (言語モデル) - カスタム音声モデルの一部となる発音データセットを作成する際にその言語を使用できるかどうか。 詳細については、「Azure AI Video Indexer で音声モデルをカスタマイズする」を参照してください。

  • Web サイト翻訳Azure AI Video Indexer Web サイトを使用する際に、その言語の翻訳がサポートされているかどうか。 [言語] ドロップダウン メニューで、翻訳言語を選択します。

    ダウンロード、英語、ビューをメニュー項目として含むメニューを示すスクリーンショット。ツールヒントが英語項目のマウスオーバーとして表示され、[翻訳] が [英語] に設定されていることを示します。

    以下の分析情報の表示が翻訳されます。

    • トランスクリプト
    • キーワード
    • トピック
    • Labels
    • フレーム パターン (現時点ではヘブライ語のみ)

    その他すべての分析情報は、翻訳を使用した場合にも英語で表示されます。

  • Web サイトの言語 - Azure AI Video Indexer Web サイトで、その言語を使用言語として選択できるかどうか。 [設定] アイコンを選択し、[言語設定] ドロップダウンで言語を選択します。

    ユーザー設定がオンに切り替え済みのメニューを示すスクリーンショット。

Language コード サポート対象
ソース言語
Language
識別
カスタマイズ
(言語モデル)
発音
(言語モデル)
Web サイト
翻訳
Web サイト
言語
アフリカーンス語 af-ZA
アラビア語 (イスラエル) ar-IL
アラビア語 (イラク) ar-IQ
アラビア語 (ヨルダン) ar-JO
アラビア語 (クウェート) ar-KW
アラビア語 (レバノン) ar-LB
アラビア語 (オマーン) ar-OM
アラビア語 (パレスチナ自治政府) ar-PS
アラビア語 (カタール) ar-QA
アラビア語 (サウジアラビア) ar-SA
アラビア語 (アラブ首長国連邦) ar-AE
アラビア語 (エジプト) ar-EG
アラビア語 (現代標準 (バーレーン)) ar-BH
アラビア語 (シリア・アラブ共和国) ar-SY
アルメニア語 hy-AM
ベンガル語 bn-BD
ボスニア語 bs-Latn
ブルガリア語 bg-BG
カタロニア語 ca-ES
中国語 (繁体字) zh-HK
簡体中国語 zh-Hans
簡体中国語 zh-CK
繁体中国語 zh-Hant
クロアチア語 hr-HR
チェコ語 cs-CZ
デンマーク語 da-DK
オランダ語 nl-NL
英語 (オーストラリア) en-AU
英語 (英国) en-GB
英語 (米国) ja-JP
エストニア語 et-EE
フィジー語 en-FJ
フィリピノ語 fil-PH
フィンランド語 fi-FI
フランス語 fr-FR
フランス語 (カナダ) fr-CA
ドイツ語 de-DE
ギリシャ語 el-GR
グジャラート語 gu-IN
ハイチ・クレオール語 fr-HT
ヘブライ語 he-IL
ヒンディー語 hi-IN
ハンガリー語 hu-HU
アイスランド語 is-IS
インドネシア語 id-ID
アイルランド語 ga-IE
イタリア語 it-IT
日本語 ja-JP
カンナダ語 kn-IN
スワヒリ語 sw-KE
韓国語 ko-KR
ラトビア語 lv-LV
リトアニア語 lt-LT
マダガスカル語 mg-MG
マレー語 ms-MY
マラヤーラム語 ml-IN
マルタ語 mt-MT
ノルウェー語 nb-NO
ペルシャ語 fa-IR
ポーランド語 pl-PL
ポルトガル語 pt-BR
ポルトガル語 (ポルトガル) pt-PT
ルーマニア語 ro-RO
ロシア語 ru-RU
サモア語 en-WS
セルビア語 (キリル) sr-Cyrl-RS
セルビア語 (ラテン) sr-Latn-RS
スロバキア語 sk-SK
スロベニア語 sl-SI
スペイン語 es-ES
スペイン語 (メキシコ) es-MX
スウェーデン語 sv-SE
タミル語 ta-IN
テルグ語 te-IN
タイ語 th-TH
トンガ語 to-TO
トルコ語 tr-TR
ウクライナ語 uk-UA
ウルドゥ語 ur-PK
ベトナム語 vi-VN

サポートされている言語を API で取得する

Get Supported Languages API 呼び出しを使用すると、サポートされている言語の完全な一覧を領域別に取得できます。 詳細については、「サポートされている言語を取得する」を参照してください。

API は、サポートされている言語の一覧を以下の値で返します。

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • サポートされているソース言語:

    isSourceLanguage が false の場合、その言語は翻訳のみでサポートされます。 isSourceLanguage が true の場合、その言語は、文字起こし、翻訳、検索のソースとしてサポートされます。

  • 言語の識別 (自動検出):

    isAutoDetect が true の場合、その言語は、言語識別 (LID) と多言語識別 (MLID) においてサポートされます。

言語識別

メディア ファイルを Video Indexer にアップロードする際には、メディア ファイルのソース言語を指定できます。 Video Indexer の Web サイトでファイルのインデックスを作成する場合は、ファイルのアップロード時に言語を選択します。 インデックス作成ジョブを API で送信する場合は language パラメーターを使用して行います。 選択した言語は、ファイルの文字起こしの生成に使用されます。

メディア ファイルのソース言語がわからない場合や、複数の言語が含まれている可能性がある場合は、Video Indexer に音声言語を検出させることができます。 メディアファイルのソース言語について [単一言語の自動検出] (LID) または [多言語の自動検出] (MLID) を選択すると、検出された言語が、メディア ファイルの文字起こしに使用されます。 LID と MLID の詳細については、「Azure AI Video Indexer を使用して音声言語を自動識別する」、「言語識別モデルを使用して音声言語を自動的に識別する」、および「複数言語のコンテンツを自動的に識別および文字起こしする」を参照してください

LID と MLID のどちらでも、メディア ファイルのインデックス作成時に識別できる言語の種類は 10 個までに制限されています。 既定で言語識別 (LID) と多言語識別 (MILD) の対象となる言語は、以下の 9 言語です。

  • ドイツ語 (de-DE)
  • 英語 (米国) (en-US)
  • スペイン語 (es-ES)
  • フランス語 (fr-FR)
  • イタリア語 (it-IT)
  • 日本語 (ja-JP)
  • ポルトガル語 (pt-BR)
  • ロシア語 (ru-RU)
  • 簡体中国語 (zh-Hans)

既定の言語リストを変更する方法

言語識別に使用する言語リストを既定以外の内容に変更する必要がある場合は、Web サイトまたは API を使用することで、カスタマイズがサポートされている任意の 10 言語を指定できます。

Web サイトを使用して言語リストを変更する

  1. [モデルのカスタマイズ] で、[言語 ID] タブを選択します。 この言語リストは、お使いの Video Indexer アカウントと、サインインしているユーザーに固有のものです。 既定の言語リストは、各ユーザーのローカル デバイスに、デバイスごと、ブラウザーごとに保存されます。 したがって、各ユーザーが独自に既定の識別言語リストを構成できます。

  2. [言語の追加] を使用して、言語を検索し、追加します。 既に 10 個の言語をすべて選択済みの場合は、新しい言語を追加する前に、選択済みの言語のいずれかを検出対象から削除する必要があります。

    選択したすべての言語を示すテーブルを示すスクリーンショット。

API を使用して言語リストを変更する

ファイルのアップロード時、既定では 9 つの言語が Video Indexer 言語モデルによって相互参照されます。 合致する言語が検出されると、その言語でファイルの文字起こしが生成されます。

language パラメーターで、multi (MLID) または auto (LID) のパラメーターを指定します。 customLanguages パラメーターを使用して、最大 10 個の言語を指定します (このパラメーターは、language パラメーターが multi または auto である場合にのみ使用されます)。API の使用の詳細については、「Azure AI Video Indexer API を使用する」を参照してください。