Azure AI Language での言語検出とは
言語の検出は、Azure AI Language に用意されている機能の 1 つであり、書き表された言語が関係するインテリジェントなアプリケーションを開発するためのクラウド内の機械学習と AI アルゴリズムのコレクションです。 言語検出は、プライマリ スクリプトで 100 を超える言語を検出できます。 さらに、Azure AI Language サービスでサポートされている言語の中から選択された数の言語について、ISO 15924 標準に従っており、検出された各言語でサポートされているスクリプトを検出するためのスクリプト検出機能も提供します。
このドキュメントには、次のような記事が記載されています。
言語検出機能
言語検出: 送信したドキュメントごとに、1 つの主要言語と、ISO 639-1 名、人間が判読できる名前、信頼度スコア、スクリプト名、ISO 15924 標準に従ったスクリプト コードを返します。
スクリプト検出: カザフ語などの特定の言語の記述に使用される複数のスクリプトを区別するために、言語検出により、ISO 15924 標準に従ったスクリプト名とスクリプト コードが返されます。
あいまいなコンテンツの処理: 入力に基づいて言語のあいまいさを解消するために、ISO 3166-1 alpha-2 の国および地域コードを指定できます。 たとえば、"communication" という単語は、英語とフランス語の両方に共通します。 テキストの出所をフランスとして指定すると、言語検出モデルで正しい言語を判断するのに役立ちます。
一般的なワークフロー
この機能を使用するには、分析のためのデータを送信し、アプリケーションで API 出力を処理します。 分析はそのままの状態で行われ、データに使用されるモデルに対して追加のカスタマイズは行われません。
Azure AI Language リソースを作成します。これにより、Azure AI Language によって提供される機能にアクセスできるようになります。 API 要求の認証に使用するパスワード (キーと呼ばれる) とエンドポイント URL が生成されます。
REST API か、C#、Java、JavaScript、Python のクライアント ライブラリを使用して、要求を作成します。 バッチ要求で非同期呼び出しを送信して、複数の機能の API 要求を 1 回の呼び出しに統合することもできます。
テキスト データを含む要求を送信します。 キーとエンドポイントを使用して認証が行われます。
応答をローカルでストリームまたは保存します。
言語検出の使用を開始する
言語検出を使用するには、分析のために未加工の非構造化テキストを送信し、お使いのアプリケーションで API 出力を処理します。 分析はそのままの状態で行われ、データに使用されるモデルに対して追加のカスタマイズは行われません。 言語検出を使用するには、次の 3 つの方法があります。
開発オプション | 説明 |
---|---|
Language Studio | Language Studio は Web ベースのプラットフォームであり、Azure アカウントがなければテキストの例で、サインアップしたら独自のデータで、エンティティ リンクを試すことができます。 詳しくは、Language Studio の Web サイトまたは Language Studio のクイックスタートに関する記事をご覧ください。 |
REST API またはクライアント ライブラリ (Azure SDK) | さまざまな言語で使用できる REST API、またはクライアント ライブラリを使用して、言語検出をお使いのアプリケーションに統合します。 詳細については、言語検出のクイックスタートに関するページをご覧ください。 |
Docker コンテナー | 利用できる Docker コンテナーを使って、この機能をオンプレミスに展開します。 これらの Docker コンテナーを使用すると、コンプライアンス、セキュリティ、またはその他の運用上の理由により、データにいっそう近いところにサービスを持ってくることができます。 |
責任ある AI
AI システムには、テクノロジだけでなく、それを使用することになる人、それによって影響を受けるであろう人、それが展開される環境も含まれます。 システムでの責任ある AI の使用と展開については、「言語検出の透明性に関する注意」をお読みください。 詳細については、次の記事もご覧ください。
次のステップ
エンティティ リンク設定機能を使い始めるには、2 つの方法があります。
- Language Studio はコードを記述することなく Azure AI Language のいくつかの機能を試すことができる Web ベースのプラットフォームです。
- クイックスタート記事。REST API とクライアント ライブラリ SDK を使用してサービス要求を行う方法が記載されています。