次の方法で共有


会話で個人を識別する情報を検出して編集する

Azure AI 言語会話 PII API は、さまざまな定義済みのカテゴリを使用してオーディオの言説を分析し、機密情報 (PII) を識別して編集します。 この API は、文字起こしされたテキスト (トランスクリプトと呼ばれます) とチャットの両方で機能します。 トランスクリプトの場合、これらのセグメントのタイミング情報を提供することで、PII を含むオーディオ セグメントの再編集も容易になります。

データの処理方法を決定する (省略可能)

PII 検出モデルを指定する

既定では、この機能では、入力で使用可能な最新の AI モデルが使用されます。 特定のバージョンのモデルを使うように API 要求を構成することもできます。

サポートされている言語

詳細については、「PII 言語サポート」ページ参照してください。 現在、会話 PII GA モデルでサポートされているのは英語のみです。 プレビュー モデルと API では、他の言語サービスと同じ言語がサポートされます。

リージョンのサポート

会話 PII API では、言語サービスでサポートされているすべての Azure リージョンがサポートされています。

データの送信

入力は、会話項目のリストとして API に送信できます。 要求が受信されると分析が実行されます。 API は非同期なので、API 要求を送信してから、結果を受信するまでに、遅延が発生する可能性があります。 1 分および 1 秒あたりに送信できる要求のサイズと数については、次のデータ制限を参照してください。

非同期機能を使用すると、API の結果は要求が取り込まれた時点から 24 時間使用でき、応答に示されます。 この時間が経過すると、結果は消去され、取得できなくなります。

会話 PII にデータを送信する際には、要求ごとに 1 つの会話 (チャットまたは音声) を送信できます。

API は、特定の会話入力に対して 定義されているすべてのエンティティ カテゴリ の検出を試みます。 検出されて返されるエンティティを指定する場合は、オプションの piiCategories パラメーターを適切なエンティティ カテゴリと共に使用します。

音声トランスクリプトの場合、検出されたエンティティは、指定された redactionSource パラメーター値で返されます。 現在、 redactionSource でサポートされている値は、 textlexicalitn、および maskedItn です (それぞれ Speech からテキスト REST API の display\displayTextlexicalitn、および maskedItn 形式にマップされます)。 さらに、音声トランスクリプト入力の場合、この API はオーディオの編集を支援するためのオーディオ タイミング情報も提供します。 audioRedaction 機能を使用する場合は、省略可能な includeAudioRedaction フラグに true の値を使用します。 オーディオの編集は、字句入力形式に基づいて実行されます。

会話 PII でドキュメント サイズとして 40,000 文字がサポートされるようになりました。

PII の結果の取得

PII 検出から結果を取得するときは、結果をアプリケーションにストリーミングしたり、ローカル システム上のファイルに出力を保存したりできます。 API の応答には、認識されたエンティティと、そのカテゴリ、サブカテゴリ、信頼度スコアなどが含まれます。 PII エンティティが編集されたテキスト文字列も返されます。

例示

  1. Azure portal でリソースの概要ページに移動します

  2. 左側のメニューで [キーとエンドポイント] を選びます。 API 要求を認証するには、いずれかのキーとエンドポイントが必要です。

  3. 選択した言語のクライアント ライブラリ パッケージをダウンロードしてインストールします。

    言語 パッケージのバージョン
    .NET 1.0.0
    パイソン 1.0.0
  4. クライアントと return オブジェクトの詳細については、次のリファレンス ドキュメントを 参照してください

サービスとデータの制限

分単位および秒単位で送信できる要求のサイズと数については、サービスの制限に関する記事を参照してください。