プロフェッショナルな音声プロジェクトにボイスタレントの同意を追加する

[アーティクル]
10/16/2024

ボイスタレントは個人または対象話者であり、その音声が録音され、ニューラル音声モデルの作成に使用されます。

ニューラル音声をトレーニングする前に、ボイスタレントの同意ステートメントの録音を送信する必要があります。ボイスタレントステートメントは、音声データを使用してカスタム音声モデルをトレーニングすることに同意するステートメントを読み上げるボイスタレントの録音です。同意ステートメントは、ボイスタレントがトレーニングデータの話者と同じ人物であることを確認するためにも使用されます。

ヒント

Speech Studio で作業を開始する前に、音声ペルソナを定義し、適切なボイスタレントを選択します。

複数の言語のボイスタレントの同意ステートメントを、GitHub で入手できます。口頭によるステートメントの言語は、録音の言語と同じである必要があります。「ボイスタレント向けの開示」も参照してください。

ボイスタレントの追加

ボイスタレントプロファイルを追加し、同意ステートメントをアップロードするには、次の手順に従います。

Speech Studio にサインインします。
[Custom Voice]> [プロジェクト名] >[ボイスタレントの設定]>[ボイスタレントの追加] の順に選択します。
[新しいボイスタレントの追加] ウィザードで、作成する音声の特性について説明します。ここで指定するシナリオは、アプリケーションフォームで指定したシナリオと一致している必要があります。
[次へ] を選択します。
[ボイスタレントステートメントのアップロード] ページで、指示に従って、事前に録音したボイスタレントステートメントをアップロードします。ボイスタレントステートメントが、トレーニングデータと同じ設定、環境、話し方で録音されていることを確認します。
ボイスタレント名と会社名を入力します。ボイスタレント名は、同意ステートメントを録音した人の名前である必要があります。録音されたステートメントで使用されたのと同じ言語で名前を入力します。会社名は、録音されたステートメントで読み上げられた会社名と一致する必要があります。会社名が録音されたステートメントと同じ言語で入力されていることを確認します。
[次へ] を選択します。
ボイスタレントとペルソナの詳細を確認し、[送信] を選択します。

ボイスタレントのステータスが [成功] になったら、カスタム音声モデルのトレーニングに進むことができます。

次のステップ

プロフェッショナルな音声プロジェクトにトレーニングデータを追加する

Professional Voice 機能では、すべての音声がユーザーの明示的な同意のもとに作成される必要があります。お客様 (Azure AI Speech リソース所有者) が自身の音声を作成および使用することに同意する、ユーザーの録音されたステートメントが必要です。

プロフェッショナルな音声プロジェクトにボイスタレントの同意を追加するには、パブリックにアクセスできる URL (Consents_Create) から事前に録音された同意のオーディオファイルを取得するか、オーディオファイル (Consents_Post) をアップロードします。この記事では、URL から同意を追加します。

ユーザーが同意ステートメントを読んでいる音声の録音が必要です。

各ロケールの同意ステートメントテキストは、GitHub のテキスト読み上げリポジトリから取得できます。 en-US ロケールの同意ステートメントについては、SpeakerAuthorization.txt を参照してください。

"I  [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

オーディオファイルの URL からプロフェッショナルな音声プロジェクトに同意を追加するには、Custom Voice API の Consents_Create 操作を使用します。次の手順に従って要求本文を作成します。

必須の projectId プロパティを設定します。プロジェクトの作成に関する記事を参照してください。
必須の voiceTalentName プロパティを設定します。ボイスタレント名は、同意ステートメントを録音した人の名前である必要があります。録音されたステートメントで使用されたのと同じ言語で名前を入力します。ボイスタレント名を後から変更することはできません。
必須の companyName プロパティを設定します。会社名は、録音されたステートメントで読み上げられた会社名と一致する必要があります。会社名が録音されたステートメントと同じ言語で入力されていることを確認します。会社名を後から変更することはできません。
必須の audioUrl プロパティを設定します。ボイスタレントの同意オーディオファイルの URL。 Shared Access Signature (SaS) トークンを含む URI を使用します。
必須の locale プロパティを設定します。これは、同意のロケールにする必要があります。ロケールを後から変更することはできません。テキスト読み上げロケールの一覧はこちらにあります。

次の Consents_Create の例に示したように URI を使用して HTTP PUT 要求を行います。

YourResourceKey をSpeech リソースキーに置き換えます。
YourResourceRegion を Speech リソースリージョンに置き換えます。
JessicaConsentId を任意の同意 ID に置き換えます。大文字と小文字を区別する ID が同意の URI で使用され、後で変更することはできません。

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

次の形式で応答本文を受け取る必要があります。

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

応答ヘッダーに Operation-Location プロパティが含まれています。この URI を使用して、Consents_Create 操作の詳細を取得します。応答ヘッダーの例を次に示します。

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

次のステップ

プロフェッショナルな音声プロジェクトにトレーニングデータを追加する

次の方法で共有

ボイスタレントの追加

次のステップ

次のステップ

フィードバック

その他のリソース

次の方法で共有

プロフェッショナルな音声プロジェクトにボイス タレントの同意を追加する

ボイス タレントの追加

次のステップ

同意書

URL から同意を追加する

次のステップ

フィードバック

その他のリソース

ボイスタレントの追加