오디오 형식 및 음성 구성하기

완료됨

음성을 합성할 때 SpeechConfig 개체를 사용하여 Azure AI 음성 서비스에서 반환되는 오디오를 사용자 지정할 수 있습니다.

오디오 형식

Azure AI 음성 서비스는 음성 합성으로 생성된 오디오 스트림에 대한 여러 출력 형식을 지원합니다. 구체적인 요구 사항에 따라 필요한 형식을 선택할 수 있습니다.

  • 오디오 파일 형식
  • 샘플 속도
  • 비트 수준

지원되는 형식은 SpeechSynthesisOutputFormat 열거형을 사용하여 SDK에 나와 있습니다. 예: SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm

필요한 출력 형식을 지정하려면 SpeechConfig 개체의 SetSpeechSynthesisOutputFormat 메서드를 사용합니다.

speechConfig.SetSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm);

지원되는 형식과 해당 열거형 값의 전체 목록은 Azure AI 음성 SDK 설명서를 참조하세요.

음성

Azure AI 음성 서비스는 음성 지원 애플리케이션을 개인 설정하는 데 사용할 수 있는 여러 음성을 제공합니다. 사용할 수 있는 음성에는 두 가지가 있습니다.

  • 표준 음성 - 오디오 샘플에서 생성된 합성 음성
  • 신경망 음성 - 심층 신경망을 사용하여 생성된 더욱 자연스러운 음성

음성은 로캘과 사람 이름을 나타내는 이름으로 식별됩니다(예: en-GB-George).

SpeechConfig에서 음성 합성을 위한 음성을 지정하려면 SpeechSynthesisVoiceName 속성을 사용하려는 음성으로 설정합니다.

speechConfig.SpeechSynthesisVoiceName = "en-GB-George";

음성에 대한 자세한 내용은 Azure AI 음성 SDK 설명서를 참조하세요.