오디오 형식 및 음성 구성하기

음성을 합성할 때 SpeechConfig 개체를 사용하여 Azure AI 음성 서비스에서 반환되는 오디오를 사용자 지정할 수 있습니다.

오디오 형식

Azure AI 음성 서비스는 음성 합성으로 생성된 오디오 스트림에 대한 여러 출력 형식을 지원합니다. 구체적인 요구 사항에 따라 필요한 형식을 선택할 수 있습니다.

지원되는 형식은 SpeechSynthesisOutputFormat 열거형을 사용하여 SDK에 나와 있습니다. 예: SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm

필요한 출력 형식을 지정하려면 SpeechConfig 개체의 SetSpeechSynthesisOutputFormat 메서드를 사용합니다.

speechConfig.SetSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm);

지원되는 형식과 해당 열거형 값의 전체 목록은 Azure AI 음성 SDK 설명서를 참조하세요.

Azure AI 음성 서비스는 음성 지원 애플리케이션을 개인 설정하는 데 사용할 수 있는 여러 음성을 제공합니다. 사용할 수 있는 음성에는 두 가지가 있습니다.

음성은 로캘과 사람 이름을 나타내는 이름으로 식별됩니다(예: en-GB-George).

SpeechConfig에서 음성 합성을 위한 음성을 지정하려면 SpeechSynthesisVoiceName 속성을 사용하려는 음성으로 설정합니다.

speechConfig.SpeechSynthesisVoiceName = "en-GB-George";

음성에 대한 자세한 내용은 Azure AI 음성 SDK 설명서를 참조하세요.