오디오 형식 및 음성 구성하기
음성을 합성할 때 SpeechConfig 개체를 사용하여 Azure AI 음성 서비스에서 반환되는 오디오를 사용자 지정할 수 있습니다.
오디오 형식
Azure AI 음성 서비스는 음성 합성으로 생성된 오디오 스트림에 대한 여러 출력 형식을 지원합니다. 구체적인 요구 사항에 따라 필요한 형식을 선택할 수 있습니다.
- 오디오 파일 형식
- 샘플 속도
- 비트 수준
지원되는 형식은 SpeechSynthesisOutputFormat 열거형을 사용하여 SDK에 나와 있습니다. 예: SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm
필요한 출력 형식을 지정하려면 SpeechConfig 개체의 SetSpeechSynthesisOutputFormat 메서드를 사용합니다.
speechConfig.SetSpeechSynthesisOutputFormat(SpeechSynthesisOutputFormat.Riff24Khz16BitMonoPcm);
지원되는 형식과 해당 열거형 값의 전체 목록은 Azure AI 음성 SDK 설명서를 참조하세요.
음성
Azure AI 음성 서비스는 음성 지원 애플리케이션을 개인 설정하는 데 사용할 수 있는 여러 음성을 제공합니다. 사용할 수 있는 음성에는 두 가지가 있습니다.
- 표준 음성 - 오디오 샘플에서 생성된 합성 음성
- 신경망 음성 - 심층 신경망을 사용하여 생성된 더욱 자연스러운 음성
음성은 로캘과 사람 이름을 나타내는 이름으로 식별됩니다(예: en-GB-George
).
SpeechConfig에서 음성 합성을 위한 음성을 지정하려면 SpeechSynthesisVoiceName 속성을 사용하려는 음성으로 설정합니다.
speechConfig.SpeechSynthesisVoiceName = "en-GB-George";
음성에 대한 자세한 내용은 Azure AI 음성 SDK 설명서를 참조하세요.