번역 합성
TranslationRecognizer는 음성 입력의 번역된 대화 내용 기록을 반환합니다. 기본적으로 들리는 음성을 텍스트로 번역합니다.
번역을 음성으로 합성하여 음성-음성 번역 솔루션을 만들 수도 있습니다. 이렇게 하려면 다음 두 가지 방법을 사용합니다.
이벤트 기반 합성
1:1 번역(한 소스 언어에서 단일 대상 언어로 번역)을 수행하려는 경우 이벤트 기반 합성을 사용하여 번역을 오디오 스트림으로 캡처할 수 있습니다. 이렇게 하려면 다음을 수행해야 합니다.
TranslationConfig에서 번역된 음성에 대한 원하는 음성을 지정합니다. TranslationRecognizer 개체의 Synthesizing 이벤트에 대한 이벤트 처리기를 만듭니다. 이벤트 처리기에서 Result 매개 변수의 GetAudio() 메서드를 사용하여 번역된 오디오의 바이트 스트림을 검색합니다. 이벤트 처리기를 구현하는 데 사용되는 특정 코드는 사용하는 프로그래밍 언어에 따라 달라집니다. Speech SDK 설명서에서 C# 및 Python 예제를 참조하세요.
수동 합성
수동 합성은 이벤트 처리기를 구현할 필요가 없는 이벤트 기반 합성의 대체 방법입니다. 수동 합성을 사용하여 하나 이상의 대상 언어에 대한 오디오 번역을 생성할 수 있습니다.
번역을 수동으로 통합하는 것은 기본적으로 다음과 같은 두 가지 별도 작업의 조합입니다.
- TranslationRecognizer를 사용하여 하나 이상의 대상 언어로 음성 입력을 텍스트 대화 내용 기록으로 번역합니다.
- SpeechSynthesizer를 사용하여 각 언어에 대한 오디오 스트림을 합성하는 번역 작업의 결과에서 번역 사전을 반복합니다.