Vertalingen synthetiseren
De TranslationRecognizer retourneert vertaalde transcripties van gesproken invoer- in wezen het vertalen van hoorbare spraak naar tekst.
U kunt de vertaling ook omzetten als spraak om oplossingen voor spraak-naar-spraakomzetting te maken. U kunt dit op twee manieren doen.
Op gebeurtenissen gebaseerde synthese
Als u 1:1-vertaling wilt uitvoeren (vertalen van één brontaal in één doeltaal), kunt u op gebeurtenissen gebaseerde synthese gebruiken om de vertaling vast te leggen als een audiostream. Hiervoor doet u het volgende:
Geef de gewenste stem op voor de vertaalde spraak in TranslationConfig. Maak een gebeurtenis-handler voor de Synthesizing-gebeurtenis van het Object TranslationRecognizer. Gebruik in de gebeurtenis-handler de methode GetAudio() van de parameter Result om de bytestroom van vertaalde audio op te halen. De specifieke code die wordt gebruikt voor het implementeren van een gebeurtenis-handler, is afhankelijk van de programmeertaal die u gebruikt. Zie de C# - en Python-voorbeelden in de Speech SDK-documentatie.
Handmatige synthese
Handmatige synthese is een alternatieve benadering van op gebeurtenissen gebaseerde synthese waarvoor u geen gebeurtenis-handler hoeft te implementeren. U kunt handmatige synthese gebruiken om audio-vertalingen te genereren voor een of meer doeltalen.
Handmatige synthese van vertalingen is in feite alleen de combinatie van twee afzonderlijke bewerkingen waarin u:
- Gebruik een TranslationRecognizer om gesproken invoer in teksttranscripties in een of meer doeltalen te vertalen.
- Doorloop de woordenlijst Vertalingen in het resultaat van de vertaalbewerking met behulp van een SpeechSynthesizer om een audiostroom voor elke taal te synthetiseren.