Syntetizování překladů
Funkce TranslationRecognizer vrátí přeložené přepisy mluveného vstupu – v podstatě překládání zvuku na text.
Překlad můžete také syntetizovat jako řeč a vytvářet řešení překladu řeči na řeč. Existují dva způsoby, jak toho dosáhnout.
Syntéza založená na událostech
Pokud chcete provést překlad 1:1 (překlad z jednoho zdrojového jazyka do jednoho cílového jazyka), můžete použít syntézu založenou na událostech k zachycení překladu jako zvukového streamu. Budete muset:
Zadejte požadovaný hlas pro přeloženou řeč v příkazu TranslationConfig. Vytvořte obslužnou rutinu události pro událost Synthesizing objektu TranslationRecognizer. V obslužné rutině události použijte metodu GetAudio() parametru Result k načtení bajtového streamu přeloženého zvuku. Konkrétní kód použitý k implementaci obslužné rutiny události se liší v závislosti na programovacím jazyce, který používáte. Příklady jazyka C# a Python najdete v dokumentaci k sadě Speech SDK.
Ruční syntéza
Ruční syntéza je alternativní přístup k syntéze založené na událostech, která nevyžaduje implementaci obslužné rutiny události. Ruční syntézu můžete použít ke generování překladů zvuku pro jeden nebo více cílových jazyků.
Ruční syntéza překladů je v podstatě jen kombinací dvou samostatných operací, ve kterých:
- Pomocí funkce TranslationRecognizer můžete přeložit mluvený vstup do přepisů textu v jednom nebo více cílových jazycích.
- Iterujte prostřednictvím slovníku Translations ve výsledku operace překladu pomocí speechSynthesizer syntetizovat zvukový stream pro každý jazyk.