Syntetizování překladů

3 min

Funkce TranslationRecognizer vrátí přeložené přepisy mluveného vstupu – v podstatě překládání zvuku na text.

Překlad můžete také syntetizovat jako řeč a vytvářet řešení překladu řeči na řeč. Existují dva způsoby, jak toho dosáhnout.

Syntéza založená na událostech

Pokud chcete provést překlad 1:1 (překlad z jednoho zdrojového jazyka do jednoho cílového jazyka), můžete použít syntézu založenou na událostech k zachycení překladu jako zvukového streamu. Budete muset:

Zadejte požadovaný hlas pro přeloženou řeč v příkazu TranslationConfig. Vytvořte obslužnou rutinu události pro událost Synthesizing objektu TranslationRecognizer. V obslužné rutině události použijte metodu GetAudio() parametru Result k načtení bajtového streamu přeloženého zvuku. Konkrétní kód použitý k implementaci obslužné rutiny události se liší v závislosti na programovacím jazyce, který používáte. Příklady jazyka C# a Python najdete v dokumentaci k sadě Speech SDK.

Ruční syntéza

Ruční syntéza je alternativní přístup k syntéze založené na událostech, která nevyžaduje implementaci obslužné rutiny události. Ruční syntézu můžete použít ke generování překladů zvuku pro jeden nebo více cílových jazyků.

Ruční syntéza překladů je v podstatě jen kombinací dvou samostatných operací, ve kterých:

Pomocí funkce TranslationRecognizer můžete přeložit mluvený vstup do přepisů textu v jednom nebo více cílových jazycích.
Iterujte prostřednictvím slovníku Translations ve výsledku operace překladu pomocí speechSynthesizer syntetizovat zvukový stream pro každý jazyk.

Syntetizování překladů

Syntéza založená na událostech

Ruční syntéza

Váš názor