Syntetizování překladů

Dokončeno

Funkce TranslationRecognizer vrátí přeložené přepisy mluveného vstupu – v podstatě překládání zvuku na text.

Překlad můžete také syntetizovat jako řeč a vytvářet řešení překladu řeči na řeč. Existují dva způsoby, jak toho dosáhnout.

Syntéza založená na událostech

Pokud chcete provést překlad 1:1 (překlad z jednoho zdrojového jazyka do jednoho cílového jazyka), můžete použít syntézu založenou na událostech k zachycení překladu jako zvukového streamu. Budete muset:

Zadejte požadovaný hlas pro přeloženou řeč v příkazu TranslationConfig. Vytvořte obslužnou rutinu události pro událost Synthesizing objektu TranslationRecognizer. V obslužné rutině události použijte metodu GetAudio() parametru Result k načtení bajtového streamu přeloženého zvuku. Konkrétní kód použitý k implementaci obslužné rutiny události se liší v závislosti na programovacím jazyce, který používáte. Příklady jazyka C# a Python najdete v dokumentaci k sadě Speech SDK.

Ruční syntéza

Ruční syntéza je alternativní přístup k syntéze založené na událostech, která nevyžaduje implementaci obslužné rutiny události. Ruční syntézu můžete použít ke generování překladů zvuku pro jeden nebo více cílových jazyků.

Ruční syntéza překladů je v podstatě jen kombinací dvou samostatných operací, ve kterých:

  1. Pomocí funkce TranslationRecognizer můžete přeložit mluvený vstup do přepisů textu v jednom nebo více cílových jazycích.
  2. Iterujte prostřednictvím slovníku Translations ve výsledku operace překladu pomocí speechSynthesizer syntetizovat zvukový stream pro každý jazyk.