Volba technologie rozpoznávání a generování řeči Azure AI
Služby Azure AI pomáhají návrhářům úloh a vývojářům vytvářet inteligentní, nejmodernější, připravené a zodpovědné aplikace s předem připravenými a předem připravenými a přizpůsobitelnými rozhraními API a modely.
Tento článek se zabývá službami Azure AI, které nabízejí možnosti rozpoznávání řeči a generování, jako jsou převody řeči na text a převod textu na řeč, překlad zvuku, rozpoznávání mluvčího a podpora čtení pro lidi s rozdíly ve učení.
Poznámka:
Pokud chcete získat přehled o termínech nebo frázích nebo získat podrobnou kontextovou analýzu mluveného nebo psaného jazyka, přečtěte si téma Volba technologie zpracování jazyka cílená na Azure AI.
Služby
Následující služby Azure AI mohou poskytovat funkce rozpoznávání řeči a generování pro vaši úlohu.
Azure AI Speech poskytuje zpracování přirozeného jazyka pro analýzu textu.
- Službu Speech použijte , když potřebujete přepsat nebo přeložit mluvenou řeč, identifikovat mluvčí v konverzaci. Službu můžete také použít jako nižší alternativu pro generování přirozeného zvuku řeči na vyšší kvalitu Šeptání v modelech OpenAI.
- Nepoužívejte službu Speech pro chat, sumarizaci obsahu, moderování ani uživatele prostřednictvím skriptů. Místo toho používejte jiné modely.
Asistivní čtečka je nástroj, který implementuje osvědčené techniky pro zlepšení porozumění čtení pro nově vznikající čtenáře, jazykové učení a lidi s rozdíly ve učení.
- Využijte Asistivní čtečka k zajištění lepší čitelnosti přizpůsobeného jazykovým učením nebo lidem s rozdíly ve studiu.
- Nepoužívejte Asistivní čtečka pro tradiční případy použití textu na řeč.
Azure AI Speech
Azure AI Speech poskytuje funkce převodu řeči na text a text na řeč pomocí prostředku služby Speech. Převod řeči na text s vysokou přesností, vytváření přirozeného zvuku na hlasy řeči, překlad mluveného zvuku a rozpoznávání mluvčího během konverzací. Můžete vytvořit vlastní hlasy, přidat konkrétní slova do základního slovníku nebo sestavit vlastní modely. Službu Speech můžete provozovat kdekoli – v cloudu nebo v kontejnerech na hraničních zařízeních.
Řeč je dostupná pro mnoho jazyků a oblastí.
Možnosti
Následující tabulka obsahuje seznam funkcí dostupných ve službě Azure AI Speech.
Schopnost | Popis |
---|---|
Dávkový přepis | Přepište velké množství zvukových dat v úložišti. Rozhraní REST API pro převod řeči na text i rozhraní příkazového řádku služby Speech podporují dávkový přepis. |
Rozpoznávání záměru | Záměr je něco, co chce uživatel udělat: rezervovat si let, ověřit počasí nebo si zavolat. Díky rozpoznávání záměru můžou vaše aplikace, nástroje a zařízení určit, co chce uživatel iniciovat nebo dělat na základě možností. Záměr uživatele definujete v modelu rozpoznávání záměru nebo v modelu CLU (Conversational Language Understanding). |
Posouzení výslovnosti | Vyhodnocuje výslovnost řeči a dává mluvčím zpětnou vazbu ohledně přesnosti a plynulosti mluveného zvuku. |
Rozpoznávání mluvčího | Rozpoznávání mluvčího může pomoct určit, kdo mluví ve zvukovém klipu. Služba může ověřovat a identifikovat mluvčí podle jejich jedinečných hlasových charakteristik pomocí hlasové biometry. |
Převod řeči na text | Převede zvukové streamy na text v reálném čase nebo v dávce. |
Převod textu na řeč | Umožňuje vašim aplikacím, nástrojům nebo zařízením převést text na syntetizovaný řeč podobný člověku. |
Překlad řeči | Poskytuje překlad zvukových streamů na řeč ve více jazycích a převod řeči na text. |
Překlad videa | Automaticky překládat a generovat videa ve více jazycích |
Případy použití
Následující tabulka popisuje některé způsoby použití služby Azure AI Speech.
Případ použití | Možnost použití | Popis |
---|---|---|
Vytváření zvukového obsahu | Převod řeči na text | Neurální hlasy můžete použít k tomu, aby byly interakce s chatovacími roboty a hlasovými asistenty přirozenější a poutavější, převádět digitální texty, jako jsou elektronické knihy, na audioknihy a vylepšit navigační systémy v autě. |
Přepis call centra | Převod řeči na text | Přepis volání v reálném čase nebo zpracování dávky volání, úpravy osobních identifikačních informací a extrakce přehledů, jako je mínění, které vám pomůžou s případem použití call centra. |
Titulkování | Převod řeči na text | Synchronizujte titulky se vstupním zvukem, použijte filtry vulgárních výrazů, získejte částečné výsledky, použijte vlastní nastavení a identifikujte mluvené jazyky pro vícejazyčné scénáře. |
Jazykové učení | Převod řeči na text | Poskytovat zpětnou vazbu k hodnocení výslovnosti posluchačům jazyků, podporovat přepis v reálném čase pro konverzace na dálku a číst nahlas výukové materiály s neurálními hlasy. |
Hlasoví asistenti | Převod textu na řeč | Vytvářejte přirozené konverzační rozhraní, jako jsou konverzační rozhraní pro své aplikace a prostředí. Funkce hlasového asistenta poskytuje rychlou a spolehlivou interakci mezi zařízením a implementací asistenta. |
Asistivní čtečka
Asistivní čtečka, součást služeb Azure AI, je inkluzivní navržený nástroj, který implementuje osvědčené techniky ke zlepšení porozumění čtení pro nové čtenáře, jazykové učení a lidi s rozdíly ve učení, jako je dyslexie. S klientskou knihovnou Asistivní čtečka můžete použít stejnou technologii jako v Microsoft Wordu a Microsoft OneNotu, abyste uživatelům vaší úlohy poskytli skvělé prostředí.
Možnosti
Následuje seznam funkcí, které vaše úloha může použít k tomu, aby uživatelé dosáhli cílů porozumění čtení.
- Izolace obsahu za účelem zlepšení čitelnosti
- Zobrazení obrázků pro běžná slova a termíny
- Pomoc s pochopením slovních částí a gramatiky zvýrazněním sloves, podstatných jmen, výslovných jmen a dalších
- Čtení obsahu nahlas, například vybraný text uživatelem v uživatelském rozhraní vaší úlohy
- Překlad obsahu do mnoha jazyků v reálném čase, což pomáhá zlepšit porozumění čtenářům, kteří se učí nový jazyk
- Rozdělení slov na slabiky za účelem zlepšení čitelnosti nebo zvuku nových slov
Další kroky
- Co je služba Speech?
- Studijní program: Vývoj řešení pro zpracování přirozeného jazyka pomocí služeb Azure AI