Kvóty a omezení služby Speech

Článek
09/27/2024

Tento článek obsahuje stručný přehled a podrobný popis kvót a omezení služby Speech ve službách Azure AI. Informace platí pro všechny cenové úrovně služby. Obsahuje také některé osvědčené postupy, které brání omezování požadavků.

Informace o cenové úrovni Free (F0) najdete také na stránce s cenami měsíčních povolenek.

Referenční informace o kvótách a omezeních

V následujících částech najdete stručný průvodce kvótami a omezeními, které platí pro službu Speech.

Informace o upravitelných kvótách pro prostředky služby Speech úrovně Standard (S0) najdete v dalších vysvětleních, osvědčených postupech a pokynech k úpravám. Kvóty a limity pro prostředky služby Speech free (F0) se nedají upravovat.

Důležité

Pokud přepnete prostředek služby Speech z úrovně Free (F0) na cenovou úroveň Standard (S0), může změna odpovídajících kvót trvat až několik hodin.

Kvóty a omezení převodu řeči na text na prostředek

Tato část popisuje kvóty řeči na text a omezení pro prostředek služby Speech. Pokud není uvedeno jinak, limity se nedají upravit.

Převod řeči na text a řeč v reálném čase

Pomocí sady Speech SDK nebo rozhraní REST API pro převod řeči na text v reálném čase můžete použít krátký zvuk .

Důležité

Tato omezení platí pro souběžnou řeč v reálném čase na požadavky na text a kombinované požadavky na překlad řeči. Pokud máte například 60 souběžných žádostí o převod řeči na text a 40 souběžných žádostí o překlad řeči, dosáhnete limitu 100 souběžných požadavků.

Kvóta	Free (F0)	Standard (S0)
Limit souběžných požadavků – koncový bod základního modelu	1 Tento limit není možné upravit.	100 (výchozí hodnota) Rychlost je nastavitelná pro prostředky standardu (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám.
Limit souběžných požadavků – vlastní koncový bod	1 Tento limit není možné upravit.	100 (výchozí hodnota) Rychlost je nastavitelná pro prostředky standardu (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám.
Maximální délka zvuku pro diarizaci v reálném čase	–	240 minut na soubor

Rychlý přepis

Kvóta	Free (F0)	Standard (S0)
Maximální velikost zvukového vstupního souboru	–	200 MB
Maximální délka zvuku	–	120 minut na soubor
Maximální počet požadavků za minutu	–	600

Dávkový přepis

Kvóta	Free (F0)	Standard (S0)
Omezení rozhraní REST API pro převod řeči na text	Není k dispozici pro F0	100 požadavků za 10 sekund (600 požadavků za minutu)
Maximální velikost zvukového vstupního souboru	–	1 GB
Maximální počet objektů blob na kontejner	–	10000
Maximální počet souborů na žádost o přepis (pokud jako vstup používáte více adres URL obsahu).	–	1000
Maximální délka zvuku pro přepisy s povolenou diarizací	–	240 minut na soubor

Přizpůsobení modelu

Omezení v této tabulce platí pro prostředek služby Speech při vytváření vlastního modelu řeči.

Kvóta	Free (F0)	Standard (S0)
Limit rozhraní REST API	100 požadavků za 10 sekund (600 požadavků za minutu)	100 požadavků za 10 sekund (600 požadavků za minutu)
Maximální počet nasazení vlastních modelů na prostředek služby Speech	0	50
Maximální počet datových sad řeči	2	500
Maximální velikost souboru datové sady acoustic pro import dat	2 GB	2 GB
Maximální velikost souboru datové sady jazyka pro import dat	200 MB	1.5 GB
Maximální velikost souboru datové sady výslovnosti pro import dat	1 kB	1 MB
Maximální velikost textu při použití parametru `text`v požadavku rozhraní API Models_Create	200 kB	500 kB

Kvóty a omezení převodu textu na řeč na prostředek

Tato část popisuje kvóty řeči a omezení textu na prostředek služby Speech.

Převod textu na řeč v reálném čase

Text v reálném čase můžete použít ke zpracování řeči pomocí sady Speech SDK nebo rozhraní REST API pro převod textu na řeč. Pokud není uvedeno jinak, limity se nedají upravit.

Kvóta	Free (F0)	Standard (S0)
Maximální počet transakcí za časové období pro předem připravené neurální hlasy a vlastní neurální hlasy.	20 transakcí za 60 sekund Tento limit není možné upravit.	200 transakcí za sekundu (TPS) (výchozí hodnota) Rychlost je nastavitelná až 1 000 TPS pro prostředky standardu (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám.
Maximální délka zvuku vytvořená na požadavek	10 minut	10 minut
Maximální celkový počet jedinečných `<voice>` a `<audio>` značek v SSML	50	50
Maximální velikost zprávy SSML na turn for websocket	64 kB	64 kB

Dávkové syntézy

Tato omezení se nedají upravit. Další informace o latenci syntézy dávek najdete v tématu o latenci syntézy dávek a osvědčených postupech.

Kvóta	Free (F0)	Standard (S0)
Limit rozhraní REST API	Není k dispozici pro F0	100 požadavků za 10 sekund
Maximální velikost datové části JSON pro vytvoření úlohy syntézy	–	2 megabajty
Souběžné aktivní úlohy syntézy	–	Bez omezení
Maximální počet textových vstupů na úlohu syntézy	–	10000
Max time to live for a synthesis job since it being in the final state	–	Až 31 dní (zadané pomocí vlastností)

Vlastní neurální hlas – profesionální

Omezení v této tabulce platí pro prostředek služby Speech při vytváření profesionálního vlastního neurálního hlasového modelu.

Kvóta	Free (F0)	Standard (S0)
Maximální počet transakcí za sekundu (TPS)	Není k dispozici pro F0	200 transakcí za sekundu (TPS) (výchozí hodnota)
Maximální počet datových sad	–	500
Maximální počet nahrání souběžných datových sad	–	5
Maximální velikost datového souboru pro import dat na datovou sadu	–	2 GB
Nahrávání dlouhého zvuku nebo zvuku bez skriptu	–	Ano
Maximální počet souběžných trénování modelů	–	4
Maximální počet vlastních koncových bodů	–	50

Vlastní neurální hlas – osobní hlas

Omezení v této tabulce platí pro prostředek služby Speech při vytváření osobního hlasu.

Kvóta	Free (F0)	Standard (S0)
Limit rozhraní REST API (nezahrnuje syntézu řeči)	Není k dispozici pro F0	50 požadavků za 10 sekund
Maximální počet transakcí za sekundu (TPS) pro syntézu řeči	Není k dispozici pro F0	200 transakcí za sekundu (TPS) (výchozí hodnota)

Batch text to speech avatar

Kvóta	Free (F0)	Standard (S0)
Limit rozhraní REST API	Není k dispozici pro F0	2 žádosti za 1 minutu

Avatar převodu textu na řeč v reálném čase

Kvóta	Free (F0)	Standard (S0)
Nová připojení za minutu	Není k dispozici pro F0	2 nová připojení za minutu
Maximální doba trvání připojení s mluvením	Není k dispozici pro F0	20 minut¹
Maximální doba trvání připojení se stavem nečinnosti	Není k dispozici pro F0	5 minut

¹ Chcete-li zajistit nepřetržitou provoz avatara v reálném čase po dobu více než 20 minut, můžete povolit automatické opětovné připojení. Informace o nastavení automatického opětovného připojení najdete v tomto vzorovém kódu (vyhledejte "automatické opětovné připojení").

Nástroj pro vytváření zvukového obsahu

Kvóta	Free (F0)	Standard (S0)
Velikost souboru (prostý text v SSML)¹	3 000 znaků na soubor	20 000 znaků na soubor
Velikost souboru (lexicon soubor)²	30 kB na soubor	100 kB na soubor
Fakturovatelné znaky v SSML	15 000 znaků na soubor	100 000 znaků na soubor
Export do zvukové knihovny	1 souběžná úloha	–

¹ Omezení platí jenom pro prostý text v SSML a neobsahuje značky.

² Znaky souboru lexicon se neúčtují. Jako fakturovatelné znaky se počítají pouze prvky lexikonu v SSML. Další informace najdete v fakturovatelných znamech .

Kvóty a omezení rozpoznávání mluvčího na prostředek

Rozpoznávání mluvčího je omezené na 20 transakcí za sekundu (TPS).

Podrobný popis, úprava kvóty a osvědčené postupy

Některé kvóty služby Speech se dají upravit. Tato část obsahuje další vysvětlení, osvědčené postupy a pokyny k úpravám.

Následující kvóty se dají upravit pro prostředky standardu (S0). Limity požadavků Free (F0) se nedají upravit.

Limit souběžných požadavků na převod řeči na text pro koncový bod základního modelu a vlastní koncový bod
Maximální počet transakcí převodu textu na řeč za časové období pro předem připravené neurální hlasy a vlastní neurální hlasy
Limit souběžných požadavků překladu řeči

Před vyžádáním navýšení kvóty (pokud je to možné) zkontrolujte aktuální tps (transakce za sekundu) a ujistěte se, že je nutné kvótu zvýšit. Služba Speech používá technologie automatického škálování k přenesení požadovaných výpočetních prostředků do režimu na vyžádání. Služba Speech se současně snaží zachovat nízké náklady tím, že neudržuje nadměrnou kapacitu hardwaru.

Podívejme se na příklad. Předpokládejme, že vaše aplikace obdrží kód odpovědi 429, což znamená, že existuje příliš mnoho požadavků. Vaše aplikace obdrží tuto odpověď, i když vaše úloha spadá do limitů definovaných referenčními kvótami a limity. Nejpravděpodobnějším vysvětlením je, že služba Speech se škáluje na vaši poptávku a ještě nedosahovala požadovaného škálování. Služba proto nemá okamžitě dostatek prostředků pro obsluhu požadavku. V takových případech nepomůže zvýšení kvóty. Ve většině případů se služba Speech brzy vertikálně navýší a problém způsobující, že se vyřeší kód odpovědi 429.

Obecné osvědčené postupy pro zmírnění omezování během automatického škálování

Pokud chcete minimalizovat problémy související s omezováním, je vhodné použít následující techniky:

Implementujte do své aplikace logiku opakování pokusů.
Pokuste se předcházet prudkým výkyvům zatížení. Zvyšujte zatížení postupně. Řekněme například, že vaše aplikace používá převod textu na řeč a vaše aktuální úloha je 5 TPS. Další sekundu zvýšíte zatížení na 20 TPS (to znamená čtyřikrát více). Služba Speech okamžitě začne vertikálně navýšit kapacitu, aby splnila nové zatížení, ale během jedné sekundy se nemůže škálovat podle potřeby. Některé požadavky získají kód odpovědi 429 (příliš mnoho požadavků).
Otestujte různé vzorce zvýšení zatížení. Další informace najdete v příkladu vzoru úloh.
Vytvářejte více prostředků služby Speech v různých oblastech a distribuujte mezi ně úlohy. (Vytvoření více prostředků služby Speech ve stejné oblasti neovlivní výkon, protože všechny prostředky obsluhují stejný back-endový cluster).

Další části popisují konkrétní případy úprav kvót.

Převod řeči na text: Zvýšení limitu počtu souběžných požadavků v reálném čase

Ve výchozím nastavení je počet souběžných požadavků na převod řeči v reálném čase na text a překlad řeči omezený na 100 na prostředek v základním modelu a 100 na vlastní koncový bod ve vlastním modelu. U cenové úrovně Standard můžete tuto částku zvýšit. Před odesláním žádosti se ujistěte, že znáte materiály, které jsou popsány dříve v tomto článku, jako jsou osvědčené postupy pro zmírnění omezování.

Poznámka:

Souběžné limity požadavků pro základní a vlastní modely je potřeba upravit samostatně. Můžete mít prostředek služby Speech, který je přidružený k mnoha vlastním koncovým bodům hostujícím mnoho vlastních nasazení modelu. Podle potřeby je potřeba požádat o úpravy limitu pro každý vlastní koncový bod samostatně.

Zvýšení limitu souběžných požadavků nemá přímý vliv na vaše náklady. Služba Speech používá platební model, který vyžaduje, abyste zaplatili jenom za to, co používáte. Limit definuje, jak vysoká může služba škálovat, než začne omezovat vaše požadavky.

Na webu Azure Portal, v nástrojích příkazového řádku nebo požadavcích rozhraní API se nezobrazuje stávající hodnota parametru limitu souběžných požadavků. Pokud chcete ověřit existující hodnotu, vytvořte požadavek podpora Azure.

Poznámka:

Kontejnery služby Speech nevyžadují zvýšení limitu souběžných požadavků, protože kontejnery jsou omezené pouze procesory hardwaru, na které jsou hostované. Kontejnery služby Speech ale mají svá vlastní omezení kapacity, která by se měla vzít v úvahu. Další informace najdete v nejčastějších dotazech ke kontejnerům služby Speech.

Připravte požadované informace.

Základní model:
- ID prostředku služby Speech
- Oblast
Pro vlastní model:
- Oblast
- ID vlastního koncového bodu

Získání informací pro základní model:

Přejděte na Azure Portal.
Vyberte prostředek služby Speech, pro který chcete zvýšit limit požadavků na souběžnost.
Ve skupině Správa prostředků vyberte Vlastnosti.
Zkopírujte a uložte hodnoty následujících polí:
- ID prostředku
- Umístění (oblast koncového bodu)

Jak získat informace pro vlastní model:

Přejděte na portál sady Speech Studio .
V případě potřeby se přihlaste a přejděte na Vlastní řeč.
Vyberte projekt a přejděte na Nasazení.
Vyberte požadovaný koncový bod.
Zkopírujte a uložte hodnoty následujících polí:
- Oblast služby (oblast koncového bodu)
- ID koncového bodu

Vytvoření a odeslání žádosti o podporu

Spusťte zvýšení limitu pro souběžné žádosti o prostředek nebo v případě potřeby zkontrolujte aktuální limit odesláním žádosti o podporu. Postupujte následovně:

Ujistěte se, že máte požadované informace uvedené v předchozí části.
Přejděte na Azure Portal.
Vyberte prostředek služby Speech, pro který chcete zvýšit (nebo zkontrolovat) limit žádosti o souběžnost.
Ve skupině Podpora a řešení potíží vyberte Možnost Nová žádost o podporu. Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
V souhrnu popište, co chcete (například "Zvýšení limitu požadavků na souběžnost řeči na text").
V části Typ problému vyberte Problémy s kvótou nebo předplatným.
V podtypu Problém vyberte:
- Navýšení kvóty nebo souběžných požadavků na žádost o zvýšení
- Ověření kvóty nebo využití ke kontrole stávajícího limitu
Vyberte Další: Řešení. Pokračujte ve vytváření žádosti.
Na kartě Podrobnosti zadejte do pole Popis následující:
- Všimněte si, že požadavek se týká kvóty řeči na text.
- Zvolte základní nebo vlastní model.
- Informace o prostředcích Azure, které jste shromáždili dříve.
- Všechny další požadované informace.
Na kartě Revize a vytvoření vyberte Vytvořit.
Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy jste kontaktovali vaši žádost.

Příklad osvědčeného postupu vzorů úloh

Tady je obecný příklad vhodného přístupu. Je určena pouze jako šablona, kterou můžete upravit podle potřeby pro vlastní použití.

Předpokládejme, že prostředek služby Speech má limit souběžných požadavků nastavený na 300. Spusťte úlohu z 20 souběžných připojení a zvyšte zatížení o 20 souběžných připojení každých 90 až 120 sekund. Řídit odpovědi služby a implementovat logiku, která se vrátí (snižuje zatížení), pokud dostanete příliš mnoho požadavků (kód odpovědi 429). Pak zopakujte zvýšení zatížení za jednu minutu a pokud stále nefunguje, zkuste to znovu za dvě minuty. Pro intervaly použijte vzor 1-2-4-4 minut.

Obecně je vhodné před přechodem do produkčního prostředí otestovat úlohy a vzory úloh.

Převod textu na řeč: Zvýšení limitu souběžných požadavků

U cenové úrovně Standard můžete tuto částku zvýšit. Před odesláním žádosti se ujistěte, že znáte materiály, které jsou popsány dříve v tomto článku, jako jsou osvědčené postupy pro zmírnění omezování.

Poznámka:

Kontejnery služby Speech nevyžadují zvýšení limitu souběžných požadavků, protože kontejnery jsou omezené pouze procesory hardwaru, na které jsou hostované.

Příprava požadovaných informací

Pokud chcete vytvořit žádost o zvýšení, musíte zadat své informace.

Pro předem připravený hlas:
- ID prostředku služby Speech
- Oblast
Vlastní hlas:
- Oblast nasazení
- ID vlastního koncového bodu

Jak získat informace o předem připraveném hlasu:

Přejděte na Azure Portal.
Vyberte prostředek služby Speech, pro který chcete zvýšit limit požadavků na souběžnost.
Ve skupině Správa prostředků vyberte Vlastnosti.
Zkopírujte a uložte hodnoty následujících polí:
- ID prostředku
- Umístění (oblast koncového bodu)

Jak získat informace pro vlastní hlas:

Přejděte na portál sady Speech Studio .
V případě potřeby se přihlaste a přejděte na Vlastní hlas.
Vyberte projekt a přejděte na Nasadit model.
Vyberte požadovaný koncový bod.
Zkopírujte a uložte hodnoty následujících polí:
- Oblast služby (oblast koncového bodu)
- ID koncového bodu

Vytvoření a odeslání žádosti o podporu

Spusťte zvýšení limitu pro souběžné žádosti o prostředek nebo v případě potřeby zkontrolujte aktuální limit odesláním žádosti o podporu. Postupujte následovně:

Ujistěte se, že máte požadované informace uvedené v předchozí části.
Přejděte na Azure Portal.
Vyberte prostředek služby Speech, pro který chcete zvýšit (nebo zkontrolovat) limit žádosti o souběžnost.
Ve skupině Podpora a řešení potíží vyberte Možnost Nová žádost o podporu. Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
V souhrnu popište, co chcete (například "Zvýšení limitu požadavků na souběžnost řeči na text").
V části Typ problému vyberte Problémy s kvótou nebo předplatným.
V podtypu Problém vyberte:
- Navýšení kvóty nebo souběžných požadavků na žádost o zvýšení
- Ověření kvóty nebo využití ke kontrole stávajícího limitu
Na kartě Doporučené řešení vyberte Další.
Na kartě Další podrobnosti vyplňte všechny požadované položky. Do pole Podrobnosti zadejte následující:
- Všimněte si, že požadavek se týká kvóty pro převod textu na řeč.
- Zvolte buď předem připravený hlas, nebo vlastní hlas.
- Informace o prostředcích Azure, které jste shromáždili dříve.
- Všechny další požadované informace.
Na kartě Revize a vytvoření vyberte Vytvořit.
Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy jste kontaktovali vaši žádost.

Avatar převodu textu na řeč: zvýšení limitu počtu nových připojení

Pokud chcete zvýšit limit nových připojení za minutu pro převod textu na avatara řeči, obraťte se na svého obchodního zástupce a vytvořte lístek s následujícími informacemi:

Identifikátor URI prostředku služby Speech
Požádal(a) o nové omezení pro zvýšení
Odůvodnění zvýšení
Počáteční datum pro zvýšení
Koncové datum pro zvýšení
Předem připravený avatar nebo vlastní avatar

Sdílet prostřednictvím

Kvóty a omezení služby Speech

Referenční informace o kvótách a omezeních

Kvóty a omezení převodu řeči na text na prostředek

Převod řeči na text a řeč v reálném čase

Rychlý přepis

Dávkový přepis

Přizpůsobení modelu

Kvóty a omezení převodu textu na řeč na prostředek

Převod textu na řeč v reálném čase

Dávkové syntézy

Vlastní neurální hlas – profesionální

Vlastní neurální hlas – osobní hlas

Batch text to speech avatar

Avatar převodu textu na řeč v reálném čase

Nástroj pro vytváření zvukového obsahu

Kvóty a omezení rozpoznávání mluvčího na prostředek

Podrobný popis, úprava kvóty a osvědčené postupy

Obecné osvědčené postupy pro zmírnění omezování během automatického škálování

Převod řeči na text: Zvýšení limitu počtu souběžných požadavků v reálném čase

Připravte požadované informace.

Vytvoření a odeslání žádosti o podporu

Příklad osvědčeného postupu vzorů úloh

Převod textu na řeč: Zvýšení limitu souběžných požadavků

Příprava požadovaných informací

Vytvoření a odeslání žádosti o podporu

Avatar převodu textu na řeč: zvýšení limitu počtu nových připojení

Váš názor

Další materiály