Kvóty a omezení služby Speech
Tento článek obsahuje stručný přehled a podrobný popis kvót a omezení služby Speech ve službách Azure AI. Informace platí pro všechny cenové úrovně služby. Obsahuje také některé osvědčené postupy, které brání omezování požadavků.
Informace o cenové úrovni Free (F0) najdete také na stránce s cenami měsíčních povolenek.
Referenční informace o kvótách a omezeních
V následujících částech najdete stručný průvodce kvótami a omezeními, které platí pro službu Speech.
Informace o upravitelných kvótách pro prostředky služby Speech úrovně Standard (S0) najdete v dalších vysvětleních, osvědčených postupech a pokynech k úpravám. Kvóty a limity pro prostředky služby Speech free (F0) se nedají upravovat.
Důležité
Pokud přepnete prostředek služby Speech z úrovně Free (F0) na cenovou úroveň Standard (S0), může změna odpovídajících kvót trvat až několik hodin.
Kvóty a omezení převodu řeči na text na prostředek
Tato část popisuje kvóty řeči na text a omezení pro prostředek služby Speech. Pokud není uvedeno jinak, limity se nedají upravit.
Převod řeči na text a řeč v reálném čase
Pomocí sady Speech SDK nebo rozhraní REST API pro převod řeči na text v reálném čase můžete použít krátký zvuk.
Důležité
Tato omezení platí pro souběžnou řeč v reálném čase na požadavky na text a kombinované požadavky na překlad řeči. Pokud máte například 60 souběžných žádostí o převod řeči na text a 40 souběžných žádostí o překlad řeči, dosáhnete limitu 100 souběžných požadavků.
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Limit souběžných požadavků – koncový bod základního modelu | 1 Tento limit není možné upravit. |
100 (výchozí hodnota) Rychlost je nastavitelná pro prostředky standardu (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám. |
Limit souběžných požadavků – vlastní koncový bod | 1 Tento limit není možné upravit. |
100 (výchozí hodnota) Rychlost je nastavitelná pro prostředky standardu (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám. |
Maximální délka zvuku pro diarizaci v reálném čase | – | 240 minut na soubor |
Rychlý přepis
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Maximální velikost zvukového vstupního souboru | – | 200 MB |
Maximální délka zvuku | – | 120 minut na soubor |
Maximální počet požadavků za minutu | – | 600 |
Dávkový přepis
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Omezení rozhraní REST API pro převod řeči na text | Není k dispozici pro F0 | 100 požadavků za 10 sekund (600 požadavků za minutu) |
Maximální velikost zvukového vstupního souboru | – | 1 GB |
Maximální počet objektů blob na kontejner | – | 10000 |
Maximální počet souborů na žádost o přepis (pokud jako vstup používáte více adres URL obsahu). | – | 1000 |
Maximální délka zvuku pro přepisy s povolenou diarizací | – | 240 minut na soubor |
Přizpůsobení modelu
Omezení v této tabulce platí pro prostředek služby Speech při vytváření vlastního modelu řeči.
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Limit rozhraní REST API | 100 požadavků za 10 sekund (600 požadavků za minutu) | 100 požadavků za 10 sekund (600 požadavků za minutu) |
Maximální počet datových sad řeči | 2 | 500 |
Maximální velikost souboru datové sady acoustic pro import dat | 2 GB | 2 GB |
Maximální velikost souboru datové sady jazyka pro import dat | 200 MB | 1.5 GB |
Maximální velikost souboru datové sady výslovnosti pro import dat | 1 kB | 1 MB |
Maximální velikost textu při použití parametru text v požadavku rozhraní API Models_Create |
200 kB | 500 kB |
Kvóty a omezení převodu textu na řeč na prostředek
Tato část popisuje kvóty řeči a omezení textu na prostředek služby Speech.
Převod textu na řeč v reálném čase
Text v reálném čase můžete použít ke zpracování řeči pomocí sady Speech SDK nebo rozhraní REST API pro převod textu na řeč. Pokud není uvedeno jinak, limity se nedají upravit.
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Maximální počet transakcí za časové období pro předem připravené neurální hlasy a vlastní neurální hlasy. | 20 transakcí za 60 sekund Tento limit není možné upravit. |
200 transakcí za sekundu (TPS) (výchozí hodnota) Rychlost je nastavitelná až 1 000 TPS pro prostředky standardu (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám. |
Maximální délka zvuku vytvořená na požadavek | 10 minut | 10 minut |
Maximální celkový počet jedinečných <voice> a <audio> značek v SSML |
50 | 50 |
Maximální velikost zprávy SSML na turn for websocket | 64 kB | 64 kB |
Dávkové syntézy
Tato omezení se nedají upravit. Další informace o latenci syntézy dávek najdete v tématu o latenci syntézy dávek a osvědčených postupech.
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Limit rozhraní REST API | Není k dispozici pro F0 | 100 požadavků za 10 sekund |
Maximální velikost datové části JSON pro vytvoření úlohy syntézy | – | 2 megabajty |
Souběžné aktivní úlohy syntézy | – | Bez omezení |
Maximální počet textových vstupů na úlohu syntézy | – | 10000 |
Max time to live for a synthesis job since it being in the final state | – | Až 31 dní (zadané pomocí vlastností) |
Vlastní neurální hlas – profesionální
Omezení v této tabulce platí pro prostředek služby Speech při vytváření profesionálního vlastního neurálního hlasového modelu.
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Maximální počet transakcí za sekundu (TPS) | Není k dispozici pro F0 | 200 transakcí za sekundu (TPS) (výchozí hodnota) |
Maximální počet datových sad | – | 500 |
Maximální počet nahrání souběžných datových sad | – | 5 |
Maximální velikost datového souboru pro import dat na datovou sadu | – | 2 GB |
Nahrávání dlouhého zvuku nebo zvuku bez skriptu | – | Ano |
Maximální počet souběžných trénování modelů | – | 4 |
Maximální počet vlastních koncových bodů | – | 50 |
Vlastní neurální hlas – osobní hlas
Omezení v této tabulce platí pro prostředek služby Speech při vytváření osobního hlasu.
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Limit rozhraní REST API (nezahrnuje syntézu řeči) | Není k dispozici pro F0 | 50 požadavků za 10 sekund |
Maximální počet transakcí za sekundu (TPS) pro syntézu řeči | Není k dispozici pro F0 | 200 transakcí za sekundu (TPS) (výchozí hodnota) |
Batch text to speech avatar
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Limit rozhraní REST API | Není k dispozici pro F0 | 2 žádosti za 1 minutu |
Avatar převodu textu na řeč v reálném čase
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Nová připojení za minutu | Není k dispozici pro F0 | 2 nová připojení za minutu |
Maximální doba trvání připojení s mluvením | Není k dispozici pro F0 | 20 minut1 |
Maximální doba trvání připojení se stavem nečinnosti | Není k dispozici pro F0 | 5 minut |
1 Chcete-li zajistit nepřetržitou provoz avatara v reálném čase po dobu více než 20 minut, můžete povolit automatické opětovné připojení. Informace o nastavení automatického opětovného připojení najdete v tomto vzorovém kódu (vyhledejte "automatické opětovné připojení").
Nástroj pro vytváření zvukového obsahu
Kvóta | Free (F0) | Standard (S0) |
---|---|---|
Velikost souboru (prostý text v SSML)1 | 3 000 znaků na soubor | 20 000 znaků na soubor |
Velikost souboru (lexicon soubor)2 | 30 kB na soubor | 100 kB na soubor |
Fakturovatelné znaky v SSML | 15 000 znaků na soubor | 100 000 znaků na soubor |
Export do zvukové knihovny | 1 souběžná úloha | – |
1 Omezení platí jenom pro prostý text v SSML a neobsahuje značky.
2 Znaky souboru lexicon se neúčtují. Jako fakturovatelné znaky se počítají pouze prvky lexikonu v SSML. Další informace najdete v fakturovatelných znamech .
Kvóty a omezení rozpoznávání mluvčího na prostředek
Rozpoznávání mluvčího je omezené na 20 transakcí za sekundu (TPS).
Podrobný popis, úprava kvóty a osvědčené postupy
Některé kvóty služby Speech se dají upravit. Tato část obsahuje další vysvětlení, osvědčené postupy a pokyny k úpravám.
Následující kvóty se dají upravit pro prostředky standardu (S0). Limity požadavků Free (F0) se nedají upravit.
- Limit souběžných požadavků na převod řeči na text pro koncový bod základního modelu a vlastní koncový bod
- Maximální počet transakcí převodu textu na řeč za časové období pro předem připravené neurální hlasy a vlastní neurální hlasy
- Limit souběžných požadavků překladu řeči
Před vyžádáním navýšení kvóty (pokud je to možné) zkontrolujte aktuální tps (transakce za sekundu) a ujistěte se, že je nutné kvótu zvýšit. Služba Speech používá technologie automatického škálování k přenesení požadovaných výpočetních prostředků do režimu na vyžádání. Služba Speech se současně snaží zachovat nízké náklady tím, že neudržuje nadměrnou kapacitu hardwaru.
Podívejme se na příklad. Předpokládejme, že vaše aplikace obdrží kód odpovědi 429, což znamená, že existuje příliš mnoho požadavků. Vaše aplikace obdrží tuto odpověď, i když vaše úloha spadá do limitů definovaných referenčními kvótami a limity. Nejpravděpodobnějším vysvětlením je, že služba Speech se škáluje na vaši poptávku a ještě nedosahovala požadovaného škálování. Služba proto nemá okamžitě dostatek prostředků pro obsluhu požadavku. V takových případech nepomůže zvýšení kvóty. Ve většině případů se služba Speech brzy vertikálně navýší a problém způsobující, že se vyřeší kód odpovědi 429.
Obecné osvědčené postupy pro zmírnění omezování během automatického škálování
Pokud chcete minimalizovat problémy související s omezováním, je vhodné použít následující techniky:
- Implementujte do své aplikace logiku opakování pokusů.
- Pokuste se předcházet prudkým výkyvům zatížení. Zvyšujte zatížení postupně. Řekněme například, že vaše aplikace používá převod textu na řeč a vaše aktuální úloha je 5 TPS. Další sekundu zvýšíte zatížení na 20 TPS (to znamená čtyřikrát více). Služba Speech okamžitě začne vertikálně navýšit kapacitu, aby splnila nové zatížení, ale během jedné sekundy se nemůže škálovat podle potřeby. Některé požadavky získají kód odpovědi 429 (příliš mnoho požadavků).
- Otestujte různé vzorce zvýšení zatížení. Další informace najdete v příkladu vzoru úloh.
- Vytvářejte více prostředků služby Speech v různých oblastech a distribuujte mezi ně úlohy. (Vytvoření více prostředků služby Speech ve stejné oblasti neovlivní výkon, protože všechny prostředky obsluhují stejný back-endový cluster).
Další části popisují konkrétní případy úprav kvót.
Převod řeči na text: Zvýšení limitu počtu souběžných požadavků v reálném čase
Ve výchozím nastavení je počet souběžných požadavků na převod řeči v reálném čase na text a překlad řeči omezený na 100 na prostředek v základním modelu a 100 na vlastní koncový bod ve vlastním modelu. U cenové úrovně Standard můžete tuto částku zvýšit. Před odesláním žádosti se ujistěte, že znáte materiály, které jsou popsány dříve v tomto článku, jako jsou osvědčené postupy pro zmírnění omezování.
Poznámka:
Souběžné limity požadavků pro základní a vlastní modely je potřeba upravit samostatně. Můžete mít prostředek služby Speech, který je přidružený k mnoha vlastním koncovým bodům hostujícím mnoho vlastních nasazení modelu. Podle potřeby je potřeba požádat o úpravy limitu pro každý vlastní koncový bod samostatně.
Zvýšení limitu souběžných požadavků nemá přímý vliv na vaše náklady. Služba Speech používá platební model, který vyžaduje, abyste zaplatili jenom za to, co používáte. Limit definuje, jak vysoká může služba škálovat, než začne omezovat vaše požadavky.
Na webu Azure Portal, v nástrojích příkazového řádku nebo požadavcích rozhraní API se nezobrazuje stávající hodnota parametru limitu souběžných požadavků. Pokud chcete ověřit existující hodnotu, vytvořte požadavek podpora Azure.
Poznámka:
Kontejnery služby Speech nevyžadují zvýšení limitu souběžných požadavků, protože kontejnery jsou omezené pouze procesory hardwaru, na které jsou hostované. Kontejnery služby Speech ale mají svá vlastní omezení kapacity, která by se měla vzít v úvahu. Další informace najdete v nejčastějších dotazech ke kontejnerům služby Speech.
Připravte požadované informace.
- Základní model:
- ID prostředku služby Speech
- Oblast
- Pro vlastní model:
- Oblast
- ID vlastního koncového bodu
Získání informací pro základní model:
- Přejděte na Azure Portal.
- Vyberte prostředek služby Speech, pro který chcete zvýšit limit požadavků na souběžnost.
- Ve skupině Správa prostředků vyberte Vlastnosti.
- Zkopírujte a uložte hodnoty následujících polí:
- ID prostředku
- Umístění (oblast koncového bodu)
Jak získat informace pro vlastní model:
- Přejděte na portál sady Speech Studio .
- V případě potřeby se přihlaste a přejděte na Vlastní řeč.
- Vyberte projekt a přejděte na Nasazení.
- Vyberte požadovaný koncový bod.
- Zkopírujte a uložte hodnoty následujících polí:
- Oblast služby (oblast koncového bodu)
- ID koncového bodu
Vytvoření a odeslání žádosti o podporu
Spusťte zvýšení limitu pro souběžné žádosti o prostředek nebo v případě potřeby zkontrolujte aktuální limit odesláním žádosti o podporu. Postupujte následovně:
- Ujistěte se, že máte požadované informace uvedené v předchozí části.
- Přejděte na Azure Portal.
- Vyberte prostředek služby Speech, pro který chcete zvýšit (nebo zkontrolovat) limit žádosti o souběžnost.
- Ve skupině Podpora a řešení potíží vyberte Možnost Nová žádost o podporu. Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
- V souhrnu popište, co chcete (například "Zvýšení limitu požadavků na souběžnost řeči na text").
- V části Typ problému vyberte Problémy s kvótou nebo předplatným.
- V podtypu Problém vyberte:
- Navýšení kvóty nebo souběžných požadavků na žádost o zvýšení
- Ověření kvóty nebo využití ke kontrole stávajícího limitu
- Vyberte Další: Řešení. Pokračujte ve vytváření žádosti.
- Na kartě Podrobnosti zadejte do pole Popis následující:
- Všimněte si, že požadavek se týká kvóty řeči na text.
- Zvolte základní nebo vlastní model.
- Informace o prostředcích Azure, které jste shromáždili dříve.
- Všechny další požadované informace.
- Na kartě Revize a vytvoření vyberte Vytvořit.
- Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy jste kontaktovali vaši žádost.
Příklad osvědčeného postupu vzorů úloh
Tady je obecný příklad vhodného přístupu. Je určena pouze jako šablona, kterou můžete upravit podle potřeby pro vlastní použití.
Předpokládejme, že prostředek služby Speech má limit souběžných požadavků nastavený na 300. Spusťte úlohu z 20 souběžných připojení a zvyšte zatížení o 20 souběžných připojení každých 90 až 120 sekund. Řídit odpovědi služby a implementovat logiku, která se vrátí (snižuje zatížení), pokud dostanete příliš mnoho požadavků (kód odpovědi 429). Pak zopakujte zvýšení zatížení za jednu minutu a pokud stále nefunguje, zkuste to znovu za dvě minuty. Pro intervaly použijte vzor 1-2-4-4 minut.
Obecně je vhodné před přechodem do produkčního prostředí otestovat úlohy a vzory úloh.
Převod textu na řeč: Zvýšení limitu souběžných požadavků
U cenové úrovně Standard můžete tuto částku zvýšit. Před odesláním žádosti se ujistěte, že znáte materiály, které jsou popsány dříve v tomto článku, jako jsou osvědčené postupy pro zmírnění omezování.
Zvýšení limitu souběžných požadavků nemá přímý vliv na vaše náklady. Služba Speech používá platební model, který vyžaduje, abyste zaplatili jenom za to, co používáte. Limit definuje, jak vysoká může služba škálovat, než začne omezovat vaše požadavky.
Na webu Azure Portal, v nástrojích příkazového řádku nebo požadavcích rozhraní API se nezobrazuje stávající hodnota parametru limitu souběžných požadavků. Pokud chcete ověřit existující hodnotu, vytvořte požadavek podpora Azure.
Poznámka:
Kontejnery služby Speech nevyžadují zvýšení limitu souběžných požadavků, protože kontejnery jsou omezené pouze procesory hardwaru, na které jsou hostované.
Příprava požadovaných informací
Pokud chcete vytvořit žádost o zvýšení, musíte zadat své informace.
- Pro předem připravený hlas:
- ID prostředku služby Speech
- Oblast
- Vlastní hlas:
- Oblast nasazení
- ID vlastního koncového bodu
Jak získat informace o předem připraveném hlasu:
- Přejděte na Azure Portal.
- Vyberte prostředek služby Speech, pro který chcete zvýšit limit požadavků na souběžnost.
- Ve skupině Správa prostředků vyberte Vlastnosti.
- Zkopírujte a uložte hodnoty následujících polí:
- ID prostředku
- Umístění (oblast koncového bodu)
Jak získat informace pro vlastní hlas:
- Přejděte na portál sady Speech Studio .
- V případě potřeby se přihlaste a přejděte na Vlastní hlas.
- Vyberte projekt a přejděte na Nasadit model.
- Vyberte požadovaný koncový bod.
- Zkopírujte a uložte hodnoty následujících polí:
- Oblast služby (oblast koncového bodu)
- ID koncového bodu
Vytvoření a odeslání žádosti o podporu
Spusťte zvýšení limitu pro souběžné žádosti o prostředek nebo v případě potřeby zkontrolujte aktuální limit odesláním žádosti o podporu. Postupujte následovně:
- Ujistěte se, že máte požadované informace uvedené v předchozí části.
- Přejděte na Azure Portal.
- Vyberte prostředek služby Speech, pro který chcete zvýšit (nebo zkontrolovat) limit žádosti o souběžnost.
- Ve skupině Podpora a řešení potíží vyberte Možnost Nová žádost o podporu. Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
- V souhrnu popište, co chcete (například "Zvýšení limitu požadavků na souběžnost řeči na text").
- V části Typ problému vyberte Problémy s kvótou nebo předplatným.
- V podtypu Problém vyberte:
- Navýšení kvóty nebo souběžných požadavků na žádost o zvýšení
- Ověření kvóty nebo využití ke kontrole stávajícího limitu
- Na kartě Doporučené řešení vyberte Další.
- Na kartě Další podrobnosti vyplňte všechny požadované položky. Do pole Podrobnosti zadejte následující:
- Všimněte si, že požadavek se týká kvóty pro převod textu na řeč.
- Zvolte buď předem připravený hlas, nebo vlastní hlas.
- Informace o prostředcích Azure, které jste shromáždili dříve.
- Všechny další požadované informace.
- Na kartě Revize a vytvoření vyberte Vytvořit.
- Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy jste kontaktovali vaši žádost.
Avatar převodu textu na řeč: zvýšení limitu počtu nových připojení
Pokud chcete zvýšit limit nových připojení za minutu pro převod textu na avatara řeči, obraťte se na svého obchodního zástupce a vytvořte lístek s následujícími informacemi:
- Identifikátor URI prostředku služby Speech
- Požádal(a) o nové omezení pro zvýšení
- Odůvodnění zvýšení
- Počáteční datum pro zvýšení
- Koncové datum pro zvýšení
- Předem připravený avatar nebo vlastní avatar