Kontejnery převodu řeči na text pomocí Dockeru

Článek
10/16/2024

Kontejner Převod řeči na text přepisuje řeči v reálném čase nebo dávkové zvukové nahrávky s průběžnými výsledky. V tomto článku se dozvíte, jak stáhnout, nainstalovat a spustit kontejner převodu řeči na text.

Další informace o požadavcích, ověření, že je kontejner spuštěný, běží více kontejnerů na stejném hostiteli a spuštěné odpojené kontejnery, najdete v tématu Instalace a spouštění kontejnerů Služby Speech pomocí Dockeru.

Image kontejneru

Image kontejneru Speech to text pro všechny podporované verze a národní prostředí najdete v syndikátu Microsoft Container Registry (MCR). Nachází se v úložišti azure-cognitive-services/speechservices/ a má název speech-to-text.

Plně kvalifikovaný název image kontejneru je . mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text Připojte konkrétní verzi nebo připojte :latest , abyste získali nejnovější verzi.

Verze	Cesta
Nejpozdější	`mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest` Značka `latest` načítá nejnovější image národního `en-US` prostředí.
4.10.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:4.10.0-amd64-mr-in`

Všechny značky, s výjimkou latest, jsou v následujícím formátu a rozlišují malá a velká písmena:

<major>.<minor>.<patch>-<platform>-<locale>-<prerelease>

Značky jsou také k dispozici ve formátu JSON pro usnadnění. Tělo obsahuje cestu ke kontejneru a seznam značek. Značky nejsou seřazené podle verze, ale "latest" jsou vždy zahrnuty na konci seznamu, jak je znázorněno v tomto fragmentu kódu:

{
  "name": "azure-cognitive-services/speechservices/speech-to-text",
  "tags": [
    <--redacted for brevity-->    
    "4.10.0-amd64-sw-tz",
    "4.10.0-amd64-ta-in",
    "4.10.0-amd64-th-th",
    "4.10.0-amd64-tr-tr",
    "4.10.0-amd64-vi-vn",
    "4.10.0-amd64-wuu-cn",
    "4.10.0-amd64-yue-cn",
    "4.10.0-amd64-zh-cn",
    "4.10.0-amd64-zh-cn-sichuan",
    "4.10.0-amd64-zh-hk",
    "4.10.0-amd64-zh-tw",
    "4.10.0-amd64-zu-za",
    "latest"
  ]
}

Získání image kontejneru pomocí docker pull

Potřebujete požadavky, včetně požadovaného hardwaru. Podívejte se také na doporučené přidělení prostředků pro každý kontejner služby Speech.

Pomocí příkazu docker pull stáhněte image kontejneru ze služby Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest

Důležité

Značka latest načítá nejnovější image národního en-US prostředí. Další verze a národní prostředí najdete v tématu Převod řeči na textové image kontejnerů.

Spuštění kontejneru pomocí dockeru run

Ke spuštění kontejneru použijte příkaz docker run.

Převod řeči na text
Odpojená řeč na text

Následující tabulka představuje různé docker run parametry a jejich odpovídající popisy:

Parametr	Popis
`{ENDPOINT_URI}`	Koncový bod se vyžaduje pro měření a fakturaci. Další informace najdete v tématu Fakturační argumenty.
`{API_KEY}`	Vyžaduje se klíč rozhraní API. Další informace najdete v tématu Fakturační argumenty.

Při spuštění převodu řeči na textový kontejner nakonfigurujte port, paměť a procesor podle požadavků a doporučení pro převod řeči na textový kontejner.

Tady je ukázkový docker run příkaz se zástupnými hodnotami. Musíte zadat ENDPOINT_URI hodnoty a API_KEY hodnoty:

docker run --rm -it -p 5000:5000 --memory 8g --cpus 4 \
mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Tento příkaz:

speech-to-text Spustí kontejner z image kontejneru.
Přidělí 4 jádra procesoru a 8 GB paměti.
Zpřístupní port TCP 5000 a přidělí pro kontejner pseudo-TTY.
Po ukončení kontejneru se automaticky odebere. Image kontejneru je stále dostupná na hostitelském počítači.

Pokud chcete spustit odpojené kontejnery (nepřipojené k internetu), musíte odeslat tento formulář žádosti a počkat na schválení. Další informace o použití a zakoupení plánu závazku k používání kontejnerů v odpojených prostředích najdete v tématu Použití kontejnerů v odpojených prostředích v dokumentaci ke službám Azure AI.

Pokud jste schváleni ke spuštění kontejneru odpojeného od internetu, následující příklad ukazuje formátování docker run příkazu, který se má použít, se zástupnými hodnotami. Nahraďte tyto zástupné hodnoty vlastními hodnotami.

Parametr DownloadLicense=True v docker run příkazu stáhne licenční soubor, aby se kontejner Dockeru spustil, když není připojený k internetu. Obsahuje také datum vypršení platnosti, po kterém je soubor licence neplatný pro spuštění kontejneru. Soubor s licencí můžete použít pouze s příslušným kontejnerem, pro který jste schváleni. Například pro kontejner s kontejnerem neural-text-to-speech nemůžete použít licenční souborspeech-to-text.

Zástupný symbol	Popis
`{IMAGE}`	Image kontejneru, kterou chcete použít. Příklad: `mcr.microsoft.com/azure-cognitive-services/speech-to-text:latest`
`{LICENSE_MOUNT}`	Cesta, kam se licence stáhne, a připojí se. Příklad: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	Koncový bod pro ověření vaší žádosti o služby. Najdete ho na stránce Klíč a koncový bod vašeho prostředku na webu Azure Portal. Příklad: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Klíč pro váš prostředek služby Speech. Najdete ho na stránce Klíč a koncový bod vašeho prostředku na webu Azure Portal.
`{CONTAINER_LICENSE_DIRECTORY}`	Umístění složky s licencí v místním systému souborů kontejneru. Příklad: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

Po stažení souboru licence můžete kontejner spustit v odpojeném prostředí. Následující příklad ukazuje formátování používaného docker run příkazu se zástupnými hodnotami. Nahraďte tyto zástupné hodnoty vlastními hodnotami.

Všude, kde je kontejner spuštěný, musí být soubor licence připojen ke kontejneru a umístění složky s licencí v místním systému souborů kontejneru musí být zadáno pomocí Mounts:License=. Musí být zadán také výstupní připojení, aby bylo možné zapsat záznamy o využití fakturace.

Zástupný symbol	Hodnota	Formát nebo příklad
`{IMAGE}`	Image kontejneru, kterou chcete použít. Příklad: `mcr.microsoft.com/azure-cognitive-services/speech-to-text:latest`
`{MEMORY_SIZE}`	Odpovídající velikost paměti, která se má přidělit pro váš kontejner. Příklad: `4g`
`{NUMBER_CPUS}`	Odpovídající počet procesorů pro přidělení kontejneru. Příklad: `4`
`{LICENSE_MOUNT}`	Cesta, kde je licence umístěna a připojena. Příklad: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	Výstupní cesta pro protokolování. Příklad: `/host/output:/path/to/output/directory` Další informace najdete v záznamech o využití v dokumentaci ke službám Azure AI.
`{CONTAINER_LICENSE_DIRECTORY}`	Umístění složky s licencí v místním systému souborů kontejneru. Příklad: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Umístění výstupní složky v místním systému souborů kontejneru Příklad: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Kontejnery služby Speech poskytují výchozí adresář pro zápis licenčního souboru a fakturačního protokolu za běhu. Výchozí adresáře jsou /license a /output.

Když tyto adresáře připojíte ke kontejneru pomocí docker run -v příkazu, před spuštěním kontejneru se ujistěte, že je adresář místního počítače nastavený na user:group nonroot:nonroot vlastnictví.

Tady je ukázkový příkaz pro nastavení vlastnictví souboru nebo adresáře.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Další informace o kontejnerech služby Speech najdete v docker run tématu Instalace a spouštění kontejnerů služby Speech pomocí Dockeru.

Použití kontejneru

Kontejnery služby Speech poskytují rozhraní API koncových bodů dotazů založených na websocketu, ke kterým se přistupuje prostřednictvím sady Speech SDK a rozhraní příkazového řádku služby Speech. Sada Speech SDK a Rozhraní příkazového řádku služby Speech ve výchozím nastavení používají veřejnou službu Speech. Pokud chcete kontejner použít, musíte změnit inicializační metodu.

Důležité

Pokud používáte službu Speech s kontejnery, nezapomeňte použít ověřování hostitele. Pokud nakonfigurujete klíč a oblast, požadavky budou chodit do veřejné služby Speech. Výsledky ze služby Speech nemusí být to, co očekáváte. Požadavky z odpojených kontejnerů selžou.