Vytvoření vlastního rychlého startu s klíčovými slovy – služba Speech - Azure AI services

Referenční dokumentace | Package (NuGet) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. V sadě Speech Studio vytvoříte modely klíčových slov. Pak vyexportujte soubor modelu, který používáte se sadou Speech SDK ve vašich aplikacích.

Požadavky

Předplatné Azure. Můžete si ho zdarma vytvořit.
Na webu Azure Portal vytvořte prostředek služby AI Services pro službu Speech .
Získejte klíč prostředku a oblast služby Speech. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče.

Vytvoření klíčového slova v sadě Speech Studio

Než budete moct použít vlastní klíčové slovo, musíte vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v sadě Speech Studio. Jakmile zadáte klíčové slovo, vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet pouze v sadě Speech Studio. Vlastní klíčová slova nelze vytvořit ze sady SDK ani pomocí volání REST.

Přejděte do sady Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte do části Vytváření služeb Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte název, popis a jazyk vlastního projektu klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je aktuálně omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte název modelu, popisu a klíčového slova podle vašeho výběru a pak vyberte Další. Přečtěte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří pro vaše klíčové slovo kandidátské výslovnosti. Poslechněte si každého kandidáta tak, že vyberete tlačítka přehrávání a odeberete kontroly vedle všech výslovností, které jsou nesprávné. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé říkají klíčové slovo, a pak výběrem možnosti Další začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznamoblastích
Kvůli vysoké poptávce může trénování základního modelu trvat několik hodin. Dokončení trénování pokročilého modelu může trvat až den. Po dokončení trénování se stav změní ze zpracování na Úspěch .
V sbalitelné nabídce na levé straně vyberte Ladit možnosti, které chcete vyladit a stáhnout model. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete .table se sadou SDK, proto si poznamenejte jeho cestu.

Použití modelu klíčových slov se sadou Speech SDK

Nejprve načtěte soubor modelu klíčových slov pomocí FromFile() statické funkce, která vrací KeywordRecognitionModel. Použijte cestu k .table souboru, který jste stáhli ze sady Speech Studio. Kromě toho vytvoříte pomocí výchozího AudioConfig mikrofonu a pak vytvoříte novou KeywordRecognizer instanci pomocí konfigurace zvuku.

using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;

var keywordModel = KeywordRecognitionModel.FromFile("your/path/to/Activate_device.table");
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var keywordRecognizer = new KeywordRecognizer(audioConfig);

Důležité

Pokud dáváte přednost testování modelu klíčových slov přímo se zvukovými ukázkami prostřednictvím AudioConfig.fromStreamInput() metody, ujistěte se, že před prvním klíčovým slovem používáte vzorky, které mají alespoň 1,5 sekund ticho. To je poskytnout adekvátní čas pro modul pro rozpoznávání klíčových slov inicializovat a dostat se do stavu naslouchání před detekcí prvního klíčového slova.

Dále se spuštění rozpoznávání klíčových slov provádí jedním voláním RecognizeOnceAsync() předáním objektu modelu. Tato metoda spustí relaci rozpoznávání klíčových slov, která trvá, dokud se klíčové slovo nerozpozná. Tento vzor návrhu tedy obecně používáte ve vícevláknových aplikacích nebo v případech, kdy možná čekáte na buzení na neomezenou dobu.

KeywordRecognitionResult result = await keywordRecognizer.RecognizeOnceAsync(keywordModel);

Poznámka:

Zde uvedený příklad používá místní rozpoznávání klíčových slov, protože nevyžaduje SpeechConfig objekt pro kontext ověřování a nekontaktuje back-end.

Průběžné rozpoznávání

Ostatní třídy v sadě Speech SDK podporují průběžné rozpoznávání (pro rozpoznávání řeči i záměru) s rozpoznáváním klíčových slov. Sada SDK umožňuje použít stejný kód, který byste normálně používali pro průběžné rozpoznávání, a mít možnost odkazovat .table na soubor pro váš model klíčových slov.

U řeči na text postupujte podle stejného vzoru návrhu uvedeného v průvodci rozpoznáváním řeči a nastavte průběžné rozpoznávání. Potom nahraďte voláním recognizer.StartContinuousRecognitionAsync()recognizer.StartKeywordRecognitionAsync(KeywordRecognitionModel)a předejte objekt KeywordRecognitionModel . Chcete-li zastavit průběžné rozpoznávání pomocí rozpoznávání klíčových slov, použijte recognizer.StopKeywordRecognitionAsync() místo recognizer.StopContinuousRecognitionAsync().

Rozpoznávání záměru používá stejný vzor s funkcemi StartKeywordRecognitionAsync a StopKeywordRecognitionAsync funkcemi.

Referenční dokumentace | Package (NuGet) | Další ukázky na GitHubu

Sada Speech SDK pro C++ podporuje rozpoznávání klíčových slov, ale zatím jsme do ní nezahrnuli příručku. Začněte výběrem jiného programovacího jazyka a seznamte se s koncepty nebo si projděte referenční informace a ukázky jazyka C++, které jsou propojené od začátku tohoto článku.

autor: eric-urban ms.service: azure-ai-speech ms.topic: include ms.date: 9/12/2024 ms.author: eur

Předplatné Azure. Můžete si ho zdarma vytvořit.
Na webu Azure Portal vytvořte prostředek služby AI Services pro službu Speech .
Získejte klíč prostředku a oblast služby Speech. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče.

Vytvoření klíčového slova v sadě Speech Studio

Než budete moct použít vlastní klíčové slovo, musíte vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v sadě Speech Studio. Jakmile zadáte klíčové slovo, vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet pouze v sadě Speech Studio. Vlastní klíčová slova nelze vytvořit ze sady SDK ani pomocí volání REST.

Přejděte do sady Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte do části Vytváření služeb Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte název, popis a jazyk vlastního projektu klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je aktuálně omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte název modelu, popisu a klíčového slova podle vašeho výběru a pak vyberte Další. Přečtěte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří pro vaše klíčové slovo kandidátské výslovnosti. Poslechněte si každého kandidáta tak, že vyberete tlačítka přehrávání a odeberete kontroly vedle všech výslovností, které jsou nesprávné. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé říkají klíčové slovo, a pak výběrem možnosti Další začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznamoblastích
Kvůli vysoké poptávce může trénování základního modelu trvat několik hodin. Dokončení trénování pokročilého modelu může trvat až den. Po dokončení trénování se stav změní ze zpracování na Úspěch .
V sbalitelné nabídce na levé straně vyberte Ladit možnosti, které chcete vyladit a stáhnout model. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete .table se sadou SDK, proto si poznamenejte jeho cestu.

Použití modelu klíčových slov se sadou Speech SDK

Projděte si referenční dokumentaci k používání modelu vlastních klíčových slov se sadou Go SDK.

Referenční dokumentace | Další ukázky na GitHubu

Sada Speech SDK pro Javu podporuje rozpoznávání klíčových slov, ale zatím jsme do ní nezahrnuli příručku. Začněte výběrem jiného programovacího jazyka a seznamte se s koncepty nebo si projděte referenční informace k Javě a ukázky propojené od začátku tohoto článku.

Referenční dokumentace | Balíček (npm) | Další ukázky ve zdrojovém kódu knihovny GitHub |

Sada Speech SDK pro JavaScript nepodporuje rozpoznávání klíčových slov. Vyberte jiný programovací jazyk nebo odkazy javascriptu a ukázky propojené od začátku tohoto článku.

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. V sadě Speech Studio vytvoříte modely klíčových slov. Pak vyexportujte soubor modelu, který používáte se sadou Speech SDK ve vašich aplikacích.

Požadavky

Předplatné Azure. Můžete si ho zdarma vytvořit.
Na webu Azure Portal vytvořte prostředek služby AI Services pro službu Speech .
Získejte klíč prostředku a oblast služby Speech. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče.

Vytvoření klíčového slova v sadě Speech Studio

Než budete moct použít vlastní klíčové slovo, musíte vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v sadě Speech Studio. Jakmile zadáte klíčové slovo, vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet pouze v sadě Speech Studio. Vlastní klíčová slova nelze vytvořit ze sady SDK ani pomocí volání REST.

Přejděte do sady Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte do části Vytváření služeb Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte název, popis a jazyk vlastního projektu klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je aktuálně omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte název modelu, popisu a klíčového slova podle vašeho výběru a pak vyberte Další. Přečtěte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří pro vaše klíčové slovo kandidátské výslovnosti. Poslechněte si každého kandidáta tak, že vyberete tlačítka přehrávání a odeberete kontroly vedle všech výslovností, které jsou nesprávné. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé říkají klíčové slovo, a pak výběrem možnosti Další začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznamoblastích
Kvůli vysoké poptávce může trénování základního modelu trvat několik hodin. Dokončení trénování pokročilého modelu může trvat až den. Po dokončení trénování se stav změní ze zpracování na Úspěch .
V sbalitelné nabídce na levé straně vyberte Ladit možnosti, které chcete vyladit a stáhnout model. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete .table se sadou SDK, proto si poznamenejte jeho cestu.

Použití modelu klíčových slov se sadou Speech SDK

Prohlédněte si ukázku na GitHubu pro použití modelu vlastního klíčového slova se sadou Objective C SDK.

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. V sadě Speech Studio vytvoříte modely klíčových slov. Pak vyexportujte soubor modelu, který používáte se sadou Speech SDK ve vašich aplikacích.

Požadavky

Předplatné Azure. Můžete si ho zdarma vytvořit.
Na webu Azure Portal vytvořte prostředek služby AI Services pro službu Speech .
Získejte klíč prostředku a oblast služby Speech. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče.

Vytvoření klíčového slova v sadě Speech Studio

Než budete moct použít vlastní klíčové slovo, musíte vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v sadě Speech Studio. Jakmile zadáte klíčové slovo, vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet pouze v sadě Speech Studio. Vlastní klíčová slova nelze vytvořit ze sady SDK ani pomocí volání REST.

Přejděte do sady Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte do části Vytváření služeb Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte název, popis a jazyk vlastního projektu klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je aktuálně omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte název modelu, popisu a klíčového slova podle vašeho výběru a pak vyberte Další. Přečtěte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří pro vaše klíčové slovo kandidátské výslovnosti. Poslechněte si každého kandidáta tak, že vyberete tlačítka přehrávání a odeberete kontroly vedle všech výslovností, které jsou nesprávné. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé říkají klíčové slovo, a pak výběrem možnosti Další začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznamoblastích
Kvůli vysoké poptávce může trénování základního modelu trvat několik hodin. Dokončení trénování pokročilého modelu může trvat až den. Po dokončení trénování se stav změní ze zpracování na Úspěch .
V sbalitelné nabídce na levé straně vyberte Ladit možnosti, které chcete vyladit a stáhnout model. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete .table se sadou SDK, proto si poznamenejte jeho cestu.

Použití modelu klíčových slov se sadou Speech SDK

Prohlédněte si ukázku na GitHubu pro použití modelu vlastního klíčového slova se sadou Objective C SDK. I když momentálně nemáme ukázku Swiftu pro paritu, koncepty jsou podobné.

Poznámka:

Pokud ve své aplikaci Swift v iOSu použijete rozpoznávání klíčových slov, mějte na paměti, že nové modely klíčových slov vytvořené v sadě Speech Studio budou vyžadovat použití sady Speech SDK xcframework z https://aka.ms/csspeech/iosbinaryembedded projektu nebo podu MicrosoftCognitiveServicesSpeechEmbedded-iOS ve vašem projektu.

Referenční dokumentace | Package (PyPi) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. V sadě Speech Studio vytvoříte modely klíčových slov. Pak vyexportujte soubor modelu, který používáte se sadou Speech SDK ve vašich aplikacích.

Požadavky

Předplatné Azure. Můžete si ho zdarma vytvořit.
Na webu Azure Portal vytvořte prostředek služby AI Services pro službu Speech .
Získejte klíč prostředku a oblast služby Speech. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče.

Vytvoření klíčového slova v sadě Speech Studio

Než budete moct použít vlastní klíčové slovo, musíte vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v sadě Speech Studio. Jakmile zadáte klíčové slovo, vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet pouze v sadě Speech Studio. Vlastní klíčová slova nelze vytvořit ze sady SDK ani pomocí volání REST.

Přejděte do sady Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte do části Vytváření služeb Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte název, popis a jazyk vlastního projektu klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je aktuálně omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte název modelu, popisu a klíčového slova podle vašeho výběru a pak vyberte Další. Přečtěte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří pro vaše klíčové slovo kandidátské výslovnosti. Poslechněte si každého kandidáta tak, že vyberete tlačítka přehrávání a odeberete kontroly vedle všech výslovností, které jsou nesprávné. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé říkají klíčové slovo, a pak výběrem možnosti Další začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznamoblastích
Kvůli vysoké poptávce může trénování základního modelu trvat několik hodin. Dokončení trénování pokročilého modelu může trvat až den. Po dokončení trénování se stav změní ze zpracování na Úspěch .
V sbalitelné nabídce na levé straně vyberte Ladit možnosti, které chcete vyladit a stáhnout model. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete .table se sadou SDK, proto si poznamenejte jeho cestu.

Použití modelu klíčových slov se sadou Speech SDK

Prohlédněte si ukázku na GitHubu pro použití modelu vlastních klíčových slov se sadou Python SDK.

Speech to text REST API reference | Speech to text REST API for short audio reference | Additional samples on GitHub

Rozhraní REST API pro převod řeči na text nepodporuje rozpoznávání klíčových slov. Vyberte jiný programovací jazyk nebo odkaz a ukázky propojené od začátku tohoto článku.

Rozhraní příkazového řádku služby Speech podporuje rozpoznávání klíčových slov, ale zatím jsme tu nezahrnuli průvodce. Začněte výběrem jiného programovacího jazyka a seznamte se s koncepty.

Sdílet prostřednictvím

Rychlý start: Vytvoření vlastního klíčového slova

Požadavky

Vytvoření klíčového slova v sadě Speech Studio

Použití modelu klíčových slov se sadou Speech SDK

Průběžné rozpoznávání

autor: eric-urban ms.service: azure-ai-speech ms.topic: include ms.date: 9/12/2024 ms.author: eur

Vytvoření klíčového slova v sadě Speech Studio

Použití modelu klíčových slov se sadou Speech SDK

Požadavky

Vytvoření klíčového slova v sadě Speech Studio

Použití modelu klíčových slov se sadou Speech SDK

Požadavky

Vytvoření klíčového slova v sadě Speech Studio

Použití modelu klíčových slov se sadou Speech SDK

Požadavky

Vytvoření klíčového slova v sadě Speech Studio

Použití modelu klíčových slov se sadou Speech SDK

Další kroky

Váš názor

Další materiály