Migrace kódu z verze 3.0 do verze 3.1 rozhraní REST API
Rozhraní REST API pro převod řeči na text se používá k rychlému přepisu, dávkovému přepisu a vlastní řeči. Změny z verze 3.0 na 3.1 jsou popsány v následujících částech.
Důležité
Verze 2024-11-15
rozhraní REST API pro převod řeči na text je obecně dostupná nejnovější verze.
- Verze
2024-05-15-preview
rozhraní REST API pro převod řeči na text bude k datu oznámení vyřazena. - Rozhraní REST API
v3.0
pro převod řeči na text , ,3.2-preview.1
v3.1
v3.2
, a3.2-preview.2
bude vyřazeno 1. dubna 2026.
Další informace o upgradu najdete v průvodcích migrací rozhraní REST API pro převod řeči na text v3.0 na verzi 3.1, v3.1 na verzi 3.2 a v3.2 až 2024-11-15 .
Základní cesta
Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.0
do /speechtotext/v3.1
. Pokud například chcete získat základní modely v eastus
oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base
.
Všimněte si těchto dalších změn:
- Operace
/models/{id}/copyto
(včetně /) ve verzi 3.0 se nahradí/models/{id}:copyto
operací (včetně :) ve verzi 3.1. - Operace
/webhooks/{id}/ping
(včetně /) ve verzi 3.0 se nahradí/webhooks/{id}:ping
operací (včetně :) ve verzi 3.1. - Operace
/webhooks/{id}/test
(včetně /) ve verzi 3.0 se nahradí/webhooks/{id}:test
operací (včetně :) ve verzi 3.1.
Další informace najdete v části ID operací dále v této příručce.
Dávkový přepis
Poznámka:
Nepoužívejte službu Speech k textovému rozhraní REST API v3.0 k načtení přepisu vytvořeného prostřednictvím rozhraní REST API pro převod řeči na text v3.1. Zobrazí se například chybová zpráva: "Verzi rozhraní API nelze použít pro přístup k tomuto přepisu. Použijte prosím rozhraní API verze 3.1 nebo vyšší."
V operaci Transcriptions_Create jsou přidány následující tři vlastnosti:
- Vlastnost
displayFormWordLevelTimestampsEnabled
lze použít k povolení generování sestav časových razítek na úrovni slova ve formě zobrazení výsledků přepisu. Výsledky se vrátí vedisplayWords
vlastnosti souboru přepisu. - Vlastnost
diarization
lze použít k určení nápovědy pro minimální a maximální počet popisků mluvčího, které se generují při provádění volitelné diarizace (oddělení mluvčího). Díky této funkci teď služba dokáže generovat popisky mluvčího pro více než dva reproduktory. Chcete-li použít tuto vlastnost, musíte také nastavitdiarizationEnabled
vlastnost natrue
. S rozhraním API v3.1 jsme zvýšili počet mluvčích, které je možné identifikovat prostřednictvím diarizace ze dvou reproduktorů podporovaných rozhraním API verze 3.0. Doporučujeme zachovat počet reproduktorů pod 30, aby byl výkon lepší. - Vlastnost
languageIdentification
lze použít k určení nastavení pro identifikaci jazyka na vstupu před přepisem. Pro identifikaci jazyka se podporuje až 10 kandidátských národních prostředí. Vrácený přepis obsahuje novoulocale
vlastnost pro rozpoznaný jazyk nebo národní prostředí, které jste zadali.
Vlastnost filter
se přidá do operací Transcriptions_List, Transcriptions_ListFiles a Projects_ListTranscriptions . Výraz filter
lze použít k výběru podmnožina dostupných prostředků. Můžete filtrovat podle displayName
, , description
createdDateTime
, lastActionDateTime
status
a locale
. Příklad: filter=createdDateTime gt 2022-02-01T11:00:00Z
Pokud k příjmu oznámení o stavu přepisu používáte webhook, mějte na paměti, že webhooky vytvořené prostřednictvím rozhraní API verze 3.0 nemůžou přijímat oznámení o žádostech o přepis V3.1. Abyste mohli přijímat oznámení o požadavcích přepisu verze 3.1, musíte vytvořit nový koncový bod webhooku prostřednictvím rozhraní API verze 3.1.
Vlastní řeč
Datové sady
Pro nahrávání a správu více datových bloků datové sady se přidávají následující operace:
- Datasets_UploadBlock – Nahrajte blok dat pro datovou sadu. Maximální velikost bloku je 8MiB.
- Datasets_GetBlocks – Získejte seznam nahraných bloků pro tuto datovou sadu.
- Datasets_CommitBlocks – Potvrzení seznamu blokovaných položek pro dokončení nahrávání datové sady
Pokud chcete podporovat přizpůsobení modelu strukturovaným textem v datech markdownu , operace Datasets_Create teď podporuje datový typ LanguageMarkdown . Další informace najdete v tématu nahrání datových sad.
Modely
Operace Models_ListBaseModels a Models_GetBaseModel vrací informace o typu přizpůsobení podporovaném jednotlivými základními modely.
"features": {
"supportsAdaptationsWith": [
"Acoustic",
"Language",
"LanguageMarkdown",
"Pronunciation"
]
}
Operace Models_Create má novou customModelWeightPercent
vlastnost, kde můžete určit váhu použitou při použití vlastního jazykového modelu (trénovaného z prostých nebo strukturovaných textových dat) v kombinaci se základním jazykovým modelem. Platné hodnoty jsou celá čísla od 1 do 100. Výchozí hodnota je aktuálně 30.
Vlastnost filter
se přidá do následujících operací:
- Datasets_List
- Datasets_ListFiles
- Endpoints_List
- Evaluations_List
- Evaluations_ListFiles
- Models_ListBaseModels
- Models_ListCustomModels
- Projects_List
- Projects_ListDatasets
- Projects_ListEndpoints
- Projects_ListEvaluations
- Projects_ListModels
Výraz filter
lze použít k výběru podmnožina dostupných prostředků. Můžete filtrovat podle displayName
, , description
createdDateTime
, lastActionDateTime
status
, , locale
, , a kind
. Příklad: filter=locale eq 'en-US'
Přidání operace Models_ListFiles pro získání souborů modelu identifikovaných daným ID.
Přidání operace Models_GetFile pro získání jednoho konkrétního souboru (identifikovaného pomocí fileId) z modelu (identifikovaného s ID). To vám umožní načíst soubor ModelReport , který poskytuje informace o datech zpracovávaných během trénování.
ID operací
Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.0
do /speechtotext/v3.1
. Pokud například chcete získat základní modely v eastus
oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base
.
Název každého z nich operationId
ve verzi 3.1 má předponu názvu objektu. Například při vytvoření modelu ve verzi 3.0 došlo ke změně objektu operationId
CreateModel ve verzi 3.0 na Models_Create ve verzi 3.1.
Operace /models/{id}/copyto
(včetně /) ve verzi 3.0 se nahradí /models/{id}:copyto
operací (včetně :) ve verzi 3.1.
Operace /webhooks/{id}/ping
(včetně /) ve verzi 3.0 se nahradí /webhooks/{id}:ping
operací (včetně :) ve verzi 3.1.
Operace /webhooks/{id}/test
(včetně /) ve verzi 3.0 se nahradí /webhooks/{id}:test
operací (včetně :) ve verzi 3.1.