Migrace kódu z verze 3.1 na v3.2 rozhraní REST API
Rozhraní REST API pro převod řeči na text se používá k rychlému přepisu, dávkovému přepisu a vlastní řeči. Tento článek popisuje změny verze 3.1 na 3.2.
Důležité
Verze 2024-11-15
rozhraní REST API pro převod řeči na text je obecně dostupná nejnovější verze.
- Verze
2024-05-15-preview
rozhraní REST API pro převod řeči na text bude k datu oznámení vyřazena. - Rozhraní REST API
v3.0
pro převod řeči na text , ,3.2-preview.1
v3.1
v3.2
, a3.2-preview.2
bude vyřazeno 1. dubna 2026.
Další informace o upgradu najdete v průvodcích migrací rozhraní REST API pro převod řeči na text v3.0 na verzi 3.1, v3.1 na verzi 3.2 a v3.2 až 2024-11-15 .
Základní cesta
Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.1
do /speechtotext/v3.2
. Pokud například chcete získat základní modely v eastus
oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base
místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
.
Další informace najdete v části ID operací dále v této příručce.
Dávkový přepis
Důležité
Nové ceny platí pro dávkový přepis prostřednictvím rozhraní REST API pro převod řeči na text v3.2. Další informace najdete v průvodci cenami.
Omezení zpětné kompatibility
Nepoužívejte službu Speech k textovému rozhraní REST API verze 3.0 nebo v3.1 k načtení přepisu vytvořeného prostřednictvím rozhraní REST API pro převod řeči na text v3.2. Může se zobrazit chybová zpráva typu Verze rozhraní API se nedá použít pro přístup k tomuto přepisu. Použijte rozhraní API verze 3.2 nebo vyšší."
Režim identifikace jazyka
Je LanguageIdentificationMode
přidán jako LanguageIdentificationProperties
candidateLocales
speechModelMapping
stejné a . Režimy, které jsou k dispozici pro identifikaci jazyka, jsou Continuous
nebo Single
. Výchozí je průběžná identifikace jazyka. Další informace naleznete v tématu Identifikace jazyka.
Šeptající modely
Azure AI Speech teď podporuje model šeptající OpenAI prostřednictvím rozhraní REST API pro text v3.2. Další informace najdete v průvodci vytvořením dávkového přepisu .
Poznámka:
Služba Azure OpenAI podporuje také model šeptajícího jazyka OpenAI pro převod řeči na text pomocí synchronního rozhraní REST API. Další informace najdete v rychlém startu. Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.
Vlastní řeč
Důležité
Pokud byl základní model vytvořen 1. října 2023 a novější, budou se vám účtovat poplatky za trénování vlastního modelu řeči. Pokud byl základní model vytvořený před říjnem 2023, nebude se vám účtovat za trénování. Další informace najdete v tématu Ceny služby Azure AI Speech.
Pokud chcete programově určit, zda byl model vytvořen před nebo po 1. říjnu 2023, použijte chargedForAdaptation
vlastnost, která je nová ve verzi 3.2.
Vlastní formátování textu pro zobrazení
Pokud chcete podporovat přizpůsobení modelu s vlastními daty formátování textu pro zobrazení, operace Datasets_Create podporuje typ dat OutputFormatting. Další informace najdete v tématu nahrání datových sad.
Byla přidána definice pro OutputFormatType
hodnoty výčtu Lexical
a Display
výčtu.
"OutputFormatType": {
"title": "OutputFormatType",
"enum": [
"Lexical",
"Display"
],
"type": "string",
"x-ms-enum": {
"name": "OutputFormatType",
"modelAsString": true,
"values": [
{
"value": "Lexical",
"description": "Model provides the transcription output without formatting."
},
{
"value": "Display",
"description": "Model supports display formatting transcriptions output or endpoints."
}
]
}
},
Hodnota OutputFormattingData
výčtu se přidá do FileKind
(typ vstupních dat).
Vlastnost supportedOutputFormat
je přidána do BaseModelFeatures
. Tato vlastnost se nachází v definici BaseModel
.
"BaseModelFeatures": {
"title": "BaseModelFeatures",
"description": "Features supported by the model.",
"type": "object",
"allOf": [
{
"$ref": "#/definitions/SharedModelFeatures"
}
],
"properties": {
"supportsAdaptationsWith": {
"description": "Supported dataset kinds to adapt the model.",
"type": "array",
"items": {
"$ref": "#/definitions/DatasetKind"
},
"readOnly": true
},
"supportedOutputFormat": {
"description": "Supported output formats.",
"type": "array",
"items": {
"$ref": "#/definitions/OutputFormatType"
},
"readOnly": true
}
}
},
Poplatek za přizpůsobení
Vlastnost chargeForAdaptation
je přidána do BaseModelProperties
. Tato vlastnost se nachází v definici BaseModel
.
Důležité
Pokud byl základní model vytvořen 1. října 2023 a novější, budou se vám účtovat poplatky za trénování vlastního modelu řeči. Pokud byl základní model vytvořený před říjnem 2023, nebude se vám účtovat za trénování. Další informace najdete v tématu Ceny služby Azure AI Speech.
Pokud je true
hodnota chargeForAdaptation
, bude se vám účtovat trénování modelu. Pokud je false
hodnota, účtuje se vám trénování modelu. chargeForAdaptation
Pomocí vlastnosti místo data vytvoření můžete programově určit, jestli se vám bude účtovat trénování modelu.
"BaseModelProperties": {
"title": "BaseModelProperties",
"type": "object",
"properties": {
"deprecationDates": {
"$ref": "#/definitions/BaseModelDeprecationDates"
},
"features": {
"$ref": "#/definitions/BaseModelFeatures"
},
"chargeForAdaptation": {
"description": "A value indicating whether model adaptation is charged.",
"type": "boolean",
"readOnly": true
}
}
},
Normalizace textu
Vlastnost textNormalizationKind
je přidána do DatasetProperties
.
Definice entity pro TextNormalizationKind: Druh normalizace textu.
- Výchozí: Výchozí normalizace textu (například "dva až tři" nahradí hodnotu 2 až 3 v en-US).
- Žádné: U vstupního textu se nepoužije normalizace textu. Tato hodnota je možnost přepsání, která by měla být použita pouze v případě, že je text normalizován před odesláním.
Vlastnosti vyhodnocení
Přidání vlastností počtu tokenů a chyb tokenu EvaluationProperties
do vlastností:
correctTokenCount1
: Počet správně rozpoznaných tokenů podle modelu 1.tokenCount1
: Počet zpracovaných tokenů podle modelu 1.tokenDeletionCount1
: Počet rozpoznanýchtokenchchtokenErrorRate1
: Míra chyb tokenu rozpoznávání pomocí modelu 1.tokenInsertionCount1
: Počet rozpoznaných tokenů podle modelu 1, které jsou vloženy.tokenSubstitutionCount1
: Počet rozpoznaných slov podle modelu 1, která jsou nahrazována.correctTokenCount2
: Počet správně rozpoznaných tokenů podle modelu2.tokenCount2
: Počet zpracovaných tokenů podle modelu2.tokenDeletionCount2
: Počet rozpoznaných tokenů podle modelu2, které se odstraní.tokenErrorRate2
: Míra chyb tokenu rozpoznávání s modelem 2.tokenInsertionCount2
: Počet rozpoznaných tokenů podle modelu 2, které jsou vloženy.tokenSubstitutionCount2
: Počet rozpoznaných slov podle modelu2, která jsou nahrazována.
Kopírování modelu
Následující změny platí pro scénář, ve kterém model kopírujete.
- Přidání nové operace Models_Copy Toto je schéma v nové operaci kopírování:
"$ref": "#/definitions/ModelCopyAuthorization"
- Zastaralá operace Models_CopyTo . Tady je schéma v zastaralé operaci kopírování:
"$ref": "#/definitions/ModelCopy"
- Přidání nové operace Models_AuthorizeCopy , která vrací
"$ref": "#/definitions/ModelCopyAuthorization"
. Tuto vrácenou entitu lze použít v nové operaci Models_Copy .
Přidání nové definice entity pro ModelCopyAuthorization
:
"ModelCopyAuthorization": {
"title": "ModelCopyAuthorization",
"required": [
"expirationDateTime",
"id",
"sourceResourceId",
"targetResourceEndpoint",
"targetResourceId",
"targetResourceRegion"
],
"type": "object",
"properties": {
"targetResourceRegion": {
"description": "The region (aka location) of the target speech resource (e.g., westus2).",
"minLength": 1,
"type": "string"
},
"targetResourceId": {
"description": "The Azure Resource ID of the target speech resource.",
"minLength": 1,
"type": "string"
},
"targetResourceEndpoint": {
"description": "The endpoint (base url) of the target resource (with custom domain name when it is used).",
"minLength": 1,
"type": "string"
},
"sourceResourceId": {
"description": "The Azure Resource ID of the source speech resource.",
"minLength": 1,
"type": "string"
},
"expirationDateTime": {
"format": "date-time",
"description": "The expiration date of this copy authorization.",
"type": "string"
},
"id": {
"description": "The ID of this copy authorization.",
"minLength": 1,
"type": "string"
}
}
},
Přidání nové definice entity pro ModelCopyAuthorizationDefinition
:
"ModelCopyAuthorizationDefinition": {
"title": "ModelCopyAuthorizationDefinition",
"required": [
"sourceResourceId"
],
"type": "object",
"properties": {
"sourceResourceId": {
"description": "The Azure Resource ID of the source speech resource.",
"minLength": 1,
"type": "string"
}
}
},
Vlastnosti kopírování CustomModelLinks
Byla přidána nová copy
vlastnost.
copyTo
Identifikátor URI: Umístění zastaralé akce kopírování modelu. Další podrobnosti najdete v operaci Models_CopyTo .copy
Identifikátor URI: Umístění akce kopírování modelu. Další podrobnosti najdete v operaci Models_Copy .
"CustomModelLinks": {
"title": "CustomModelLinks",
"type": "object",
"properties": {
"copyTo": {
"format": "uri",
"description": "The location to the obsolete model copy action. See operation \"Models_CopyTo\" for more details.",
"type": "string",
"readOnly": true
},
"copy": {
"format": "uri",
"description": "The location to the model copy action. See operation \"Models_Copy\" for more details.",
"type": "string",
"readOnly": true
},
"files": {
"format": "uri",
"description": "The location to get all files of this entity. See operation \"Models_ListFiles\" for more details.",
"type": "string",
"readOnly": true
},
"manifest": {
"format": "uri",
"description": "The location to get a manifest for this model to be used in the on-prem container. See operation \"Models_GetCustomModelManifest\" for more details.",
"type": "string",
"readOnly": true
}
},
"readOnly": true
},
ID operací
Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.1
do /speechtotext/v3.2
. Pokud například chcete získat základní modely v eastus
oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base
místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
.