Datasets - Create
Nahraje a vytvoří novou datovou sadu získáním dat ze zadané adresy URL nebo začne čekat na nahrání datových bloků.
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
Parametry identifikátoru URI
Name | V | Vyžadováno | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com). |
Text požadavku
Name | Vyžadováno | Typ | Description |
---|---|---|---|
displayName | True |
string minLength: 1 |
Zobrazovaný název objektu. |
kind | True |
DatasetKind |
|
locale | True |
string minLength: 1 |
Národní prostředí obsažených dat. |
contentUrl |
string (uri) |
Adresa URL dat datové sady |
|
customProperties |
object |
Vlastní vlastnosti této entity. Maximální povolená délka klíče je 64 znaků, maximální povolená délka je 256 znaků a počet povolených položek je 10. |
|
description |
string |
Popis objektu. |
|
project |
EntityReference |
||
properties |
DatasetProperties |
Odpovědi
Name | Typ | Description |
---|---|---|
201 Created |
Odpověď obsahuje informace o entitě jako datové části a jeho umístění jako záhlaví. Hlavičky Location: string |
|
Other Status Codes |
Došlo k chybě. |
Zabezpečení
Ocp-Apim-Subscription-Key
Tady zadejte svůj klíč účtu služeb Cognitive Services.
Typ:
apiKey
V:
header
Authorization
Zadejte přístupový token z JWT vráceného službou STS této oblasti. Nezapomeňte do tokenu přidat obor správy přidáním následujícího řetězce dotazu do adresy URL služby STS: ?scope=speechservicesmanagement
Typ:
apiKey
V:
header
Příklady
Create a dataset with content url |
Create dataset from data blocks |
Create a dataset with content url
Ukázkový požadavek
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"contentUrl": "https://contoso.com/location",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Ukázková odpověď
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Create dataset from data blocks
Ukázkový požadavek
POST {endpoint}/speechtotext/v3.2-preview.2/datasets
{
"kind": "Acoustic",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Ukázková odpověď
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
"commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
"listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
"uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "NotStarted",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definice
Name | Description |
---|---|
Dataset |
Datová sada |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Chyba |
Error |
Kód chyby |
Inner |
Vnitřní chyba |
Status |
Stav |
Text |
TextNormalizationKind |
Dataset
Datová sada
Name | Typ | Description |
---|---|---|
contentUrl |
string (uri) |
Adresa URL dat datové sady |
createdDateTime |
string (date-time) |
Časové razítko při vytvoření objektu. Časové razítko je kódováno jako formát data a času ISO 8601 ("RRRR-MM-DDThh:mm:ssZ", viz https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
Vlastní vlastnosti této entity. Maximální povolená délka klíče je 64 znaků, maximální povolená délka je 256 znaků a počet povolených položek je 10. |
description |
string |
Popis objektu. |
displayName |
string minLength: 1 |
Zobrazovaný název objektu. |
kind |
DatasetKind |
|
lastActionDateTime |
string (date-time) |
Časové razítko, kdy byl zadán aktuální stav. Časové razítko je kódováno jako formát data a času ISO 8601 ("RRRR-MM-DDThh:mm:ssZ", viz https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string minLength: 1 |
Národní prostředí obsažených dat. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string (uri) |
Umístění této entity. |
status |
Stav |
DatasetKind
DatasetKind
Hodnota | Description |
---|---|
Acoustic |
Akustická datová sada. |
AudioFiles |
Datová sada zvukových souborů |
Language |
Datová sada jazyka. |
LanguageMarkdown |
Datová sada markdownu jazyka. |
OutputFormatting |
Datová sada, která obsahuje pravidla pro přizpůsobení normalizace inverzního textu, psaní velkých písmen, přeformátování, vulgárních výrazů a také definuje testy pro ověření datové sady. |
Pronunciation |
Datová sada výslovnosti. |
DatasetLinks
DatasetLinks
Name | Typ | Description |
---|---|---|
commitBlocks |
string (uri) |
Umístění pro potvrzení seznamu bloků při nahrávání datové sady pomocí bloků. Další podrobnosti najdete v operaci "Datasets_CommitBlocks". |
files |
string (uri) |
Umístění pro získání všech souborů této entity. Další podrobnosti najdete v operaci "Datasets_ListFiles". |
listBlocks |
string (uri) |
Umístění pro výpis již nahraných bloků této entity při nahrávání datové sady pomocí bloků. Další podrobnosti najdete v operaci "Datasets_GetBlocks". |
uploadBlocks |
string (uri) |
Umístění pro nahrání bloků při nahrávání datové sady pomocí bloků Další podrobnosti najdete v operaci "Datasets_UploadBlock". |
DatasetProperties
DatasetProperties
Name | Typ | Description |
---|---|---|
acceptedLineCount |
integer (int32) |
Počet řádků přijatých pro tuto sadu dat. |
duration |
string |
Celková doba trvání datových sad, pokud obsahuje zvukové soubory. Doba trvání je kódována jako ISO 8601 duration ("PnYnMnDTnHnMnS", viz https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
E-mailová adresa pro odesílání e-mailových oznámení pro případ, že se operace dokončí. Hodnota se odebere po úspěšném odeslání e-mailu. |
|
error |
EntityError |
|
rejectedLineCount |
integer (int32) |
Počet řádků odmítnutých pro tuto sadu dat. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Hodnota | Description |
---|---|
DataImportFailed |
Import dat se nezdařil. |
DeleteNotAllowed |
Odstranění není povoleno. |
DeployNotAllowed |
Nasazení není povoleno. |
DeployingFailedModel |
Nasazení neúspěšného modelu |
EmptyRequest |
Prázdný požadavek. |
EndpointCannotBeDefault |
Koncový bod nemůže být výchozí. |
EndpointNotUpdatable |
Koncový bod nejde aktualizovat. |
EndpointWithoutLogging |
Koncový bod bez protokolování |
ExceededNumberOfRecordingsUris |
Byl překročen počet nahrávek. |
FailedDataset |
Datová sada se nezdařila. |
Forbidden |
Zakázaný. |
InUseViolation |
V narušení používání. |
InaccessibleCustomerStorage |
Nepřístupné úložiště zákazníka |
InvalidAdaptationMapping |
Neplatné mapování adaptací |
InvalidBaseModel |
Neplatný základní model |
InvalidCallbackUri |
Neplatný identifikátor URI zpětného volání. |
InvalidCollection |
Neplatná kolekce. |
InvalidDataset |
Neplatná datová sada |
InvalidDocument |
Neplatný dokument |
InvalidDocumentBatch |
Neplatná dávka dokumentu |
InvalidLocale |
Neplatné národní prostředí |
InvalidLogDate |
Neplatné datum protokolu |
InvalidLogEndTime |
Neplatný čas ukončení protokolu |
InvalidLogId |
Neplatné ID protokolu |
InvalidLogStartTime |
Neplatný čas spuštění protokolu |
InvalidModel |
Neplatný model. |
InvalidModelUri |
Neplatný identifikátor URI modelu |
InvalidParameter |
Neplatný parametr. |
InvalidParameterValue |
Neplatná hodnota parametru |
InvalidPayload |
Neplatná datová část |
InvalidPermissions |
Neplatná oprávnění |
InvalidPrerequisite |
Neplatný požadavek. |
InvalidProductId |
Neplatné ID produktu |
InvalidProject |
Neplatný projekt. |
InvalidProjectKind |
Neplatný druh projektu. |
InvalidRecordingsUri |
Identifikátor URI pro neplatné nahrávky |
InvalidRequestBodyFormat |
Neplatný formát textu požadavku |
InvalidSasValidityDuration |
Neplatná doba platnosti SAS. |
InvalidSkipTokenForLogs |
Neplatný token pro přeskočení protokolů |
InvalidSourceAzureResourceId |
Neplatné ID zdroje prostředku Azure |
InvalidSubscription |
Neplatné předplatné |
InvalidTest |
Neplatný test. |
InvalidTimeToLive |
Neplatný čas naživo. |
InvalidTopForLogs |
Neplatný horní okraj pro protokoly. |
InvalidTranscription |
Neplatný přepis |
InvalidWebHookEventKind |
Neplatný druh události webhooku |
MissingInputRecords |
Chybí vstupní záznamy. |
ModelCopyOperationExists |
Operace kopírování modelu existuje. |
ModelDeploymentNotCompleteState |
Nasazení modelu není dokončeno. |
ModelDeprecated |
Model je zastaralý. |
ModelExists |
Model existuje. |
ModelMismatch |
Neshoda modelů |
ModelNotDeployable |
Model nejde nasadit. |
ModelVersionIncorrect |
Verze modelu není správná. |
NoUtf8WithBom |
No utf8 with bom. |
OnlyOneOfUrlsOrContainerOrDataset |
Pouze jedna z adres URL nebo kontejneru nebo datové sady. |
ProjectGenderMismatch |
Neshoda pohlaví projektu |
QuotaViolation |
Porušení kvóty |
SingleDefaultEndpoint |
Jeden výchozí koncový bod |
SkuLimitsExist |
Existují omezení skladové položky. |
SubscriptionNotFound |
Předplatné se nenašlo. |
UnexpectedError |
Neočekávaná chyba |
UnsupportedClassBasedAdaptation |
Nepodporovaná úprava založená na třídách. |
UnsupportedDelta |
Nepodporovaný rozdíl. |
UnsupportedDynamicConfiguration |
Nepodporovaná dynamická konfigurace |
UnsupportedFilter |
Nepodporovaný filtr |
UnsupportedLanguageCode |
Nepodporovaný kód jazyka |
UnsupportedOrderBy |
Nepodporované pořadí podle. |
UnsupportedPagination |
Nepodporované stránkování |
UnsupportedTimeRange |
Nepodporovaný časový rozsah |
EntityError
EntityError
Name | Typ | Description |
---|---|---|
code |
string |
Kód této chyby. |
message |
string |
Zpráva pro tuto chybu. |
EntityReference
EntityReference
Name | Typ | Description |
---|---|---|
self |
string (uri) |
Umístění odkazované entity. |
Error
Chyba
Name | Typ | Description |
---|---|---|
code |
Kód chyby |
|
details |
Error[] |
Další podrobnosti podpory týkající se chyb a/nebo očekávaných zásad |
innerError |
Vnitřní chyba |
|
message |
string |
Chybová zpráva vysoké úrovně |
target |
string |
Zdroj chyby. Například v případě neplatného dokumentu by to bylo "dokumenty" nebo "ID dokumentu". |
ErrorCode
Kód chyby
Hodnota | Description |
---|---|
Conflict |
Představuje kód chyby konfliktu. |
Forbidden |
Představuje zakázaný kód chyby. |
InternalCommunicationFailed |
Představuje kód chyby selhání interní komunikace. |
InternalServerError |
Představuje kód chyby vnitřní chyby serveru. |
InvalidArgument |
Představuje neplatný kód chyby argumentu. |
InvalidRequest |
Představuje neplatný kód chyby požadavku. |
NotAllowed |
Představuje kód chyby, který není povolený. |
NotFound |
Představuje kód chyby, který nebyl nalezen. |
PipelineError |
Představuje kód chyby kanálu. |
ServiceUnavailable |
Představuje kód chyby nedostupné služby. |
TooManyRequests |
Představuje kód chyby příliš velkého počtu požadavků. |
Unauthorized |
Představuje neautorizovaný kód chyby. |
UnprocessableEntity |
Představuje nezpracovaný kód chyby entity. |
UnsupportedMediaType |
Představuje nepodporovaný kód chyby typu média. |
InnerError
Vnitřní chyba
Name | Typ | Description |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Další podrobnosti podpory týkající se chyb a/nebo očekávaných zásad |
innerError |
Vnitřní chyba |
|
message |
string |
Chybová zpráva vysoké úrovně |
target |
string |
Zdroj chyby. Například v případě neplatného dokumentu by to bylo "dokumenty" nebo "ID dokumentu". |
Status
Stav
Hodnota | Description |
---|---|
Failed |
Dlouhotrvající operace se nezdařila. |
NotStarted |
Dlouhotrvající operace ještě nebyla spuštěna. |
Running |
Dlouhotrvající operace se právě zpracovává. |
Succeeded |
Dlouhotrvající operace byla úspěšně dokončena. |
TextNormalizationKind
TextNormalizationKind
Hodnota | Description |
---|---|
Default |
Výchozí normalizace textu (např. "2 až 3" se v en-USnahrazuje "2 až tři"). |
None |
Na vstupní text se nepoužije normalizace textu. Jedná se o možnost přepsání, která by se měla použít jenom v případě, že je text normalizován před odesláním. |