Sdílet prostřednictvím


Datasets - Create

Nahraje a vytvoří novou datovou sadu získáním dat ze zadané adresy URL nebo začne čekat na nahrání datových bloků.

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
endpoint
path True

string

Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://westus.api.cognitive.microsoft.com).

Text požadavku

Name Vyžadováno Typ Description
displayName True

string

minLength: 1

Zobrazovaný název objektu.

kind True

DatasetKind

DatasetKind
Typ importu dat

locale True

string

minLength: 1

Národní prostředí obsažených dat.

contentUrl

string (uri)

Adresa URL dat datové sady

customProperties

object

Vlastní vlastnosti této entity. Maximální povolená délka klíče je 64 znaků, maximální povolená délka je 256 znaků a počet povolených položek je 10.

description

string

Popis objektu.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

Odpovědi

Name Typ Description
201 Created

Dataset

Odpověď obsahuje informace o entitě jako datové části a jeho umístění jako záhlaví.

Hlavičky

Location: string

Other Status Codes

Error

Došlo k chybě.

Zabezpečení

Ocp-Apim-Subscription-Key

Tady zadejte svůj klíč účtu služeb Cognitive Services.

Typ: apiKey
V: header

Authorization

Zadejte přístupový token z JWT vráceného službou STS této oblasti. Nezapomeňte do tokenu přidat obor správy přidáním následujícího řetězce dotazu do adresy URL služby STS: ?scope=speechservicesmanagement

Typ: apiKey
V: header

Příklady

Create a dataset with content url
Create dataset from data blocks

Create a dataset with content url

Ukázkový požadavek

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/location",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Ukázková odpověď

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Create dataset from data blocks

Ukázkový požadavek

POST {endpoint}/speechtotext/v3.2-preview.2/datasets

{
  "kind": "Acoustic",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Ukázková odpověď

{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
    "commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
    "listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
    "uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "NotStarted",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definice

Name Description
Dataset

Datová sada

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Chyba

ErrorCode

Kód chyby

InnerError

Vnitřní chyba

Status

Stav

TextNormalizationKind

TextNormalizationKind

Dataset

Datová sada

Name Typ Description
contentUrl

string (uri)

Adresa URL dat datové sady

createdDateTime

string (date-time)

Časové razítko při vytvoření objektu. Časové razítko je kódováno jako formát data a času ISO 8601 ("RRRR-MM-DDThh:mm:ssZ", viz https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

Vlastní vlastnosti této entity. Maximální povolená délka klíče je 64 znaků, maximální povolená délka je 256 znaků a počet povolených položek je 10.

description

string

Popis objektu.

displayName

string

minLength: 1

Zobrazovaný název objektu.

kind

DatasetKind

DatasetKind
Typ importu dat

lastActionDateTime

string (date-time)

Časové razítko, kdy byl zadán aktuální stav. Časové razítko je kódováno jako formát data a času ISO 8601 ("RRRR-MM-DDThh:mm:ssZ", viz https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

minLength: 1

Národní prostředí obsažených dat.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string (uri)

Umístění této entity.

status

Status

Stav
Popis aktuálního stavu rozhraní API

DatasetKind

DatasetKind

Hodnota Description
Acoustic

Akustická datová sada.

AudioFiles

Datová sada zvukových souborů

Language

Datová sada jazyka.

LanguageMarkdown

Datová sada markdownu jazyka.

OutputFormatting

Datová sada, která obsahuje pravidla pro přizpůsobení normalizace inverzního textu, psaní velkých písmen, přeformátování, vulgárních výrazů a také definuje testy pro ověření datové sady.

Pronunciation

Datová sada výslovnosti.

DatasetLinks

Name Typ Description
commitBlocks

string (uri)

Umístění pro potvrzení seznamu bloků při nahrávání datové sady pomocí bloků. Další podrobnosti najdete v operaci "Datasets_CommitBlocks".

files

string (uri)

Umístění pro získání všech souborů této entity. Další podrobnosti najdete v operaci "Datasets_ListFiles".

listBlocks

string (uri)

Umístění pro výpis již nahraných bloků této entity při nahrávání datové sady pomocí bloků. Další podrobnosti najdete v operaci "Datasets_GetBlocks".

uploadBlocks

string (uri)

Umístění pro nahrání bloků při nahrávání datové sady pomocí bloků Další podrobnosti najdete v operaci "Datasets_UploadBlock".

DatasetProperties

DatasetProperties

Name Typ Description
acceptedLineCount

integer (int32)

Počet řádků přijatých pro tuto sadu dat.

duration

string

Celková doba trvání datových sad, pokud obsahuje zvukové soubory. Doba trvání je kódována jako ISO 8601 duration ("PnYnMnDTnHnMnS", viz https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

E-mailová adresa pro odesílání e-mailových oznámení pro případ, že se operace dokončí. Hodnota se odebere po úspěšném odeslání e-mailu.

error

EntityError

EntityError

rejectedLineCount

integer (int32)

Počet řádků odmítnutých pro tuto sadu dat.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Druh normalizace textu.

DetailedErrorCode

DetailedErrorCode

Hodnota Description
DataImportFailed

Import dat se nezdařil.

DeleteNotAllowed

Odstranění není povoleno.

DeployNotAllowed

Nasazení není povoleno.

DeployingFailedModel

Nasazení neúspěšného modelu

EmptyRequest

Prázdný požadavek.

EndpointCannotBeDefault

Koncový bod nemůže být výchozí.

EndpointNotUpdatable

Koncový bod nejde aktualizovat.

EndpointWithoutLogging

Koncový bod bez protokolování

ExceededNumberOfRecordingsUris

Byl překročen počet nahrávek.

FailedDataset

Datová sada se nezdařila.

Forbidden

Zakázaný.

InUseViolation

V narušení používání.

InaccessibleCustomerStorage

Nepřístupné úložiště zákazníka

InvalidAdaptationMapping

Neplatné mapování adaptací

InvalidBaseModel

Neplatný základní model

InvalidCallbackUri

Neplatný identifikátor URI zpětného volání.

InvalidCollection

Neplatná kolekce.

InvalidDataset

Neplatná datová sada

InvalidDocument

Neplatný dokument

InvalidDocumentBatch

Neplatná dávka dokumentu

InvalidLocale

Neplatné národní prostředí

InvalidLogDate

Neplatné datum protokolu

InvalidLogEndTime

Neplatný čas ukončení protokolu

InvalidLogId

Neplatné ID protokolu

InvalidLogStartTime

Neplatný čas spuštění protokolu

InvalidModel

Neplatný model.

InvalidModelUri

Neplatný identifikátor URI modelu

InvalidParameter

Neplatný parametr.

InvalidParameterValue

Neplatná hodnota parametru

InvalidPayload

Neplatná datová část

InvalidPermissions

Neplatná oprávnění

InvalidPrerequisite

Neplatný požadavek.

InvalidProductId

Neplatné ID produktu

InvalidProject

Neplatný projekt.

InvalidProjectKind

Neplatný druh projektu.

InvalidRecordingsUri

Identifikátor URI pro neplatné nahrávky

InvalidRequestBodyFormat

Neplatný formát textu požadavku

InvalidSasValidityDuration

Neplatná doba platnosti SAS.

InvalidSkipTokenForLogs

Neplatný token pro přeskočení protokolů

InvalidSourceAzureResourceId

Neplatné ID zdroje prostředku Azure

InvalidSubscription

Neplatné předplatné

InvalidTest

Neplatný test.

InvalidTimeToLive

Neplatný čas naživo.

InvalidTopForLogs

Neplatný horní okraj pro protokoly.

InvalidTranscription

Neplatný přepis

InvalidWebHookEventKind

Neplatný druh události webhooku

MissingInputRecords

Chybí vstupní záznamy.

ModelCopyOperationExists

Operace kopírování modelu existuje.

ModelDeploymentNotCompleteState

Nasazení modelu není dokončeno.

ModelDeprecated

Model je zastaralý.

ModelExists

Model existuje.

ModelMismatch

Neshoda modelů

ModelNotDeployable

Model nejde nasadit.

ModelVersionIncorrect

Verze modelu není správná.

NoUtf8WithBom

No utf8 with bom.

OnlyOneOfUrlsOrContainerOrDataset

Pouze jedna z adres URL nebo kontejneru nebo datové sady.

ProjectGenderMismatch

Neshoda pohlaví projektu

QuotaViolation

Porušení kvóty

SingleDefaultEndpoint

Jeden výchozí koncový bod

SkuLimitsExist

Existují omezení skladové položky.

SubscriptionNotFound

Předplatné se nenašlo.

UnexpectedError

Neočekávaná chyba

UnsupportedClassBasedAdaptation

Nepodporovaná úprava založená na třídách.

UnsupportedDelta

Nepodporovaný rozdíl.

UnsupportedDynamicConfiguration

Nepodporovaná dynamická konfigurace

UnsupportedFilter

Nepodporovaný filtr

UnsupportedLanguageCode

Nepodporovaný kód jazyka

UnsupportedOrderBy

Nepodporované pořadí podle.

UnsupportedPagination

Nepodporované stránkování

UnsupportedTimeRange

Nepodporovaný časový rozsah

EntityError

EntityError

Name Typ Description
code

string

Kód této chyby.

message

string

Zpráva pro tuto chybu.

EntityReference

EntityReference

Name Typ Description
self

string (uri)

Umístění odkazované entity.

Error

Chyba

Name Typ Description
code

ErrorCode

Kód chyby
Kódy chyb vysoké úrovně.

details

Error[]

Další podrobnosti podpory týkající se chyb a/nebo očekávaných zásad

innerError

InnerError

Vnitřní chyba
Nový formát vnitřní chyby, který odpovídá pokynům rozhraní API služeb Cognitive Services, které jsou k dispozici v https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Obsahuje požadované vlastnosti ErrorCode, message and optional properties target, details(key value pair), inner error(this can be vnořováno).

message

string

Chybová zpráva vysoké úrovně

target

string

Zdroj chyby. Například v případě neplatného dokumentu by to bylo "dokumenty" nebo "ID dokumentu".

ErrorCode

Kód chyby

Hodnota Description
Conflict

Představuje kód chyby konfliktu.

Forbidden

Představuje zakázaný kód chyby.

InternalCommunicationFailed

Představuje kód chyby selhání interní komunikace.

InternalServerError

Představuje kód chyby vnitřní chyby serveru.

InvalidArgument

Představuje neplatný kód chyby argumentu.

InvalidRequest

Představuje neplatný kód chyby požadavku.

NotAllowed

Představuje kód chyby, který není povolený.

NotFound

Představuje kód chyby, který nebyl nalezen.

PipelineError

Představuje kód chyby kanálu.

ServiceUnavailable

Představuje kód chyby nedostupné služby.

TooManyRequests

Představuje kód chyby příliš velkého počtu požadavků.

Unauthorized

Představuje neautorizovaný kód chyby.

UnprocessableEntity

Představuje nezpracovaný kód chyby entity.

UnsupportedMediaType

Představuje nepodporovaný kód chyby typu média.

InnerError

Vnitřní chyba

Name Typ Description
code

DetailedErrorCode

DetailedErrorCode
Podrobný výčet kódu chyby

details

object

Další podrobnosti podpory týkající se chyb a/nebo očekávaných zásad

innerError

InnerError

Vnitřní chyba
Nový formát vnitřní chyby, který odpovídá pokynům rozhraní API služeb Cognitive Services, které jsou k dispozici v https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Obsahuje požadované vlastnosti ErrorCode, message and optional properties target, details(key value pair), inner error(this can be vnořováno).

message

string

Chybová zpráva vysoké úrovně

target

string

Zdroj chyby. Například v případě neplatného dokumentu by to bylo "dokumenty" nebo "ID dokumentu".

Status

Stav

Hodnota Description
Failed

Dlouhotrvající operace se nezdařila.

NotStarted

Dlouhotrvající operace ještě nebyla spuštěna.

Running

Dlouhotrvající operace se právě zpracovává.

Succeeded

Dlouhotrvající operace byla úspěšně dokončena.

TextNormalizationKind

TextNormalizationKind

Hodnota Description
Default

Výchozí normalizace textu (např. "2 až 3" se v en-USnahrazuje "2 až tři").

None

Na vstupní text se nepoužije normalizace textu. Jedná se o možnost přepsání, která by se měla použít jenom v případě, že je text normalizován před odesláním.