Freigeben über


Datasets - Upload

Lädt Daten hoch und erstellt ein neues Dataset.

POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload

URI-Parameter

Name In Erforderlich Typ Beschreibung
displayName
formData True

string

Der Name dieses Datasets.

kind
formData True

string

Die Art des Datasets. Mögliche Werte sind "Language", "Acoustic", "Aussprache", "AudioFiles", "LanguageMarkdown", "OutputFormatting".

locale
formData True

string

Das Gebietsschema dieses Datasets.

customProperties
formData

string

Die optionalen benutzerdefinierten Eigenschaften dieser Entität. Die maximal zulässige Schlüssellänge beträgt 64 Zeichen, die maximal zulässige Wertlänge 256 Zeichen und die Anzahl der zulässigen Einträge beträgt 10.

data
formData

file

Bei akustischen Datasets eine ZIP-Datei mit den Audiodaten und eine Textdatei, die die Transkriptionen für die Audiodaten enthält. Bei Sprachdatasets eine Textdatei, die die Sprach- oder Aussprachedaten enthält. In beiden Fällen erforderlich.

description
formData

string

Optionale Beschreibung dieses Datasets.

email
formData

string

Eine optionale Zeichenfolge, die die E-Mail-Adresse enthält, an die E-Mail-Benachrichtigungen gesendet werden sollen, falls der Vorgang abgeschlossen ist. Der Wert wird entfernt, nachdem die E-Mail erfolgreich gesendet wurde.

project
formData

string

Die optionale Zeichenfolgendarstellung der URL eines Projekts. Wenn festgelegt, wird das Dataset diesem Projekt zugeordnet.

endpoint
path True

string

Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. ). https://westus.api.cognitive.microsoft.com

Antworten

Name Typ Beschreibung
201 Created

Dataset

Die Antwort enthält Informationen über die Entität als Nutzlast und ihren Speicherort als Header.

Header

Location: string

Other Status Codes

Error

Ein Fehler ist aufgetreten.

Sicherheit

Ocp-Apim-Subscription-Key

Geben Sie hier Ihren Cognitive Services-Kontoschlüssel an.

Typ: apiKey
In: header

Authorization

Stellen Sie ein Zugriffstoken aus dem JWT bereit, das vom STS dieser Region zurückgegeben wird. Fügen Sie dem Token den Verwaltungsbereich hinzu, indem Sie der STS-URL die folgende Abfragezeichenfolge hinzufügen: ?scope=speechservicesmanagement

Typ: apiKey
In: header

Beispiele

Upload a dataset

Beispielanforderung

POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload

Beispiel für eine Antwort

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definitionen

Name Beschreibung
Dataset

Dataset

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Fehler

ErrorCode

ErrorCode

InnerError

InnerError

Status

Status

TextNormalizationKind

TextNormalizationKind

Dataset

Dataset

Name Typ Beschreibung
contentUrl

string

Die URL der Daten für das Dataset.

createdDateTime

string

Der Zeitstempel, bei dem das Objekt erstellt wurde. Der Zeitstempel ist als ISO 8601-Datums- und Uhrzeitformat codiert ("JJJJ-MM-TTThh:mm:ssZ", siehe https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

Die benutzerdefinierten Eigenschaften dieser Entität. Die maximal zulässige Schlüssellänge beträgt 64 Zeichen, die maximal zulässige Wertlänge 256 Zeichen und die Anzahl der zulässigen Einträge beträgt 10.

description

string

Die Beschreibung des -Objekts.

displayName

string

Der Anzeigename des Objekts.

kind

DatasetKind

DatasetKind
Typ des Datenimports.

lastActionDateTime

string

Der Zeitstempel, bei dem der aktuelle status eingegeben wurde. Der Zeitstempel ist als ISO 8601-Datums- und Uhrzeitformat codiert ("JJJJ-MM-TTThh:mm:ssZ", siehe https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

Das Gebietsschema der enthaltenen Daten.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string

Der Speicherort dieser Entität.

status

Status

Status
Beschreiben des aktuellen Zustands der API

DatasetKind

DatasetKind

Name Typ Beschreibung
Acoustic

string

Ein Akustikdataset.

AudioFiles

string

Ein Dataset für Audiodateien.

Language

string

Ein Sprachdataset.

LanguageMarkdown

string

Ein Sprachmarkdowndataset.

OutputFormatting

string

Dataset, das Regeln zum Anpassen der Normalisierung von inversen Texten, Großschreibung, Neuformulierung, Profanität enthält und auch Tests für die Datasetvalidierung definiert

Pronunciation

string

Ein Aussprachedataset.

DatasetLinks

Name Typ Beschreibung
commitBlocks

string

Der Speicherort, an dem die Liste der Blöcke beim Hochladen eines Datasets mithilfe von Blöcken committet werden soll. Weitere Informationen finden Sie unter Vorgang "Datasets_CommitBlocks".

files

string

Der Speicherort, an dem alle Dateien dieser Entität abgerufen werden. Weitere Informationen finden Sie unter Vorgang "Datasets_ListFiles".

listBlocks

string

Der Speicherort, an dem die bereits hochgeladenen Blöcke dieser Entität beim Hochladen eines Datasets mithilfe von Blöcken aufgelistet werden sollen. Weitere Informationen finden Sie unter Vorgang "Datasets_GetBlocks".

uploadBlocks

string

Der Speicherort, an den Blöcke beim Hochladen eines Datasets mithilfe von Blöcken hochgeladen werden sollen. Weitere Informationen finden Sie unter Vorgang "Datasets_UploadBlock".

DatasetProperties

DatasetProperties

Name Typ Beschreibung
acceptedLineCount

integer

Die Anzahl der Zeilen, die für dieses Dataset akzeptiert werden.

duration

string

Die Gesamtdauer der Datasets, wenn sie Audiodateien enthalten. Die Dauer ist als ISO 8601-Dauer codiert ("PnYnMnDTnHnMnS", siehe https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

Die E-Mail-Adresse, an die E-Mail-Benachrichtigungen gesendet werden sollen, falls der Vorgang abgeschlossen ist. Der Wert wird entfernt, nachdem die E-Mail erfolgreich gesendet wurde.

error

EntityError

EntityError

rejectedLineCount

integer

Die Anzahl der Zeilen, die für dieses Dataset abgelehnt wurden.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Die Art der Textnormalisierung.

DetailedErrorCode

DetailedErrorCode

Name Typ Beschreibung
DataImportFailed

string

Fehler beim Datenimport.

DeleteNotAllowed

string

Löschen nicht zulässig.

DeployNotAllowed

string

Bereitstellen ist nicht zulässig.

DeployingFailedModel

string

Bereitstellen eines fehlerhaften Modells.

EmptyRequest

string

Leere Anforderung.

EndpointCannotBeDefault

string

Der Endpunkt kann nicht standardmäßig sein.

EndpointNotUpdatable

string

Endpunkt nicht aktualisierbar.

EndpointWithoutLogging

string

Endpunkt ohne Protokollierung.

ExceededNumberOfRecordingsUris

string

Die Anzahl der Aufzeichnungsuris wurde überschritten.

FailedDataset

string

Fehlgeschlagenes Dataset.

Forbidden

string

Unzulässig.

InUseViolation

string

In der Nutzungsverletzung.

InaccessibleCustomerStorage

string

Nicht zugänglicher Kundenspeicher.

InvalidAdaptationMapping

string

Ungültige Anpassungszuordnung.

InvalidBaseModel

string

Ungültiges Basismodell.

InvalidCallbackUri

string

Ungültiger Rückruf-URI.

InvalidCollection

string

Ungültige Auflistung.

InvalidDataset

string

Ungültiges Dataset.

InvalidDocument

string

Ungültiges Dokument.

InvalidDocumentBatch

string

Ungültiger Dokumentbatch.

InvalidLocale

string

Ungültiges Gebietsschema.

InvalidLogDate

string

Ungültiges Protokolldatum.

InvalidLogEndTime

string

Ungültige Protokollendzeit.

InvalidLogId

string

Ungültige Protokoll-ID.

InvalidLogStartTime

string

Ungültige Protokollstartzeit.

InvalidModel

string

Ungültiges Modell.

InvalidModelUri

string

Ungültiger Modell-URI.

InvalidParameter

string

Ungültiger Parameter.

InvalidParameterValue

string

Ungültiger Parameterwert.

InvalidPayload

string

Ungültige Nutzlast.

InvalidPermissions

string

Ungültige Berechtigungen.

InvalidPrerequisite

string

Ungültige Voraussetzung.

InvalidProductId

string

Ungültige Produkt-ID.

InvalidProject

string

Ungültiges Projekt.

InvalidProjectKind

string

Ungültige Projektart.

InvalidRecordingsUri

string

Ungültiger Aufzeichnungs-URI.

InvalidRequestBodyFormat

string

Ungültiges Anforderungstextformat.

InvalidSasValidityDuration

string

Ungültige sas-Gültigkeitsdauer.

InvalidSkipTokenForLogs

string

Ungültiges Überspringen von Token für Protokolle.

InvalidSourceAzureResourceId

string

Ungültige Azure-Quellressourcen-ID.

InvalidSubscription

string

Ungültiges Abonnement.

InvalidTest

string

Ungültiger Test.

InvalidTimeToLive

string

Ungültige Gültigkeitsdauer.

InvalidTopForLogs

string

Ungültiger Oberteil für Protokolle.

InvalidTranscription

string

Ungültige Transkription.

InvalidWebHookEventKind

string

Ungültige Web hook-Ereignisart.

MissingInputRecords

string

Fehlende Eingabedatensätze.

ModelCopyOperationExists

string

Der Modellkopiervorgang ist vorhanden.

ModelDeploymentNotCompleteState

string

Der Zustand der Modellbereitstellung ist nicht abgeschlossen.

ModelDeprecated

string

Das Modell ist veraltet.

ModelExists

string

Das Modell ist vorhanden.

ModelMismatch

string

Modellkonflikt.

ModelNotDeployable

string

Das Modell kann nicht bereitgestellt werden.

ModelVersionIncorrect

string

Modellversion falsch.

NoUtf8WithBom

string

Kein utf8 mit Bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Nur eine der URLs, container oder datasets.

ProjectGenderMismatch

string

Projekt gender mismatch.

QuotaViolation

string

Kontingentverletzung.

SingleDefaultEndpoint

string

Einzelner Standardendpunkt.

SkuLimitsExist

string

Sku-Grenzwerte sind vorhanden.

SubscriptionNotFound

string

Abonnement wurde nicht gefunden.

UnexpectedError

string

Unerwarteter Fehler.

UnsupportedClassBasedAdaptation

string

Nicht unterstützte klassenbasierte Anpassung.

UnsupportedDelta

string

Nicht unterstütztes Delta.

UnsupportedDynamicConfiguration

string

Nicht unterstützte dynamische Konfiguration.

UnsupportedFilter

string

Nicht unterstützter Filter.

UnsupportedLanguageCode

string

Nicht unterstützter Sprachcode.

UnsupportedOrderBy

string

Nicht unterstützte Reihenfolge nach.

UnsupportedPagination

string

Nicht unterstützte Paginierung.

UnsupportedTimeRange

string

Nicht unterstützte Zeitbereiche.

EntityError

EntityError

Name Typ Beschreibung
code

string

Der Code dieses Fehlers.

message

string

Die Meldung für diesen Fehler.

EntityReference

EntityReference

Name Typ Beschreibung
self

string

Der Speicherort der Entität, auf die verwiesen wird.

Error

Fehler

Name Typ Beschreibung
code

ErrorCode

ErrorCode
Allgemeine Fehlercodes.

details

Error[]

Zusätzliche unterstützende Details zum Fehler und/oder zu den erwarteten Richtlinien.

innerError

InnerError

InnerError
Neues Innere Fehlerformat, das den Cognitive Services-API-Richtlinien entspricht, die unter https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owverfügbar ist. Enthält die erforderlichen Eigenschaften ErrorCode, Message und Optional Properties Target, Details (Key Value Pair), Inner Error (kann geschachtelt werden).

message

string

Allgemeine Fehlermeldung.

target

string

Die Ursache des Fehlers. Dies wäre z. B. „Dokumente“ oder „Dokument-ID“ im Falle eines ungültigen Dokuments.

ErrorCode

ErrorCode

Name Typ Beschreibung
Conflict

string

Stellt den Konfliktfehlercode dar.

Forbidden

string

Stellt den unzulässigen Fehlercode dar.

InternalCommunicationFailed

string

Stellt den fehlerlosen Fehlercode für die interne Kommunikation dar.

InternalServerError

string

Stellt den internen Fehlercode des Servers dar.

InvalidArgument

string

Stellt den Fehlercode des ungültigen Arguments dar.

InvalidRequest

string

Stellt den ungültigen Anforderungsfehlercode dar.

NotAllowed

string

Stellt den nicht zulässigen Fehlercode dar.

NotFound

string

Stellt den nicht gefundenen Fehlercode dar.

PipelineError

string

Stellt den Pipelinefehlerfehlercode dar.

ServiceUnavailable

string

Stellt den nicht verfügbaren Fehlercode des Diensts dar.

TooManyRequests

string

Stellt den Fehlercode für zu viele Anforderungen dar.

Unauthorized

string

Stellt den nicht autorisierten Fehlercode dar.

UnprocessableEntity

string

Stellt den Fehlercode für nicht bearbeitbare Entitäten dar.

UnsupportedMediaType

string

Stellt den Fehlercode für nicht unterstützte Medientypen dar.

InnerError

InnerError

Name Typ Beschreibung
code

DetailedErrorCode

DetailedErrorCode
Detaillierte Fehlercodeenume.

details

object

Zusätzliche unterstützende Details zum Fehler und/oder zu den erwarteten Richtlinien.

innerError

InnerError

InnerError
Neues Innere Fehlerformat, das den Cognitive Services-API-Richtlinien entspricht, die unter https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owverfügbar ist. Enthält die erforderlichen Eigenschaften ErrorCode, Message und Optional Properties Target, Details (Key Value Pair), Inner Error (kann geschachtelt werden).

message

string

Allgemeine Fehlermeldung.

target

string

Die Ursache des Fehlers. Dies wäre z. B. „Dokumente“ oder „Dokument-ID“ im Falle eines ungültigen Dokuments.

Status

Status

Name Typ Beschreibung
Failed

string

Bei dem Vorgang mit langer Ausführungsdauer ist ein Fehler aufgetreten.

NotStarted

string

Der lang andauernde Vorgang wurde noch nicht gestartet.

Running

string

Der Vorgang mit langer Ausführungszeit wird derzeit verarbeitet.

Succeeded

string

Der vorgang mit langer Ausführungsdauer wurde erfolgreich abgeschlossen.

TextNormalizationKind

TextNormalizationKind

Name Typ Beschreibung
Default

string

Standardtextnormalisierung (z. B. "2 bis 3" wird in en-US durch "two to three" ersetzt).

None

string

Auf den Eingabetext wird keine Textnormalisierung angewendet. Dies ist eine Überschreibungsoption, die nur verwendet werden sollte, wenn Text vor dem Upload normalisiert wird.