Datasets - Upload
Lädt Daten hoch und erstellt ein neues Dataset.
POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
display
|
formData | True |
string |
Der Name dieses Datasets. |
kind
|
formData | True |
string |
Die Art des Datasets. Mögliche Werte sind "Language", "Acoustic", "Aussprache", "AudioFiles", "LanguageMarkdown", "OutputFormatting". |
locale
|
formData | True |
string |
Das Gebietsschema dieses Datasets. |
custom
|
formData |
string |
Die optionalen benutzerdefinierten Eigenschaften dieser Entität. Die maximal zulässige Schlüssellänge beträgt 64 Zeichen, die maximal zulässige Wertlänge 256 Zeichen und die Anzahl der zulässigen Einträge beträgt 10. |
|
data
|
formData |
file |
Bei akustischen Datasets eine ZIP-Datei mit den Audiodaten und eine Textdatei, die die Transkriptionen für die Audiodaten enthält. Bei Sprachdatasets eine Textdatei, die die Sprach- oder Aussprachedaten enthält. In beiden Fällen erforderlich. |
|
description
|
formData |
string |
Optionale Beschreibung dieses Datasets. |
|
email
|
formData |
string |
Eine optionale Zeichenfolge, die die E-Mail-Adresse enthält, an die E-Mail-Benachrichtigungen gesendet werden sollen, falls der Vorgang abgeschlossen ist. Der Wert wird entfernt, nachdem die E-Mail erfolgreich gesendet wurde. |
|
project
|
formData |
string |
Die optionale Zeichenfolgendarstellung der URL eines Projekts. Wenn festgelegt, wird das Dataset diesem Projekt zugeordnet. |
|
endpoint
|
path | True |
string |
Unterstützte Cognitive Services-Endpunkte (Protokoll und Hostname, z. B. ). https://westus.api.cognitive.microsoft.com |
Antworten
Name | Typ | Beschreibung |
---|---|---|
201 Created |
Die Antwort enthält Informationen über die Entität als Nutzlast und ihren Speicherort als Header. Header Location: string |
|
Other Status Codes |
Ein Fehler ist aufgetreten. |
Sicherheit
Ocp-Apim-Subscription-Key
Geben Sie hier Ihren Cognitive Services-Kontoschlüssel an.
Typ:
apiKey
In:
header
Authorization
Stellen Sie ein Zugriffstoken aus dem JWT bereit, das vom STS dieser Region zurückgegeben wird. Fügen Sie dem Token den Verwaltungsbereich hinzu, indem Sie der STS-URL die folgende Abfragezeichenfolge hinzufügen: ?scope=speechservicesmanagement
Typ:
apiKey
In:
header
Beispiele
Upload a dataset
Beispielanforderung
POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload
Beispiel für eine Antwort
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definitionen
Name | Beschreibung |
---|---|
Dataset |
Dataset |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Fehler |
Error |
ErrorCode |
Inner |
InnerError |
Status |
Status |
Text |
TextNormalizationKind |
Dataset
Dataset
Name | Typ | Beschreibung |
---|---|---|
contentUrl |
string |
Die URL der Daten für das Dataset. |
createdDateTime |
string |
Der Zeitstempel, bei dem das Objekt erstellt wurde. Der Zeitstempel ist als ISO 8601-Datums- und Uhrzeitformat codiert ("JJJJ-MM-TTThh:mm:ssZ", siehe https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
Die benutzerdefinierten Eigenschaften dieser Entität. Die maximal zulässige Schlüssellänge beträgt 64 Zeichen, die maximal zulässige Wertlänge 256 Zeichen und die Anzahl der zulässigen Einträge beträgt 10. |
description |
string |
Die Beschreibung des -Objekts. |
displayName |
string |
Der Anzeigename des Objekts. |
kind |
DatasetKind |
|
lastActionDateTime |
string |
Der Zeitstempel, bei dem der aktuelle status eingegeben wurde. Der Zeitstempel ist als ISO 8601-Datums- und Uhrzeitformat codiert ("JJJJ-MM-TTThh:mm:ssZ", siehe https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string |
Das Gebietsschema der enthaltenen Daten. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string |
Der Speicherort dieser Entität. |
status |
Status |
DatasetKind
DatasetKind
Name | Typ | Beschreibung |
---|---|---|
Acoustic |
string |
Ein Akustikdataset. |
AudioFiles |
string |
Ein Dataset für Audiodateien. |
Language |
string |
Ein Sprachdataset. |
LanguageMarkdown |
string |
Ein Sprachmarkdowndataset. |
OutputFormatting |
string |
Dataset, das Regeln zum Anpassen der Normalisierung von inversen Texten, Großschreibung, Neuformulierung, Profanität enthält und auch Tests für die Datasetvalidierung definiert |
Pronunciation |
string |
Ein Aussprachedataset. |
DatasetLinks
DatasetLinks
Name | Typ | Beschreibung |
---|---|---|
commitBlocks |
string |
Der Speicherort, an dem die Liste der Blöcke beim Hochladen eines Datasets mithilfe von Blöcken committet werden soll. Weitere Informationen finden Sie unter Vorgang "Datasets_CommitBlocks". |
files |
string |
Der Speicherort, an dem alle Dateien dieser Entität abgerufen werden. Weitere Informationen finden Sie unter Vorgang "Datasets_ListFiles". |
listBlocks |
string |
Der Speicherort, an dem die bereits hochgeladenen Blöcke dieser Entität beim Hochladen eines Datasets mithilfe von Blöcken aufgelistet werden sollen. Weitere Informationen finden Sie unter Vorgang "Datasets_GetBlocks". |
uploadBlocks |
string |
Der Speicherort, an den Blöcke beim Hochladen eines Datasets mithilfe von Blöcken hochgeladen werden sollen. Weitere Informationen finden Sie unter Vorgang "Datasets_UploadBlock". |
DatasetProperties
DatasetProperties
Name | Typ | Beschreibung |
---|---|---|
acceptedLineCount |
integer |
Die Anzahl der Zeilen, die für dieses Dataset akzeptiert werden. |
duration |
string |
Die Gesamtdauer der Datasets, wenn sie Audiodateien enthalten. Die Dauer ist als ISO 8601-Dauer codiert ("PnYnMnDTnHnMnS", siehe https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
Die E-Mail-Adresse, an die E-Mail-Benachrichtigungen gesendet werden sollen, falls der Vorgang abgeschlossen ist. Der Wert wird entfernt, nachdem die E-Mail erfolgreich gesendet wurde. |
|
error |
EntityError |
|
rejectedLineCount |
integer |
Die Anzahl der Zeilen, die für dieses Dataset abgelehnt wurden. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Name | Typ | Beschreibung |
---|---|---|
DataImportFailed |
string |
Fehler beim Datenimport. |
DeleteNotAllowed |
string |
Löschen nicht zulässig. |
DeployNotAllowed |
string |
Bereitstellen ist nicht zulässig. |
DeployingFailedModel |
string |
Bereitstellen eines fehlerhaften Modells. |
EmptyRequest |
string |
Leere Anforderung. |
EndpointCannotBeDefault |
string |
Der Endpunkt kann nicht standardmäßig sein. |
EndpointNotUpdatable |
string |
Endpunkt nicht aktualisierbar. |
EndpointWithoutLogging |
string |
Endpunkt ohne Protokollierung. |
ExceededNumberOfRecordingsUris |
string |
Die Anzahl der Aufzeichnungsuris wurde überschritten. |
FailedDataset |
string |
Fehlgeschlagenes Dataset. |
Forbidden |
string |
Unzulässig. |
InUseViolation |
string |
In der Nutzungsverletzung. |
InaccessibleCustomerStorage |
string |
Nicht zugänglicher Kundenspeicher. |
InvalidAdaptationMapping |
string |
Ungültige Anpassungszuordnung. |
InvalidBaseModel |
string |
Ungültiges Basismodell. |
InvalidCallbackUri |
string |
Ungültiger Rückruf-URI. |
InvalidCollection |
string |
Ungültige Auflistung. |
InvalidDataset |
string |
Ungültiges Dataset. |
InvalidDocument |
string |
Ungültiges Dokument. |
InvalidDocumentBatch |
string |
Ungültiger Dokumentbatch. |
InvalidLocale |
string |
Ungültiges Gebietsschema. |
InvalidLogDate |
string |
Ungültiges Protokolldatum. |
InvalidLogEndTime |
string |
Ungültige Protokollendzeit. |
InvalidLogId |
string |
Ungültige Protokoll-ID. |
InvalidLogStartTime |
string |
Ungültige Protokollstartzeit. |
InvalidModel |
string |
Ungültiges Modell. |
InvalidModelUri |
string |
Ungültiger Modell-URI. |
InvalidParameter |
string |
Ungültiger Parameter. |
InvalidParameterValue |
string |
Ungültiger Parameterwert. |
InvalidPayload |
string |
Ungültige Nutzlast. |
InvalidPermissions |
string |
Ungültige Berechtigungen. |
InvalidPrerequisite |
string |
Ungültige Voraussetzung. |
InvalidProductId |
string |
Ungültige Produkt-ID. |
InvalidProject |
string |
Ungültiges Projekt. |
InvalidProjectKind |
string |
Ungültige Projektart. |
InvalidRecordingsUri |
string |
Ungültiger Aufzeichnungs-URI. |
InvalidRequestBodyFormat |
string |
Ungültiges Anforderungstextformat. |
InvalidSasValidityDuration |
string |
Ungültige sas-Gültigkeitsdauer. |
InvalidSkipTokenForLogs |
string |
Ungültiges Überspringen von Token für Protokolle. |
InvalidSourceAzureResourceId |
string |
Ungültige Azure-Quellressourcen-ID. |
InvalidSubscription |
string |
Ungültiges Abonnement. |
InvalidTest |
string |
Ungültiger Test. |
InvalidTimeToLive |
string |
Ungültige Gültigkeitsdauer. |
InvalidTopForLogs |
string |
Ungültiger Oberteil für Protokolle. |
InvalidTranscription |
string |
Ungültige Transkription. |
InvalidWebHookEventKind |
string |
Ungültige Web hook-Ereignisart. |
MissingInputRecords |
string |
Fehlende Eingabedatensätze. |
ModelCopyOperationExists |
string |
Der Modellkopiervorgang ist vorhanden. |
ModelDeploymentNotCompleteState |
string |
Der Zustand der Modellbereitstellung ist nicht abgeschlossen. |
ModelDeprecated |
string |
Das Modell ist veraltet. |
ModelExists |
string |
Das Modell ist vorhanden. |
ModelMismatch |
string |
Modellkonflikt. |
ModelNotDeployable |
string |
Das Modell kann nicht bereitgestellt werden. |
ModelVersionIncorrect |
string |
Modellversion falsch. |
NoUtf8WithBom |
string |
Kein utf8 mit Bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Nur eine der URLs, container oder datasets. |
ProjectGenderMismatch |
string |
Projekt gender mismatch. |
QuotaViolation |
string |
Kontingentverletzung. |
SingleDefaultEndpoint |
string |
Einzelner Standardendpunkt. |
SkuLimitsExist |
string |
Sku-Grenzwerte sind vorhanden. |
SubscriptionNotFound |
string |
Abonnement wurde nicht gefunden. |
UnexpectedError |
string |
Unerwarteter Fehler. |
UnsupportedClassBasedAdaptation |
string |
Nicht unterstützte klassenbasierte Anpassung. |
UnsupportedDelta |
string |
Nicht unterstütztes Delta. |
UnsupportedDynamicConfiguration |
string |
Nicht unterstützte dynamische Konfiguration. |
UnsupportedFilter |
string |
Nicht unterstützter Filter. |
UnsupportedLanguageCode |
string |
Nicht unterstützter Sprachcode. |
UnsupportedOrderBy |
string |
Nicht unterstützte Reihenfolge nach. |
UnsupportedPagination |
string |
Nicht unterstützte Paginierung. |
UnsupportedTimeRange |
string |
Nicht unterstützte Zeitbereiche. |
EntityError
EntityError
Name | Typ | Beschreibung |
---|---|---|
code |
string |
Der Code dieses Fehlers. |
message |
string |
Die Meldung für diesen Fehler. |
EntityReference
EntityReference
Name | Typ | Beschreibung |
---|---|---|
self |
string |
Der Speicherort der Entität, auf die verwiesen wird. |
Error
Fehler
Name | Typ | Beschreibung |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Zusätzliche unterstützende Details zum Fehler und/oder zu den erwarteten Richtlinien. |
innerError |
InnerError |
|
message |
string |
Allgemeine Fehlermeldung. |
target |
string |
Die Ursache des Fehlers. Dies wäre z. B. „Dokumente“ oder „Dokument-ID“ im Falle eines ungültigen Dokuments. |
ErrorCode
ErrorCode
Name | Typ | Beschreibung |
---|---|---|
Conflict |
string |
Stellt den Konfliktfehlercode dar. |
Forbidden |
string |
Stellt den unzulässigen Fehlercode dar. |
InternalCommunicationFailed |
string |
Stellt den fehlerlosen Fehlercode für die interne Kommunikation dar. |
InternalServerError |
string |
Stellt den internen Fehlercode des Servers dar. |
InvalidArgument |
string |
Stellt den Fehlercode des ungültigen Arguments dar. |
InvalidRequest |
string |
Stellt den ungültigen Anforderungsfehlercode dar. |
NotAllowed |
string |
Stellt den nicht zulässigen Fehlercode dar. |
NotFound |
string |
Stellt den nicht gefundenen Fehlercode dar. |
PipelineError |
string |
Stellt den Pipelinefehlerfehlercode dar. |
ServiceUnavailable |
string |
Stellt den nicht verfügbaren Fehlercode des Diensts dar. |
TooManyRequests |
string |
Stellt den Fehlercode für zu viele Anforderungen dar. |
Unauthorized |
string |
Stellt den nicht autorisierten Fehlercode dar. |
UnprocessableEntity |
string |
Stellt den Fehlercode für nicht bearbeitbare Entitäten dar. |
UnsupportedMediaType |
string |
Stellt den Fehlercode für nicht unterstützte Medientypen dar. |
InnerError
InnerError
Name | Typ | Beschreibung |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Zusätzliche unterstützende Details zum Fehler und/oder zu den erwarteten Richtlinien. |
innerError |
InnerError |
|
message |
string |
Allgemeine Fehlermeldung. |
target |
string |
Die Ursache des Fehlers. Dies wäre z. B. „Dokumente“ oder „Dokument-ID“ im Falle eines ungültigen Dokuments. |
Status
Status
Name | Typ | Beschreibung |
---|---|---|
Failed |
string |
Bei dem Vorgang mit langer Ausführungsdauer ist ein Fehler aufgetreten. |
NotStarted |
string |
Der lang andauernde Vorgang wurde noch nicht gestartet. |
Running |
string |
Der Vorgang mit langer Ausführungszeit wird derzeit verarbeitet. |
Succeeded |
string |
Der vorgang mit langer Ausführungsdauer wurde erfolgreich abgeschlossen. |
TextNormalizationKind
TextNormalizationKind
Name | Typ | Beschreibung |
---|---|---|
Default |
string |
Standardtextnormalisierung (z. B. "2 bis 3" wird in en-US durch "two to three" ersetzt). |
None |
string |
Auf den Eingabetext wird keine Textnormalisierung angewendet. Dies ist eine Überschreibungsoption, die nur verwendet werden sollte, wenn Text vor dem Upload normalisiert wird. |