Datasets - Upload
Charge des données et crée un jeu de données.
POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
display
|
formData | True |
string |
Nom de ce jeu de données. |
kind
|
formData | True |
string |
Type du jeu de données. Les valeurs possibles sont « Language », « Acoustic », « Prononciation », « AudioFiles », « LanguageMarkdown », « OutputFormatting ». |
locale
|
formData | True |
string |
Paramètres régionaux de ce jeu de données. |
custom
|
formData |
string |
Propriétés personnalisées facultatives de cette entité. La longueur de clé maximale autorisée est de 64 caractères, la longueur maximale de la valeur autorisée est de 256 caractères et le nombre d’entrées autorisées est de 10. |
|
data
|
formData |
file |
Pour les jeux de données acoustiques, un fichier zip contenant les données audio et un fichier texte contenant les transcriptions des données audio. Pour les jeux de données de langue, un fichier texte contenant les données de langue ou de prononciation. Obligatoire dans les deux cas. |
|
description
|
formData |
string |
Description facultative de ce jeu de données. |
|
email
|
formData |
string |
Chaîne facultative contenant l’adresse e-mail à laquelle envoyer Notifications par e-mail au cas où l’opération se terminerait. La valeur sera supprimée après l’envoi de l’e-mail. |
|
project
|
formData |
string |
Représentation sous forme de chaîne facultative de l’URL d’un projet. S’il est défini, le jeu de données est associé à ce projet. |
|
endpoint
|
path | True |
string |
Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com). |
Réponses
Nom | Type | Description |
---|---|---|
201 Created |
La réponse contient des informations sur l’entité en tant que charge utile et son emplacement en tant qu’en-tête. En-têtes Location: string |
|
Other Status Codes |
Une erreur est survenue. |
Sécurité
Ocp-Apim-Subscription-Key
Fournissez votre clé de compte Cognitive Services ici.
Type:
apiKey
Dans:
header
Authorization
Fournissez un jeton d’accès à partir du JWT retourné par le STS de cette région. Veillez à ajouter l’étendue de gestion au jeton en ajoutant la chaîne de requête suivante à l’URL STS : ?scope=speechservicesmanagement
Type:
apiKey
Dans:
header
Exemples
Upload a dataset
Exemple de requête
POST {endpoint}/speechtotext/v3.2-preview.2/datasets/upload
Exemple de réponse
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Définitions
Nom | Description |
---|---|
Dataset |
Dataset |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Erreur |
Error |
ErrorCode |
Inner |
InnerError |
Status |
Statut |
Text |
TextNormalizationKind |
Dataset
Dataset
Nom | Type | Description |
---|---|---|
contentUrl |
string |
URL des données du jeu de données. |
createdDateTime |
string |
Horodatage lors de la création de l’objet. L’horodatage est encodé au format de date et d’heure ISO 8601 (« AAAA-MM-JJThh :mm :ssZ », voir https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
Propriétés personnalisées de cette entité. La longueur de clé maximale autorisée est de 64 caractères, la longueur maximale de la valeur autorisée est de 256 caractères et le nombre d’entrées autorisées est de 10. |
description |
string |
Description de l'objet . |
displayName |
string |
Nom complet de l’objet. |
kind |
DatasetKind |
|
lastActionDateTime |
string |
Horodatage lorsque le status actuel a été entré. L’horodatage est encodé au format de date et d’heure ISO 8601 (« AAAA-MM-JJThh :mm :ssZ », voir https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string |
Paramètres régionaux des données contenues. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string |
Emplacement de cette entité. |
status |
Statut |
DatasetKind
DatasetKind
Nom | Type | Description |
---|---|---|
Acoustic |
string |
Jeu de données acoustique. |
AudioFiles |
string |
Jeu de données de fichiers audio. |
Language |
string |
Jeu de données de langage. |
LanguageMarkdown |
string |
Jeu de données markdown de langage. |
OutputFormatting |
string |
Jeu de données qui contient des règles pour personnaliser la normalisation du texte inverse, la mise en majuscule, la reformulation, les blasphèmes et définit également des tests pour la validation du jeu de données |
Pronunciation |
string |
Jeu de données de prononciation. |
DatasetLinks
DatasetLinks
Nom | Type | Description |
---|---|---|
commitBlocks |
string |
Emplacement de validation de la liste des blocs lors du chargement d’un jeu de données à l’aide de blocs. Pour plus d’informations, consultez l’opération « Datasets_CommitBlocks ». |
files |
string |
Emplacement permettant d’obtenir tous les fichiers de cette entité. Pour plus d’informations, consultez l’opération « Datasets_ListFiles ». |
listBlocks |
string |
Emplacement permettant de répertorier les blocs déjà chargés de cette entité lors du chargement d’un jeu de données à l’aide de blocs. Pour plus d’informations, consultez l’opération « Datasets_GetBlocks ». |
uploadBlocks |
string |
L’emplacement vers lequel charger des blocs lors du chargement d’un jeu de données à l’aide de blocs. Pour plus d’informations, consultez l’opération « Datasets_UploadBlock ». |
DatasetProperties
DatasetProperties
Nom | Type | Description |
---|---|---|
acceptedLineCount |
integer |
Nombre de lignes acceptées pour ce jeu de données. |
duration |
string |
Durée totale des jeux de données s’ils contiennent des fichiers audio. La durée est encodée en tant que durée ISO 8601 (« PnYnMnDTnHnMnS », voir https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
Adresse e-mail à laquelle envoyer Notifications par e-mail au cas où l’opération se terminerait. La valeur sera supprimée après l’envoi de l’e-mail. |
|
error |
EntityError |
|
rejectedLineCount |
integer |
Nombre de lignes rejetées pour ce jeu de données. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Nom | Type | Description |
---|---|---|
DataImportFailed |
string |
Échec de l’importation des données. |
DeleteNotAllowed |
string |
Suppression non autorisée. |
DeployNotAllowed |
string |
Déploiement non autorisé. |
DeployingFailedModel |
string |
Déploiement d’un modèle ayant échoué. |
EmptyRequest |
string |
Requête vide. |
EndpointCannotBeDefault |
string |
Le point de terminaison ne peut pas être par défaut. |
EndpointNotUpdatable |
string |
Point de terminaison non modifiable. |
EndpointWithoutLogging |
string |
Point de terminaison sans journalisation. |
ExceededNumberOfRecordingsUris |
string |
Nombre d’URI d’enregistrements dépassé. |
FailedDataset |
string |
Échec du jeu de données. |
Forbidden |
string |
Interdit. |
InUseViolation |
string |
Violation en cours d’utilisation. |
InaccessibleCustomerStorage |
string |
Stockage client inaccessible. |
InvalidAdaptationMapping |
string |
Mappage d’adaptation non valide. |
InvalidBaseModel |
string |
Modèle de base non valide. |
InvalidCallbackUri |
string |
URI de rappel non valide. |
InvalidCollection |
string |
Collection non valide. |
InvalidDataset |
string |
Jeu de données non valide. |
InvalidDocument |
string |
Document non valide. |
InvalidDocumentBatch |
string |
Lot de documents non valide. |
InvalidLocale |
string |
Paramètres régionaux non valides. |
InvalidLogDate |
string |
Date de journal non valide. |
InvalidLogEndTime |
string |
Heure de fin du journal non valide. |
InvalidLogId |
string |
ID de journal non valide. |
InvalidLogStartTime |
string |
Heure de début du journal non valide. |
InvalidModel |
string |
Modèle non valide. |
InvalidModelUri |
string |
URI de modèle non valide. |
InvalidParameter |
string |
Paramètre non valide. |
InvalidParameterValue |
string |
Valeur de paramètre non valide. |
InvalidPayload |
string |
Charge utile non valide. |
InvalidPermissions |
string |
Autorisations non valides. |
InvalidPrerequisite |
string |
Prérequis non valides. |
InvalidProductId |
string |
ID de produit non valide. |
InvalidProject |
string |
Projet non valide. |
InvalidProjectKind |
string |
Type de projet non valide. |
InvalidRecordingsUri |
string |
URI des enregistrements non valides. |
InvalidRequestBodyFormat |
string |
Format du corps de la demande non valide. |
InvalidSasValidityDuration |
string |
Durée de validité sas non valide. |
InvalidSkipTokenForLogs |
string |
Jeton d’évitement non valide pour les journaux. |
InvalidSourceAzureResourceId |
string |
ID de ressource Azure source non valide. |
InvalidSubscription |
string |
Abonnement non valide. |
InvalidTest |
string |
Test non valide. |
InvalidTimeToLive |
string |
Durée de vie non valide. |
InvalidTopForLogs |
string |
Haut non valide pour les journaux. |
InvalidTranscription |
string |
Transcription non valide. |
InvalidWebHookEventKind |
string |
Type d’événement web hook non valide. |
MissingInputRecords |
string |
Enregistrements d’entrée manquants. |
ModelCopyOperationExists |
string |
L’opération de copie de modèle existe. |
ModelDeploymentNotCompleteState |
string |
État non terminé du déploiement du modèle. |
ModelDeprecated |
string |
Modèle déconseillé. |
ModelExists |
string |
Le modèle existe. |
ModelMismatch |
string |
Incompatibilité du modèle. |
ModelNotDeployable |
string |
Modèle non déployable. |
ModelVersionIncorrect |
string |
Version du modèle incorrecte. |
NoUtf8WithBom |
string |
Pas d’utf8 avec bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Une seule des URL, conteneur ou jeu de données. |
ProjectGenderMismatch |
string |
Projet d’incompatibilité entre les sexes. |
QuotaViolation |
string |
Violation de quota. |
SingleDefaultEndpoint |
string |
Point de terminaison par défaut unique. |
SkuLimitsExist |
string |
Il existe des limites de référence SKU. |
SubscriptionNotFound |
string |
Abonnement introuvable. |
UnexpectedError |
string |
Erreur inattendue. |
UnsupportedClassBasedAdaptation |
string |
Adaptation basée sur la classe non prise en charge. |
UnsupportedDelta |
string |
Delta non pris en charge. |
UnsupportedDynamicConfiguration |
string |
Configuration dynamique non prise en charge. |
UnsupportedFilter |
string |
Filtre non pris en charge. |
UnsupportedLanguageCode |
string |
Code de langue non pris en charge. |
UnsupportedOrderBy |
string |
Commande non prise en charge par. |
UnsupportedPagination |
string |
Pagination non prise en charge. |
UnsupportedTimeRange |
string |
Intervalle de temps non pris en charge. |
EntityError
EntityError
Nom | Type | Description |
---|---|---|
code |
string |
Code de cette erreur. |
message |
string |
Message correspondant à cette erreur. |
EntityReference
EntityReference
Nom | Type | Description |
---|---|---|
self |
string |
Emplacement de l’entité référencée. |
Error
Erreur
Nom | Type | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Détails supplémentaires concernant l’erreur et/ou les stratégies attendues. |
innerError |
InnerError |
|
message |
string |
Message d’erreur de haut niveau. |
target |
string |
Source de l’erreur. Par exemple, « documents » ou « document id » en présence d’un document non valide. |
ErrorCode
ErrorCode
Nom | Type | Description |
---|---|---|
Conflict |
string |
Représentant le code d’erreur de conflit. |
Forbidden |
string |
Représentant le code d’erreur interdit. |
InternalCommunicationFailed |
string |
Représentant le code d’erreur d’échec de la communication interne. |
InternalServerError |
string |
Représentant le code d’erreur du serveur interne. |
InvalidArgument |
string |
Représentant le code d’erreur de l’argument non valide. |
InvalidRequest |
string |
Représentant le code d’erreur de requête non valide. |
NotAllowed |
string |
Représentant le code d’erreur non autorisé. |
NotFound |
string |
Représentant le code d’erreur introuvable. |
PipelineError |
string |
Représentant le code d’erreur du pipeline. |
ServiceUnavailable |
string |
Représentant le code d’erreur du service indisponible. |
TooManyRequests |
string |
Représentant le code d’erreur trop grand nombre de requêtes. |
Unauthorized |
string |
Représentant le code d’erreur non autorisé. |
UnprocessableEntity |
string |
Représentant le code d’erreur d’entité non traité. |
UnsupportedMediaType |
string |
Représentant le code d’erreur du type de média non pris en charge. |
InnerError
InnerError
Nom | Type | Description |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Détails supplémentaires concernant l’erreur et/ou les stratégies attendues. |
innerError |
InnerError |
|
message |
string |
Message d’erreur de haut niveau. |
target |
string |
Source de l’erreur. Par exemple, « documents » ou « document id » en présence d’un document non valide. |
Status
Statut
Nom | Type | Description |
---|---|---|
Failed |
string |
L’opération de longue durée a échoué. |
NotStarted |
string |
L’opération de longue durée n’a pas encore démarré. |
Running |
string |
L’opération de longue durée est en cours de traitement. |
Succeeded |
string |
L’opération de longue durée s’est terminée avec succès. |
TextNormalizationKind
TextNormalizationKind
Nom | Type | Description |
---|---|---|
Default |
string |
Normalisation du texte par défaut (par exemple, « 2 à 3 » est remplacé par « deux à trois » en-US). |
None |
string |
Aucune normalisation de texte n’est appliquée au texte d’entrée. Il s’agit d’une option de remplacement qui ne doit être utilisée que lorsque le texte est normalisé avant le chargement. |