Datasets - Upload
Carga datos y crea un nuevo conjunto de datos.
POST {endpoint}/speechtotext/v3.2/datasets/upload
Parámetros de identificador URI
Nombre | En | Requerido | Tipo | Description |
---|---|---|---|---|
display
|
formData | True |
string |
Nombre de este conjunto de datos. |
kind
|
formData | True |
string |
Tipo del conjunto de datos. Los valores posibles son "Language", "Acoustic", "Pronunciation", "AudioFiles", "LanguageMarkdown", "OutputFormatting". |
locale
|
formData | True |
string |
Configuración regional de este conjunto de datos. |
custom
|
formData |
string |
Las propiedades personalizadas opcionales de esta entidad. La longitud máxima de clave permitida es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es de 10. |
|
data
|
formData |
file |
Para los conjuntos de datos acústicos, un archivo ZIP que contiene los datos de audio y un archivo de texto que contiene las transcripciones de los datos de audio. En el caso de los conjuntos de datos de idioma, un archivo de texto que contiene los datos de idioma o pronunciación. Obligatorio en ambos casos. |
|
description
|
formData |
string |
Descripción opcional de este conjunto de datos. |
|
email
|
formData |
string |
Cadena opcional que contiene la dirección de correo electrónico para enviar notificaciones por correo electrónico en caso de que se complete la operación. El valor se quitará después de enviar correctamente el correo electrónico. |
|
project
|
formData |
string |
Representación de cadena opcional de la dirección URL de un proyecto. Si se establece, el conjunto de datos se asociará a ese proyecto. |
|
endpoint
|
path | True |
string |
Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com). |
Respuestas
Nombre | Tipo | Description |
---|---|---|
201 Created |
La respuesta contiene información sobre la entidad como carga y su ubicación como encabezado. Encabezados Location: string |
|
Other Status Codes |
Se ha producido un error. |
Seguridad
Ocp-Apim-Subscription-Key
Proporcione aquí la clave de la cuenta de Cognitive Services.
Tipo:
apiKey
En:
header
Authorization
Proporcione un token de acceso del JWT devuelto por el STS de esta región. Asegúrese de agregar el ámbito de administración al token agregando la siguiente cadena de consulta a la dirección URL de STS: ?scope=speechservicesmanagement
Tipo:
apiKey
En:
header
Ejemplos
Upload a dataset
Solicitud de ejemplo
POST {endpoint}/speechtotext/v3.2/datasets/upload
Respuesta de muestra
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definiciones
Nombre | Description |
---|---|
Dataset |
Conjunto de datos |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Error |
Error |
ErrorCode |
Inner |
InnerError |
Status |
Estado |
Text |
TextNormalizationKind |
Dataset
Conjunto de datos
Nombre | Tipo | Description |
---|---|---|
contentUrl |
string (uri) |
Dirección URL de los datos del conjunto de datos. |
createdDateTime |
string (date-time) |
Marca de tiempo cuando se creó el objeto. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
Propiedades personalizadas de esta entidad. La longitud máxima de clave permitida es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es de 10. |
description |
string |
Descripción del objeto. |
displayName |
string minLength: 1 |
Nombre para mostrar del objeto. |
kind |
DatasetKind |
|
lastActionDateTime |
string (date-time) |
Marca de tiempo cuando se especificó el estado actual. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string minLength: 1 |
Configuración regional de los datos contenidos. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string (uri) |
Ubicación de esta entidad. |
status |
Estado |
DatasetKind
DatasetKind
Valor | Description |
---|---|
Acoustic |
Un conjunto de datos acústico. |
AudioFiles |
Un conjunto de datos de archivos de audio. |
Language |
Un conjunto de datos de idioma. |
LanguageMarkdown |
Un conjunto de datos markdown de lenguaje. |
OutputFormatting |
Conjunto de datos que contiene reglas para personalizar la normalización inversa de texto, la mayúsculas, la reforma, la soece y también define las pruebas para la validación del conjunto de datos. |
Pronunciation |
Un conjunto de datos de pronunciación. |
DatasetLinks
DatasetLinks
Nombre | Tipo | Description |
---|---|---|
commitBlocks |
string (uri) |
Ubicación para confirmar la lista de bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_CommitBlocks" para obtener más información. |
files |
string (uri) |
Ubicación para obtener todos los archivos de esta entidad. Consulte la operación "Datasets_ListFiles" para obtener más información. |
listBlocks |
string (uri) |
Ubicación para enumerar los bloques ya cargados de esta entidad al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_GetBlocks" para obtener más detalles. |
uploadBlocks |
string (uri) |
Ubicación a la que se cargan bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_UploadBlock" para obtener más información. |
DatasetProperties
DatasetProperties
Nombre | Tipo | Description |
---|---|---|
acceptedLineCount |
integer (int32) |
Número de líneas aceptadas para este conjunto de datos. |
duration |
string |
Duración total de los conjuntos de datos si contiene archivos de audio. La duración se codifica como duración ISO 8601 ("PnYnMnDTnHnMnS", vea https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
La dirección de correo electrónico a la que enviar notificaciones por correo electrónico en caso de que se complete la operación. El valor se quitará después de enviar correctamente el correo electrónico. |
|
error |
EntityError |
|
rejectedLineCount |
integer (int32) |
Número de líneas rechazadas para este conjunto de datos. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Valor | Description |
---|---|
DataImportFailed |
Error en la importación de datos. |
DeleteNotAllowed |
Eliminar no permitido. |
DeployNotAllowed |
No se permite la implementación. |
DeployingFailedModel |
Se ha producido un error en la implementación del modelo. |
EmptyRequest |
Solicitud vacía. |
EndpointCannotBeDefault |
El punto de conexión no puede ser predeterminado. |
EndpointNotUpdatable |
Punto de conexión no actualizable. |
EndpointWithoutLogging |
Punto de conexión sin registro. |
ExceededNumberOfRecordingsUris |
Se superó el número de uris de grabaciones. |
FailedDataset |
Conjunto de datos con errores. |
Forbidden |
Prohibido. |
InUseViolation |
En infracción de uso. |
InaccessibleCustomerStorage |
Almacenamiento de clientes inaccesible. |
InvalidAdaptationMapping |
Asignación de adaptación no válida. |
InvalidBaseModel |
Modelo base no válido. |
InvalidCallbackUri |
URI de devolución de llamada no válido. |
InvalidChannels |
Canales no válidos. |
InvalidCollection |
Colección no válida. |
InvalidDataset |
Conjunto de datos no válido. |
InvalidDocument |
Documento no válido. |
InvalidDocumentBatch |
Lote de documentos no válido. |
InvalidLocale |
Configuración regional no válida. |
InvalidLogDate |
Fecha de registro no válida. |
InvalidLogEndTime |
Hora de finalización del registro no válida. |
InvalidLogId |
Identificador de registro no válido. |
InvalidLogStartTime |
Hora de inicio del registro no válida. |
InvalidModel |
Modelo no válido. |
InvalidModelUri |
URI de modelo no válido. |
InvalidParameter |
Parámetro no válido. |
InvalidParameterValue |
Valor de parámetro no válido. |
InvalidPayload |
Carga no válida. |
InvalidPermissions |
Permisos no válidos. |
InvalidPrerequisite |
Requisito previo no válido. |
InvalidProductId |
Identificador de producto no válido. |
InvalidProject |
Proyecto no válido. |
InvalidProjectKind |
Tipo de proyecto no válido. |
InvalidRecordingsUri |
URI de grabaciones no válidos. |
InvalidRequestBodyFormat |
Formato de cuerpo de la solicitud no válido. |
InvalidSasValidityDuration |
Duración de validez de sas no válida. |
InvalidSkipTokenForLogs |
Token de omisión no válido para los registros. |
InvalidSourceAzureResourceId |
Identificador de recurso de Azure de origen no válido. |
InvalidSubscription |
Suscripción no válida. |
InvalidTest |
Prueba no válida. |
InvalidTimeToLive |
Tiempo de vida no válido. |
InvalidTopForLogs |
Top no válido para los registros. |
InvalidTranscription |
Transcripción no válida. |
InvalidWebHookEventKind |
Tipo de evento web hook no válido. |
MissingInputRecords |
Faltan registros de entrada. |
ModelCopyAuthorizationExpired |
ModelCopyAuthorization expirado. |
ModelDeploymentNotCompleteState |
La implementación del modelo no está completa. |
ModelDeprecated |
Modelo en desuso. |
ModelExists |
El modelo existe. |
ModelMismatch |
Error de coincidencia del modelo. |
ModelNotDeployable |
El modelo no se puede implementar. |
ModelVersionIncorrect |
Versión del modelo incorrecta. |
NoUtf8WithBom |
No hay utf8 con bom. |
OnlyOneOfUrlsOrContainerOrDataset |
Solo una de direcciones URL o contenedor o conjunto de datos. |
ProjectGenderMismatch |
No coinciden los géneros del proyecto. |
QuotaViolation |
Infracción de cuota. |
SingleDefaultEndpoint |
Punto de conexión predeterminado único. |
SkuLimitsExist |
Existen límites de SKU. |
SubscriptionNotFound |
No se encontró la suscripción. |
UnexpectedError |
Error inesperado. |
UnsupportedClassBasedAdaptation |
Adaptación basada en clases no admitidas. |
UnsupportedDelta |
Delta no admitido. |
UnsupportedDynamicConfiguration |
Configuración dinámica no admitida. |
UnsupportedFilter |
Filtro no admitido. |
UnsupportedLanguageCode |
Código de lenguaje no admitido. |
UnsupportedOrderBy |
Orden no admitido por. |
UnsupportedPagination |
Paginación no admitida. |
UnsupportedTimeRange |
Intervalo de tiempo no admitido. |
EntityError
EntityError
Nombre | Tipo | Description |
---|---|---|
code |
string |
Código de este error. |
message |
string |
Mensaje para este error. |
EntityReference
EntityReference
Nombre | Tipo | Description |
---|---|---|
self |
string (uri) |
Ubicación de la entidad a la que se hace referencia. |
Error
Error
Nombre | Tipo | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Detalles de apoyo adicionales relacionados con el error o las directivas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensaje de error de alto nivel. |
target |
string |
Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido. |
ErrorCode
ErrorCode
Valor | Description |
---|---|
Conflict |
Representa el código de error en conflicto. |
Forbidden |
Representa el código de error prohibido. |
InternalCommunicationFailed |
Representa el código de error de comunicación interna con error. |
InternalServerError |
Representa el código de error interno del servidor. |
InvalidArgument |
Representa el código de error de argumento no válido. |
InvalidRequest |
Representa el código de error de solicitud no válido. |
NotAllowed |
Representa el código de error no permitido. |
NotFound |
Representa el código de error no encontrado. |
PipelineError |
Representa el código de error de canalización. |
ServiceUnavailable |
Representa el código de error del servicio no disponible. |
TooManyRequests |
Representa el código de error de demasiadas solicitudes. |
Unauthorized |
Representa el código de error no autorizado. |
UnprocessableEntity |
Representa el código de error de entidad no procesado. |
UnsupportedMediaType |
Representa el código de error de tipo de medio no admitido. |
InnerError
InnerError
Nombre | Tipo | Description |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Detalles de apoyo adicionales relacionados con el error o las directivas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensaje de error de alto nivel. |
target |
string |
Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido. |
Status
Estado
Valor | Description |
---|---|
Failed |
Error en la operación de larga duración. |
NotStarted |
La operación de larga duración aún no se ha iniciado. |
Running |
La operación de larga duración se está procesando actualmente. |
Succeeded |
La operación de larga duración se ha completado correctamente. |
TextNormalizationKind
TextNormalizationKind
Valor | Description |
---|---|
Default |
La normalización de texto predeterminada (por ejemplo, "2 a 3" se reemplaza por "dos a tres" en en-US). |
None |
No se aplicará ninguna normalización de texto al texto de entrada. Se trata de una opción de invalidación que solo se debe usar cuando el texto se normaliza antes de la carga. |