Compartir a través de


Datasets - Upload

Carga datos y crea un nuevo conjunto de datos.

POST {endpoint}/speechtotext/v3.2/datasets/upload

Parámetros de identificador URI

Nombre En Requerido Tipo Description
displayName
formData True

string

Nombre de este conjunto de datos.

kind
formData True

string

Tipo del conjunto de datos. Los valores posibles son "Language", "Acoustic", "Pronunciation", "AudioFiles", "LanguageMarkdown", "OutputFormatting".

locale
formData True

string

Configuración regional de este conjunto de datos.

customProperties
formData

string

Las propiedades personalizadas opcionales de esta entidad. La longitud máxima de clave permitida es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es de 10.

data
formData

file

Para los conjuntos de datos acústicos, un archivo ZIP que contiene los datos de audio y un archivo de texto que contiene las transcripciones de los datos de audio. En el caso de los conjuntos de datos de idioma, un archivo de texto que contiene los datos de idioma o pronunciación. Obligatorio en ambos casos.

description
formData

string

Descripción opcional de este conjunto de datos.

email
formData

string

Cadena opcional que contiene la dirección de correo electrónico para enviar notificaciones por correo electrónico en caso de que se complete la operación. El valor se quitará después de enviar correctamente el correo electrónico.

project
formData

string

Representación de cadena opcional de la dirección URL de un proyecto. Si se establece, el conjunto de datos se asociará a ese proyecto.

endpoint
path True

string

Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).

Respuestas

Nombre Tipo Description
201 Created

Dataset

La respuesta contiene información sobre la entidad como carga y su ubicación como encabezado.

Encabezados

Location: string

Other Status Codes

Error

Se ha producido un error.

Seguridad

Ocp-Apim-Subscription-Key

Proporcione aquí la clave de la cuenta de Cognitive Services.

Tipo: apiKey
En: header

Authorization

Proporcione un token de acceso del JWT devuelto por el STS de esta región. Asegúrese de agregar el ámbito de administración al token agregando la siguiente cadena de consulta a la dirección URL de STS: ?scope=speechservicesmanagement

Tipo: apiKey
En: header

Ejemplos

Upload a dataset

Solicitud de ejemplo

POST {endpoint}/speechtotext/v3.2/datasets/upload

Respuesta de muestra

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definiciones

Nombre Description
Dataset

Conjunto de datos

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Error

ErrorCode

ErrorCode

InnerError

InnerError

Status

Estado

TextNormalizationKind

TextNormalizationKind

Dataset

Conjunto de datos

Nombre Tipo Description
contentUrl

string (uri)

Dirección URL de los datos del conjunto de datos.

createdDateTime

string (date-time)

Marca de tiempo cuando se creó el objeto. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

Propiedades personalizadas de esta entidad. La longitud máxima de clave permitida es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es de 10.

description

string

Descripción del objeto.

displayName

string

minLength: 1

Nombre para mostrar del objeto.

kind

DatasetKind

DatasetKind
Tipo de importación de datos.

lastActionDateTime

string (date-time)

Marca de tiempo cuando se especificó el estado actual. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

minLength: 1

Configuración regional de los datos contenidos.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string (uri)

Ubicación de esta entidad.

status

Status

Estado
Describir el estado actual de la API.

DatasetKind

DatasetKind

Valor Description
Acoustic

Un conjunto de datos acústico.

AudioFiles

Un conjunto de datos de archivos de audio.

Language

Un conjunto de datos de idioma.

LanguageMarkdown

Un conjunto de datos markdown de lenguaje.

OutputFormatting

Conjunto de datos que contiene reglas para personalizar la normalización inversa de texto, la mayúsculas, la reforma, la soece y también define las pruebas para la validación del conjunto de datos.

Pronunciation

Un conjunto de datos de pronunciación.

DatasetLinks

Nombre Tipo Description
commitBlocks

string (uri)

Ubicación para confirmar la lista de bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_CommitBlocks" para obtener más información.

files

string (uri)

Ubicación para obtener todos los archivos de esta entidad. Consulte la operación "Datasets_ListFiles" para obtener más información.

listBlocks

string (uri)

Ubicación para enumerar los bloques ya cargados de esta entidad al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_GetBlocks" para obtener más detalles.

uploadBlocks

string (uri)

Ubicación a la que se cargan bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_UploadBlock" para obtener más información.

DatasetProperties

DatasetProperties

Nombre Tipo Description
acceptedLineCount

integer (int32)

Número de líneas aceptadas para este conjunto de datos.

duration

string

Duración total de los conjuntos de datos si contiene archivos de audio. La duración se codifica como duración ISO 8601 ("PnYnMnDTnHnMnS", vea https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

La dirección de correo electrónico a la que enviar notificaciones por correo electrónico en caso de que se complete la operación. El valor se quitará después de enviar correctamente el correo electrónico.

error

EntityError

EntityError

rejectedLineCount

integer (int32)

Número de líneas rechazadas para este conjunto de datos.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Tipo de normalización de texto.

DetailedErrorCode

DetailedErrorCode

Valor Description
DataImportFailed

Error en la importación de datos.

DeleteNotAllowed

Eliminar no permitido.

DeployNotAllowed

No se permite la implementación.

DeployingFailedModel

Se ha producido un error en la implementación del modelo.

EmptyRequest

Solicitud vacía.

EndpointCannotBeDefault

El punto de conexión no puede ser predeterminado.

EndpointNotUpdatable

Punto de conexión no actualizable.

EndpointWithoutLogging

Punto de conexión sin registro.

ExceededNumberOfRecordingsUris

Se superó el número de uris de grabaciones.

FailedDataset

Conjunto de datos con errores.

Forbidden

Prohibido.

InUseViolation

En infracción de uso.

InaccessibleCustomerStorage

Almacenamiento de clientes inaccesible.

InvalidAdaptationMapping

Asignación de adaptación no válida.

InvalidBaseModel

Modelo base no válido.

InvalidCallbackUri

URI de devolución de llamada no válido.

InvalidChannels

Canales no válidos.

InvalidCollection

Colección no válida.

InvalidDataset

Conjunto de datos no válido.

InvalidDocument

Documento no válido.

InvalidDocumentBatch

Lote de documentos no válido.

InvalidLocale

Configuración regional no válida.

InvalidLogDate

Fecha de registro no válida.

InvalidLogEndTime

Hora de finalización del registro no válida.

InvalidLogId

Identificador de registro no válido.

InvalidLogStartTime

Hora de inicio del registro no válida.

InvalidModel

Modelo no válido.

InvalidModelUri

URI de modelo no válido.

InvalidParameter

Parámetro no válido.

InvalidParameterValue

Valor de parámetro no válido.

InvalidPayload

Carga no válida.

InvalidPermissions

Permisos no válidos.

InvalidPrerequisite

Requisito previo no válido.

InvalidProductId

Identificador de producto no válido.

InvalidProject

Proyecto no válido.

InvalidProjectKind

Tipo de proyecto no válido.

InvalidRecordingsUri

URI de grabaciones no válidos.

InvalidRequestBodyFormat

Formato de cuerpo de la solicitud no válido.

InvalidSasValidityDuration

Duración de validez de sas no válida.

InvalidSkipTokenForLogs

Token de omisión no válido para los registros.

InvalidSourceAzureResourceId

Identificador de recurso de Azure de origen no válido.

InvalidSubscription

Suscripción no válida.

InvalidTest

Prueba no válida.

InvalidTimeToLive

Tiempo de vida no válido.

InvalidTopForLogs

Top no válido para los registros.

InvalidTranscription

Transcripción no válida.

InvalidWebHookEventKind

Tipo de evento web hook no válido.

MissingInputRecords

Faltan registros de entrada.

ModelCopyAuthorizationExpired

ModelCopyAuthorization expirado.

ModelDeploymentNotCompleteState

La implementación del modelo no está completa.

ModelDeprecated

Modelo en desuso.

ModelExists

El modelo existe.

ModelMismatch

Error de coincidencia del modelo.

ModelNotDeployable

El modelo no se puede implementar.

ModelVersionIncorrect

Versión del modelo incorrecta.

NoUtf8WithBom

No hay utf8 con bom.

OnlyOneOfUrlsOrContainerOrDataset

Solo una de direcciones URL o contenedor o conjunto de datos.

ProjectGenderMismatch

No coinciden los géneros del proyecto.

QuotaViolation

Infracción de cuota.

SingleDefaultEndpoint

Punto de conexión predeterminado único.

SkuLimitsExist

Existen límites de SKU.

SubscriptionNotFound

No se encontró la suscripción.

UnexpectedError

Error inesperado.

UnsupportedClassBasedAdaptation

Adaptación basada en clases no admitidas.

UnsupportedDelta

Delta no admitido.

UnsupportedDynamicConfiguration

Configuración dinámica no admitida.

UnsupportedFilter

Filtro no admitido.

UnsupportedLanguageCode

Código de lenguaje no admitido.

UnsupportedOrderBy

Orden no admitido por.

UnsupportedPagination

Paginación no admitida.

UnsupportedTimeRange

Intervalo de tiempo no admitido.

EntityError

EntityError

Nombre Tipo Description
code

string

Código de este error.

message

string

Mensaje para este error.

EntityReference

EntityReference

Nombre Tipo Description
self

string (uri)

Ubicación de la entidad a la que se hace referencia.

Error

Error

Nombre Tipo Description
code

ErrorCode

ErrorCode
Códigos de error de alto nivel.

details

Error[]

Detalles de apoyo adicionales relacionados con el error o las directivas esperadas.

innerError

InnerError

InnerError
Nuevo formato de error interno que se ajusta a las directrices de Cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y propiedades opcionales de destino, details(key value pair), inner error(this can be nested).

message

string

Mensaje de error de alto nivel.

target

string

Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido.

ErrorCode

ErrorCode

Valor Description
Conflict

Representa el código de error en conflicto.

Forbidden

Representa el código de error prohibido.

InternalCommunicationFailed

Representa el código de error de comunicación interna con error.

InternalServerError

Representa el código de error interno del servidor.

InvalidArgument

Representa el código de error de argumento no válido.

InvalidRequest

Representa el código de error de solicitud no válido.

NotAllowed

Representa el código de error no permitido.

NotFound

Representa el código de error no encontrado.

PipelineError

Representa el código de error de canalización.

ServiceUnavailable

Representa el código de error del servicio no disponible.

TooManyRequests

Representa el código de error de demasiadas solicitudes.

Unauthorized

Representa el código de error no autorizado.

UnprocessableEntity

Representa el código de error de entidad no procesado.

UnsupportedMediaType

Representa el código de error de tipo de medio no admitido.

InnerError

InnerError

Nombre Tipo Description
code

DetailedErrorCode

DetailedErrorCode
Enumeración detallada del código de error.

details

object

Detalles de apoyo adicionales relacionados con el error o las directivas esperadas.

innerError

InnerError

InnerError
Nuevo formato de error interno que se ajusta a las directrices de Cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y propiedades opcionales de destino, details(key value pair), inner error(this can be nested).

message

string

Mensaje de error de alto nivel.

target

string

Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido.

Status

Estado

Valor Description
Failed

Error en la operación de larga duración.

NotStarted

La operación de larga duración aún no se ha iniciado.

Running

La operación de larga duración se está procesando actualmente.

Succeeded

La operación de larga duración se ha completado correctamente.

TextNormalizationKind

TextNormalizationKind

Valor Description
Default

La normalización de texto predeterminada (por ejemplo, "2 a 3" se reemplaza por "dos a tres" en en-US).

None

No se aplicará ninguna normalización de texto al texto de entrada. Se trata de una opción de invalidación que solo se debe usar cuando el texto se normaliza antes de la carga.