Compartir a través de


Datasets - Create

Carga y crea un nuevo conjunto de datos obteniendo los datos de una dirección URL especificada o comienza a esperar a que se carguen los bloques de datos.

POST {endpoint}/speechtotext/v3.2/datasets

Parámetros de identificador URI

Nombre En Requerido Tipo Description
endpoint
path True

string

Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).

Cuerpo de la solicitud

Nombre Requerido Tipo Description
displayName True

string

Nombre para mostrar del objeto.

kind True

DatasetKind

DatasetKind
Tipo de importación de datos.

locale True

string

Configuración regional de los datos contenidos.

contentUrl

string

Dirección URL de los datos del conjunto de datos.

customProperties

object

Propiedades personalizadas de esta entidad. La longitud máxima permitida de la clave es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es 10.

description

string

Descripción del objeto .

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

Respuestas

Nombre Tipo Description
201 Created

Dataset

La respuesta contiene información sobre la entidad como carga y su ubicación como encabezado.

Encabezados

Location: string

Other Status Codes

Error

Se produjo un error.

Seguridad

Ocp-Apim-Subscription-Key

Proporcione la clave de la cuenta de Cognitive Services aquí.

Tipo: apiKey
En: header

Authorization

Proporcione un token de acceso del JWT devuelto por el STS de esta región. Asegúrese de agregar el ámbito de administración al token agregando la siguiente cadena de consulta a la dirección URL de STS: ?scope=speechservicesmanagement.

Tipo: apiKey
En: header

Ejemplos

Create a dataset with content url
Create dataset from data blocks

Create a dataset with content url

Solicitud de ejemplo

POST {endpoint}/speechtotext/v3.2/datasets

{
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/location",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Respuesta de muestra

Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
  },
  "properties": {
    "textNormalizationKind": "Default",
    "acceptedLineCount": 11,
    "rejectedLineCount": 2,
    "duration": "PT4M12S"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "Succeeded",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Create dataset from data blocks

Solicitud de ejemplo

POST {endpoint}/speechtotext/v3.2/datasets

{
  "kind": "Acoustic",
  "locale": "en-US",
  "displayName": "My speech dataset name",
  "description": "My speech dataset description"
}

Respuesta de muestra

{
  "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
  "kind": "Acoustic",
  "links": {
    "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
    "commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
    "listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
    "uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
  },
  "lastActionDateTime": "2019-01-07T11:36:07Z",
  "status": "NotStarted",
  "createdDateTime": "2019-01-07T11:34:12Z",
  "locale": "en-US",
  "displayName": "Acoustic dataset"
}

Definiciones

Nombre Description
Dataset

Dataset

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

Error

ErrorCode

ErrorCode

InnerError

InnerError

Status

Estado

TextNormalizationKind

TextNormalizationKind

Dataset

Dataset

Nombre Tipo Description
contentUrl

string

Dirección URL de los datos del conjunto de datos.

createdDateTime

string

Marca de tiempo cuando se creó el objeto. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

customProperties

object

Propiedades personalizadas de esta entidad. La longitud máxima permitida de la clave es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es de 10.

description

string

Descripción del objeto .

displayName

string

Nombre para mostrar del objeto.

kind

DatasetKind

DatasetKind
Tipo de importación de datos.

lastActionDateTime

string

Marca de tiempo cuando se especificó el estado actual. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

links

DatasetLinks

DatasetLinks

locale

string

Configuración regional de los datos contenidos.

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string

Ubicación de esta entidad.

status

Status

Estado
Describir el estado actual de la API.

DatasetKind

DatasetKind

Nombre Tipo Description
Acoustic

string

Un conjunto de datos acústico.

AudioFiles

string

Un conjunto de datos de archivos de audio.

Language

string

Un conjunto de datos de lenguaje.

LanguageMarkdown

string

Un conjunto de datos de Markdown de lenguaje.

OutputFormatting

string

Conjunto de datos que contiene reglas para personalizar la normalización inversa de texto, la capitalización, la reforma, la palabra soece y también define las pruebas para la validación del conjunto de datos.

Pronunciation

string

Un conjunto de datos de pronunciación.

DatasetLinks

Nombre Tipo Description
commitBlocks

string

Ubicación para confirmar la lista de bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_CommitBlocks" para obtener más información.

files

string

Ubicación para obtener todos los archivos de esta entidad. Consulte la operación "Datasets_ListFiles" para obtener más detalles.

listBlocks

string

Ubicación para enumerar los bloques ya cargados de esta entidad al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_GetBlocks" para obtener más detalles.

uploadBlocks

string

Ubicación en la que se cargan bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_UploadBlock" para obtener más detalles.

DatasetProperties

DatasetProperties

Nombre Tipo Description
acceptedLineCount

integer

Número de líneas aceptadas para este conjunto de datos.

duration

string

Duración total de los conjuntos de datos si contiene archivos de audio. La duración se codifica como duración ISO 8601 ("PnYnMnDTnHnMnS", vea https://en.wikipedia.org/wiki/ISO_8601#Durations).

email

string

Dirección de correo electrónico a la que se enviarán notificaciones por correo electrónico en caso de que se complete la operación. El valor se quitará después de enviar correctamente el correo electrónico.

error

EntityError

EntityError

rejectedLineCount

integer

Número de líneas rechazadas para este conjunto de datos.

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
Tipo de normalización de texto.

DetailedErrorCode

DetailedErrorCode

Nombre Tipo Description
DataImportFailed

string

Error en la importación de datos.

DeleteNotAllowed

string

No se permite eliminar.

DeployNotAllowed

string

No se permite la implementación.

DeployingFailedModel

string

Se ha producido un error en la implementación del modelo.

EmptyRequest

string

Solicitud vacía.

EndpointCannotBeDefault

string

El punto de conexión no puede ser predeterminado.

EndpointNotUpdatable

string

Punto de conexión no actualizable.

EndpointWithoutLogging

string

Punto de conexión sin registro.

ExceededNumberOfRecordingsUris

string

Se superó el número de URI de grabaciones.

FailedDataset

string

Conjunto de datos con errores.

Forbidden

string

Prohibido.

InUseViolation

string

En infracción de uso.

InaccessibleCustomerStorage

string

Almacenamiento de cliente inaccesible.

InvalidAdaptationMapping

string

Asignación de adaptación no válida.

InvalidBaseModel

string

Modelo base no válido.

InvalidCallbackUri

string

URI de devolución de llamada no válido.

InvalidChannels

string

Canales no válidos.

InvalidCollection

string

Colección no válida.

InvalidDataset

string

Conjunto de datos no válido.

InvalidDocument

string

Documento no válido.

InvalidDocumentBatch

string

Lote de documentos no válido.

InvalidLocale

string

Configuración regional no válida.

InvalidLogDate

string

Fecha de registro no válida.

InvalidLogEndTime

string

Hora de finalización del registro no válida.

InvalidLogId

string

Identificador de registro no válido.

InvalidLogStartTime

string

Hora de inicio del registro no válida.

InvalidModel

string

Modelo no válido.

InvalidModelUri

string

URI de modelo no válido.

InvalidParameter

string

Parámetro no válido.

InvalidParameterValue

string

Valor de parámetro no válido.

InvalidPayload

string

Carga no válida.

InvalidPermissions

string

Permisos no válidos.

InvalidPrerequisite

string

Requisito previo no válido.

InvalidProductId

string

Id. de producto no válido.

InvalidProject

string

Proyecto no válido.

InvalidProjectKind

string

Tipo de proyecto no válido.

InvalidRecordingsUri

string

URI de grabaciones no válidas.

InvalidRequestBodyFormat

string

Formato de cuerpo de la solicitud no válido.

InvalidSasValidityDuration

string

Duración de validez de sas no válida.

InvalidSkipTokenForLogs

string

Token de omisión no válido para los registros.

InvalidSourceAzureResourceId

string

Identificador de recurso de Azure de origen no válido.

InvalidSubscription

string

Suscripción no válida.

InvalidTest

string

Prueba no válida.

InvalidTimeToLive

string

Período de vida no válido.

InvalidTopForLogs

string

Top no válido para los registros.

InvalidTranscription

string

Transcripción no válida.

InvalidWebHookEventKind

string

Tipo de evento webhook no válido.

MissingInputRecords

string

Faltan registros de entrada.

ModelCopyAuthorizationExpired

string

ModelCopyAuthorization expirada.

ModelDeploymentNotCompleteState

string

La implementación del modelo no está completa.

ModelDeprecated

string

Modelo en desuso.

ModelExists

string

El modelo existe.

ModelMismatch

string

Error de coincidencia del modelo.

ModelNotDeployable

string

Modelo no implementable.

ModelVersionIncorrect

string

La versión del modelo es incorrecta.

NoUtf8WithBom

string

No hay utf8 con bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Solo una de las direcciones URL, el contenedor o el conjunto de datos.

ProjectGenderMismatch

string

No coinciden los sexos del proyecto.

QuotaViolation

string

Infracción de cuota.

SingleDefaultEndpoint

string

Punto de conexión predeterminado único.

SkuLimitsExist

string

Existen límites de SKU.

SubscriptionNotFound

string

No se encontró la suscripción.

UnexpectedError

string

error inesperado.

UnsupportedClassBasedAdaptation

string

Adaptación basada en clases no admitida.

UnsupportedDelta

string

Delta no admitido.

UnsupportedDynamicConfiguration

string

Configuración dinámica no admitida.

UnsupportedFilter

string

Filtro no admitido.

UnsupportedLanguageCode

string

Código de idioma no admitido.

UnsupportedOrderBy

string

Orden no admitido por.

UnsupportedPagination

string

Paginación no admitida.

UnsupportedTimeRange

string

Intervalo de tiempo no admitido.

EntityError

EntityError

Nombre Tipo Description
code

string

Código de este error.

message

string

Mensaje para este error.

EntityReference

EntityReference

Nombre Tipo Description
self

string

Ubicación de la entidad a la que se hace referencia.

Error

Error

Nombre Tipo Description
code

ErrorCode

ErrorCode
Códigos de error de alto nivel.

details

Error[]

Detalles adicionales de apoyo relacionados con el error o las directivas esperadas.

innerError

InnerError

InnerError
Nuevo formato de error interno que se ajusta a las directrices de cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y las propiedades opcionales, target, details (par clave-valor), innerError (se puede anidar).

message

string

Mensaje de error de alto nivel.

target

string

Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en el caso de un documento no válido.

ErrorCode

ErrorCode

Nombre Tipo Description
Conflict

string

Representa el código de error de conflicto.

Forbidden

string

Representa el código de error prohibido.

InternalCommunicationFailed

string

Representando el código de error de comunicación interna con errores.

InternalServerError

string

Representa el código de error interno del servidor.

InvalidArgument

string

Representa el código de error de argumento no válido.

InvalidRequest

string

Representa el código de error de solicitud no válido.

NotAllowed

string

Representa el código de error no permitido.

NotFound

string

Representa el código de error no encontrado.

PipelineError

string

Representa el código de error de canalización.

ServiceUnavailable

string

Representa el código de error del servicio no disponible.

TooManyRequests

string

Representa el código de error de demasiadas solicitudes.

Unauthorized

string

Representa el código de error no autorizado.

UnprocessableEntity

string

Representa el código de error de entidad no procesado.

UnsupportedMediaType

string

Representa el código de error de tipo de medio no admitido.

InnerError

InnerError

Nombre Tipo Description
code

DetailedErrorCode

DetailedErrorCode
Enumeración detallada del código de error.

details

object

Detalles adicionales de apoyo relacionados con el error o las directivas esperadas.

innerError

InnerError

InnerError
Nuevo formato de error interno que se ajusta a las directrices de cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y las propiedades opcionales, target, details (par clave-valor), innerError (se puede anidar).

message

string

Mensaje de error de alto nivel.

target

string

Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en el caso de un documento no válido.

Status

Estado

Nombre Tipo Description
Failed

string

Error en la operación de larga duración.

NotStarted

string

La operación de larga duración aún no se ha iniciado.

Running

string

La operación de larga duración está procesando actualmente.

Succeeded

string

La operación de larga duración se ha completado correctamente.

TextNormalizationKind

TextNormalizationKind

Nombre Tipo Description
Default

string

La normalización de texto predeterminada (por ejemplo, "2 a 3" se reemplaza por "dos a tres" en-US).

None

string

No se aplicará ninguna normalización de texto al texto de entrada. Se trata de una opción de invalidación que solo se debe usar cuando se normaliza el texto antes de la carga.