Datasets - Create
Carga y crea un nuevo conjunto de datos obteniendo los datos de una dirección URL especificada o comienza a esperar a que se carguen los bloques de datos.
POST {endpoint}/speechtotext/v3.2/datasets
Parámetros de identificador URI
Nombre | En | Requerido | Tipo | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com). |
Cuerpo de la solicitud
Nombre | Requerido | Tipo | Description |
---|---|---|---|
displayName | True |
string |
Nombre para mostrar del objeto. |
kind | True |
DatasetKind |
|
locale | True |
string |
Configuración regional de los datos contenidos. |
contentUrl |
string |
Dirección URL de los datos del conjunto de datos. |
|
customProperties |
object |
Propiedades personalizadas de esta entidad. La longitud máxima permitida de la clave es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es 10. |
|
description |
string |
Descripción del objeto . |
|
project |
EntityReference |
||
properties |
DatasetProperties |
Respuestas
Nombre | Tipo | Description |
---|---|---|
201 Created |
La respuesta contiene información sobre la entidad como carga y su ubicación como encabezado. Encabezados Location: string |
|
Other Status Codes |
Se produjo un error. |
Seguridad
Ocp-Apim-Subscription-Key
Proporcione la clave de la cuenta de Cognitive Services aquí.
Tipo:
apiKey
En:
header
Authorization
Proporcione un token de acceso del JWT devuelto por el STS de esta región. Asegúrese de agregar el ámbito de administración al token agregando la siguiente cadena de consulta a la dirección URL de STS: ?scope=speechservicesmanagement.
Tipo:
apiKey
En:
header
Ejemplos
Create a dataset with content url |
Create dataset from data blocks |
Create a dataset with content url
Solicitud de ejemplo
POST {endpoint}/speechtotext/v3.2/datasets
{
"kind": "Acoustic",
"contentUrl": "https://contoso.com/location",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Respuesta de muestra
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Create dataset from data blocks
Solicitud de ejemplo
POST {endpoint}/speechtotext/v3.2/datasets
{
"kind": "Acoustic",
"locale": "en-US",
"displayName": "My speech dataset name",
"description": "My speech dataset description"
}
Respuesta de muestra
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files",
"commitBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks:commit",
"listBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks",
"uploadBlocks": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/blocks"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "NotStarted",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definiciones
Nombre | Description |
---|---|
Dataset |
Dataset |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Error |
Error |
ErrorCode |
Inner |
InnerError |
Status |
Estado |
Text |
TextNormalizationKind |
Dataset
Dataset
Nombre | Tipo | Description |
---|---|---|
contentUrl |
string |
Dirección URL de los datos del conjunto de datos. |
createdDateTime |
string |
Marca de tiempo cuando se creó el objeto. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
Propiedades personalizadas de esta entidad. La longitud máxima permitida de la clave es de 64 caracteres, la longitud máxima permitida del valor es de 256 caracteres y el recuento de entradas permitidas es de 10. |
description |
string |
Descripción del objeto . |
displayName |
string |
Nombre para mostrar del objeto. |
kind |
DatasetKind |
|
lastActionDateTime |
string |
Marca de tiempo cuando se especificó el estado actual. La marca de tiempo se codifica como formato de fecha y hora ISO 8601 ("AAAA-MM-DDThh:mm:ssZ", vea https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string |
Configuración regional de los datos contenidos. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string |
Ubicación de esta entidad. |
status |
Estado |
DatasetKind
DatasetKind
Nombre | Tipo | Description |
---|---|---|
Acoustic |
string |
Un conjunto de datos acústico. |
AudioFiles |
string |
Un conjunto de datos de archivos de audio. |
Language |
string |
Un conjunto de datos de lenguaje. |
LanguageMarkdown |
string |
Un conjunto de datos de Markdown de lenguaje. |
OutputFormatting |
string |
Conjunto de datos que contiene reglas para personalizar la normalización inversa de texto, la capitalización, la reforma, la palabra soece y también define las pruebas para la validación del conjunto de datos. |
Pronunciation |
string |
Un conjunto de datos de pronunciación. |
DatasetLinks
DatasetLinks
Nombre | Tipo | Description |
---|---|---|
commitBlocks |
string |
Ubicación para confirmar la lista de bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_CommitBlocks" para obtener más información. |
files |
string |
Ubicación para obtener todos los archivos de esta entidad. Consulte la operación "Datasets_ListFiles" para obtener más detalles. |
listBlocks |
string |
Ubicación para enumerar los bloques ya cargados de esta entidad al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_GetBlocks" para obtener más detalles. |
uploadBlocks |
string |
Ubicación en la que se cargan bloques al cargar un conjunto de datos mediante bloques. Consulte la operación "Datasets_UploadBlock" para obtener más detalles. |
DatasetProperties
DatasetProperties
Nombre | Tipo | Description |
---|---|---|
acceptedLineCount |
integer |
Número de líneas aceptadas para este conjunto de datos. |
duration |
string |
Duración total de los conjuntos de datos si contiene archivos de audio. La duración se codifica como duración ISO 8601 ("PnYnMnDTnHnMnS", vea https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
Dirección de correo electrónico a la que se enviarán notificaciones por correo electrónico en caso de que se complete la operación. El valor se quitará después de enviar correctamente el correo electrónico. |
|
error |
EntityError |
|
rejectedLineCount |
integer |
Número de líneas rechazadas para este conjunto de datos. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Nombre | Tipo | Description |
---|---|---|
DataImportFailed |
string |
Error en la importación de datos. |
DeleteNotAllowed |
string |
No se permite eliminar. |
DeployNotAllowed |
string |
No se permite la implementación. |
DeployingFailedModel |
string |
Se ha producido un error en la implementación del modelo. |
EmptyRequest |
string |
Solicitud vacía. |
EndpointCannotBeDefault |
string |
El punto de conexión no puede ser predeterminado. |
EndpointNotUpdatable |
string |
Punto de conexión no actualizable. |
EndpointWithoutLogging |
string |
Punto de conexión sin registro. |
ExceededNumberOfRecordingsUris |
string |
Se superó el número de URI de grabaciones. |
FailedDataset |
string |
Conjunto de datos con errores. |
Forbidden |
string |
Prohibido. |
InUseViolation |
string |
En infracción de uso. |
InaccessibleCustomerStorage |
string |
Almacenamiento de cliente inaccesible. |
InvalidAdaptationMapping |
string |
Asignación de adaptación no válida. |
InvalidBaseModel |
string |
Modelo base no válido. |
InvalidCallbackUri |
string |
URI de devolución de llamada no válido. |
InvalidChannels |
string |
Canales no válidos. |
InvalidCollection |
string |
Colección no válida. |
InvalidDataset |
string |
Conjunto de datos no válido. |
InvalidDocument |
string |
Documento no válido. |
InvalidDocumentBatch |
string |
Lote de documentos no válido. |
InvalidLocale |
string |
Configuración regional no válida. |
InvalidLogDate |
string |
Fecha de registro no válida. |
InvalidLogEndTime |
string |
Hora de finalización del registro no válida. |
InvalidLogId |
string |
Identificador de registro no válido. |
InvalidLogStartTime |
string |
Hora de inicio del registro no válida. |
InvalidModel |
string |
Modelo no válido. |
InvalidModelUri |
string |
URI de modelo no válido. |
InvalidParameter |
string |
Parámetro no válido. |
InvalidParameterValue |
string |
Valor de parámetro no válido. |
InvalidPayload |
string |
Carga no válida. |
InvalidPermissions |
string |
Permisos no válidos. |
InvalidPrerequisite |
string |
Requisito previo no válido. |
InvalidProductId |
string |
Id. de producto no válido. |
InvalidProject |
string |
Proyecto no válido. |
InvalidProjectKind |
string |
Tipo de proyecto no válido. |
InvalidRecordingsUri |
string |
URI de grabaciones no válidas. |
InvalidRequestBodyFormat |
string |
Formato de cuerpo de la solicitud no válido. |
InvalidSasValidityDuration |
string |
Duración de validez de sas no válida. |
InvalidSkipTokenForLogs |
string |
Token de omisión no válido para los registros. |
InvalidSourceAzureResourceId |
string |
Identificador de recurso de Azure de origen no válido. |
InvalidSubscription |
string |
Suscripción no válida. |
InvalidTest |
string |
Prueba no válida. |
InvalidTimeToLive |
string |
Período de vida no válido. |
InvalidTopForLogs |
string |
Top no válido para los registros. |
InvalidTranscription |
string |
Transcripción no válida. |
InvalidWebHookEventKind |
string |
Tipo de evento webhook no válido. |
MissingInputRecords |
string |
Faltan registros de entrada. |
ModelCopyAuthorizationExpired |
string |
ModelCopyAuthorization expirada. |
ModelDeploymentNotCompleteState |
string |
La implementación del modelo no está completa. |
ModelDeprecated |
string |
Modelo en desuso. |
ModelExists |
string |
El modelo existe. |
ModelMismatch |
string |
Error de coincidencia del modelo. |
ModelNotDeployable |
string |
Modelo no implementable. |
ModelVersionIncorrect |
string |
La versión del modelo es incorrecta. |
NoUtf8WithBom |
string |
No hay utf8 con bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Solo una de las direcciones URL, el contenedor o el conjunto de datos. |
ProjectGenderMismatch |
string |
No coinciden los sexos del proyecto. |
QuotaViolation |
string |
Infracción de cuota. |
SingleDefaultEndpoint |
string |
Punto de conexión predeterminado único. |
SkuLimitsExist |
string |
Existen límites de SKU. |
SubscriptionNotFound |
string |
No se encontró la suscripción. |
UnexpectedError |
string |
error inesperado. |
UnsupportedClassBasedAdaptation |
string |
Adaptación basada en clases no admitida. |
UnsupportedDelta |
string |
Delta no admitido. |
UnsupportedDynamicConfiguration |
string |
Configuración dinámica no admitida. |
UnsupportedFilter |
string |
Filtro no admitido. |
UnsupportedLanguageCode |
string |
Código de idioma no admitido. |
UnsupportedOrderBy |
string |
Orden no admitido por. |
UnsupportedPagination |
string |
Paginación no admitida. |
UnsupportedTimeRange |
string |
Intervalo de tiempo no admitido. |
EntityError
EntityError
Nombre | Tipo | Description |
---|---|---|
code |
string |
Código de este error. |
message |
string |
Mensaje para este error. |
EntityReference
EntityReference
Nombre | Tipo | Description |
---|---|---|
self |
string |
Ubicación de la entidad a la que se hace referencia. |
Error
Error
Nombre | Tipo | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Detalles adicionales de apoyo relacionados con el error o las directivas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensaje de error de alto nivel. |
target |
string |
Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en el caso de un documento no válido. |
ErrorCode
ErrorCode
Nombre | Tipo | Description |
---|---|---|
Conflict |
string |
Representa el código de error de conflicto. |
Forbidden |
string |
Representa el código de error prohibido. |
InternalCommunicationFailed |
string |
Representando el código de error de comunicación interna con errores. |
InternalServerError |
string |
Representa el código de error interno del servidor. |
InvalidArgument |
string |
Representa el código de error de argumento no válido. |
InvalidRequest |
string |
Representa el código de error de solicitud no válido. |
NotAllowed |
string |
Representa el código de error no permitido. |
NotFound |
string |
Representa el código de error no encontrado. |
PipelineError |
string |
Representa el código de error de canalización. |
ServiceUnavailable |
string |
Representa el código de error del servicio no disponible. |
TooManyRequests |
string |
Representa el código de error de demasiadas solicitudes. |
Unauthorized |
string |
Representa el código de error no autorizado. |
UnprocessableEntity |
string |
Representa el código de error de entidad no procesado. |
UnsupportedMediaType |
string |
Representa el código de error de tipo de medio no admitido. |
InnerError
InnerError
Nombre | Tipo | Description |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Detalles adicionales de apoyo relacionados con el error o las directivas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensaje de error de alto nivel. |
target |
string |
Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en el caso de un documento no válido. |
Status
Estado
Nombre | Tipo | Description |
---|---|---|
Failed |
string |
Error en la operación de larga duración. |
NotStarted |
string |
La operación de larga duración aún no se ha iniciado. |
Running |
string |
La operación de larga duración está procesando actualmente. |
Succeeded |
string |
La operación de larga duración se ha completado correctamente. |
TextNormalizationKind
TextNormalizationKind
Nombre | Tipo | Description |
---|---|---|
Default |
string |
La normalización de texto predeterminada (por ejemplo, "2 a 3" se reemplaza por "dos a tres" en-US). |
None |
string |
No se aplicará ninguna normalización de texto al texto de entrada. Se trata de una opción de invalidación que solo se debe usar cuando se normaliza el texto antes de la carga. |