Datasets - Upload
Carrega dados e cria um novo conjunto de dados.
POST {endpoint}/speechtotext/v3.2/datasets/upload
Parâmetros de URI
Nome | Em | Obrigatório | Tipo | Description |
---|---|---|---|---|
display
|
formData | True |
string |
O nome desse conjunto de dados. |
kind
|
formData | True |
string |
O tipo do conjunto de dados. Os valores possíveis são "Language", "Acoustic", "Pronunciation", "AudioFiles", "LanguageMarkdown", "OutputFormatting". |
locale
|
formData | True |
string |
A localidade desse conjunto de dados. |
custom
|
formData |
string |
As propriedades personalizadas opcionais dessa entidade. O comprimento máximo permitido da chave é de 64 caracteres, o comprimento máximo do valor permitido é de 256 caracteres e a contagem de entradas permitidas é de 10. |
|
data
|
formData |
file |
Para conjuntos de dados acústicos, um arquivo zip que contém os dados de áudio e um arquivo de texto que contém as transcrições dos dados de áudio. Para conjuntos de dados de idioma, um arquivo de texto que contém os dados de idioma ou pronúncia. Obrigatório em ambos os casos. |
|
description
|
formData |
string |
Descrição opcional desse conjunto de dados. |
|
email
|
formData |
string |
Uma cadeia de caracteres opcional que contém o endereço de email para o qual enviar notificações por email caso a operação seja concluída. O valor será removido após o envio com êxito do email. |
|
project
|
formData |
string |
A representação de cadeia de caracteres opcional da URL de um projeto. Se definido, o conjunto de dados será associado a esse projeto. |
|
endpoint
|
path | True |
string |
Pontos de extremidade dos Serviços Cognitivos com suporte (protocolo e nome do host, por exemplo: https://westus.api.cognitive.microsoft.com). |
Respostas
Nome | Tipo | Description |
---|---|---|
201 Created |
A resposta contém informações sobre a entidade como conteúdo e sua localização como cabeçalho. Cabeçalhos Location: string |
|
Other Status Codes |
Ocorreu um erro. |
Segurança
Ocp-Apim-Subscription-Key
Forneça sua chave de conta de serviços cognitivos aqui.
Tipo:
apiKey
Em:
header
Authorization
Forneça um token de acesso do JWT retornado pelo STS dessa região. Adicione o escopo de gerenciamento ao token adicionando a seguinte cadeia de caracteres de consulta à URL do STS: ?scope=speechservicesmanagement
Tipo:
apiKey
Em:
header
Exemplos
Upload a dataset
Solicitação de exemplo
POST {endpoint}/speechtotext/v3.2/datasets/upload
Resposta de exemplo
Location: https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
}
Definições
Nome | Description |
---|---|
Dataset |
Dataset |
Dataset |
DatasetKind |
Dataset |
DatasetLinks |
Dataset |
DatasetProperties |
Detailed |
DetailedErrorCode |
Entity |
EntityError |
Entity |
EntityReference |
Error |
Erro |
Error |
ErrorCode |
Inner |
InnerError |
Status |
Status |
Text |
TextNormalizationKind |
Dataset
Dataset
Nome | Tipo | Description |
---|---|---|
contentUrl |
string |
A URL dos dados para o conjunto de dados. |
createdDateTime |
string |
O carimbo de data/hora quando o objeto foi criado. O carimbo de data/hora é codificado como formato de data e hora ISO 8601 ("YYYY-MM-DDThh:mm:ssZ", consulte https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
customProperties |
object |
As propriedades personalizadas dessa entidade. O comprimento máximo permitido da chave é de 64 caracteres, o comprimento máximo do valor permitido é de 256 caracteres e a contagem de entradas permitidas é de 10. |
description |
string |
A descrição do objeto . |
displayName |
string |
O nome para exibição do objeto. |
kind |
DatasetKind |
|
lastActionDateTime |
string |
O carimbo de data/hora em que o status atual foi inserido. O carimbo de data/hora é codificado como formato de data e hora ISO 8601 ("YYYY-MM-DDThh:mm:ssZ", consulte https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
links |
DatasetLinks |
|
locale |
string |
A localidade dos dados contidos. |
project |
EntityReference |
|
properties |
DatasetProperties |
|
self |
string |
O local dessa entidade. |
status |
Status |
DatasetKind
DatasetKind
Nome | Tipo | Description |
---|---|---|
Acoustic |
string |
Um conjunto de dados acústico. |
AudioFiles |
string |
Um conjunto de dados de arquivos de áudio. |
Language |
string |
Um conjunto de dados de linguagem. |
LanguageMarkdown |
string |
Um conjunto de dados de markdown de idioma. |
OutputFormatting |
string |
Conjunto de dados que contém regras para personalizar a normalização inversa de texto, capitalização, reformulação, profanação e também define testes para validação de conjunto de dados |
Pronunciation |
string |
Um conjunto de dados de pronúncia. |
DatasetLinks
DatasetLinks
Nome | Tipo | Description |
---|---|---|
commitBlocks |
string |
O local para confirmar a lista de blocos ao carregar um conjunto de dados usando blocos. Consulte a operação "Datasets_CommitBlocks" para obter mais detalhes. |
files |
string |
O local para obter todos os arquivos dessa entidade. Consulte a operação "Datasets_ListFiles" para obter mais detalhes. |
listBlocks |
string |
O local para listar os blocos já carregados dessa entidade ao carregar um conjunto de dados usando blocos. Confira a operação "Datasets_GetBlocks" para obter mais detalhes. |
uploadBlocks |
string |
O local para o qual carregar blocos ao carregar um conjunto de dados usando blocos. Confira a operação "Datasets_UploadBlock" para obter mais detalhes. |
DatasetProperties
DatasetProperties
Nome | Tipo | Description |
---|---|---|
acceptedLineCount |
integer |
O número de linhas aceitas para esse conjunto de dados. |
duration |
string |
A duração total dos conjuntos de dados se ele contiver arquivos de áudio. A duração é codificada como duração iso 8601 ("PnYnMnDTnHnMnS", consulte https://en.wikipedia.org/wiki/ISO_8601#Durations). |
string |
O endereço de email para o qual enviar notificações por email caso a operação seja concluída. O valor será removido após o envio com êxito do email. |
|
error |
EntityError |
|
rejectedLineCount |
integer |
O número de linhas rejeitadas para esse conjunto de dados. |
textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
Nome | Tipo | Description |
---|---|---|
DataImportFailed |
string |
Falha na importação de dados. |
DeleteNotAllowed |
string |
Excluir não é permitido. |
DeployNotAllowed |
string |
Implantação não permitida. |
DeployingFailedModel |
string |
Implantação de modelo com falha. |
EmptyRequest |
string |
Solicitação vazia. |
EndpointCannotBeDefault |
string |
O ponto de extremidade não pode ser padrão. |
EndpointNotUpdatable |
string |
Ponto de extremidade não atualizável. |
EndpointWithoutLogging |
string |
Ponto de extremidade sem registro em log. |
ExceededNumberOfRecordingsUris |
string |
Número excedido de uris de gravações. |
FailedDataset |
string |
Conjunto de dados com falha. |
Forbidden |
string |
Negado. |
InUseViolation |
string |
Violação de uso. |
InaccessibleCustomerStorage |
string |
Armazenamento inacessível do cliente. |
InvalidAdaptationMapping |
string |
Mapeamento de adaptação inválido. |
InvalidBaseModel |
string |
Modelo base inválido. |
InvalidCallbackUri |
string |
URI de retorno de chamada inválido. |
InvalidChannels |
string |
Canais inválidos. |
InvalidCollection |
string |
Coleção inválida. |
InvalidDataset |
string |
Conjunto de dados inválido. |
InvalidDocument |
string |
Documento inválido. |
InvalidDocumentBatch |
string |
Lote de Documentos inválido. |
InvalidLocale |
string |
Localidade inválida. |
InvalidLogDate |
string |
Data de log inválida. |
InvalidLogEndTime |
string |
Hora de término do log inválida. |
InvalidLogId |
string |
ID de log inválida. |
InvalidLogStartTime |
string |
Hora de início do log inválida. |
InvalidModel |
string |
Modelo inválido. |
InvalidModelUri |
string |
URI de modelo inválido. |
InvalidParameter |
string |
Parâmetro inválido. |
InvalidParameterValue |
string |
Valor de parâmetro inválido. |
InvalidPayload |
string |
Conteúdo inválido. |
InvalidPermissions |
string |
Permissões inválidas. |
InvalidPrerequisite |
string |
Pré-requisito inválido. |
InvalidProductId |
string |
ID do produto inválida. |
InvalidProject |
string |
Projeto inválido. |
InvalidProjectKind |
string |
Tipo de projeto inválido. |
InvalidRecordingsUri |
string |
URI de gravações inválidas. |
InvalidRequestBodyFormat |
string |
Formato do corpo da solicitação inválido. |
InvalidSasValidityDuration |
string |
Duração de validade sas inválida. |
InvalidSkipTokenForLogs |
string |
Token de ignorar inválido para logs. |
InvalidSourceAzureResourceId |
string |
ID de recurso do Azure de origem inválida. |
InvalidSubscription |
string |
Assinatura inválida. |
InvalidTest |
string |
Teste inválido. |
InvalidTimeToLive |
string |
Tempo de vida inválido. |
InvalidTopForLogs |
string |
Parte superior inválida para logs. |
InvalidTranscription |
string |
Transcrição inválida. |
InvalidWebHookEventKind |
string |
Tipo de evento de gancho da Web inválido. |
MissingInputRecords |
string |
Registros de entrada ausentes. |
ModelCopyAuthorizationExpired |
string |
ModelCopyAuthorization expirado. |
ModelDeploymentNotCompleteState |
string |
O estado de implantação do modelo não é concluído. |
ModelDeprecated |
string |
Modelo preterido. |
ModelExists |
string |
O modelo existe. |
ModelMismatch |
string |
Incompatibilidade de modelo. |
ModelNotDeployable |
string |
Modelo não implantável. |
ModelVersionIncorrect |
string |
Versão do modelo incorreta. |
NoUtf8WithBom |
string |
Não utf8 com bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Apenas uma das URLs, contêiner ou conjunto de dados. |
ProjectGenderMismatch |
string |
Incompatibilidade de gênero do projeto. |
QuotaViolation |
string |
Violação de cota. |
SingleDefaultEndpoint |
string |
Ponto de extremidade padrão único. |
SkuLimitsExist |
string |
Existem limites de SKU. |
SubscriptionNotFound |
string |
Assinatura não encontrada. |
UnexpectedError |
string |
Erro inesperado. |
UnsupportedClassBasedAdaptation |
string |
Adaptação baseada em classe sem suporte. |
UnsupportedDelta |
string |
Delta sem suporte. |
UnsupportedDynamicConfiguration |
string |
Configuração dinâmica sem suporte. |
UnsupportedFilter |
string |
Filtro sem suporte. |
UnsupportedLanguageCode |
string |
Código de linguagem sem suporte. |
UnsupportedOrderBy |
string |
Ordem sem suporte por. |
UnsupportedPagination |
string |
Paginação sem suporte. |
UnsupportedTimeRange |
string |
Intervalo de tempo sem suporte. |
EntityError
EntityError
Nome | Tipo | Description |
---|---|---|
code |
string |
O código desse erro. |
message |
string |
A mensagem para esse erro. |
EntityReference
EntityReference
Nome | Tipo | Description |
---|---|---|
self |
string |
O local da entidade referenciada. |
Error
Erro
Nome | Tipo | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Detalhes adicionais de suporte sobre o erro e/ou as políticas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensagem de erro de alto nível. |
target |
string |
A origem do erro. Por exemplo, seria "documents" ou "document id" no caso de um documento inválido. |
ErrorCode
ErrorCode
Nome | Tipo | Description |
---|---|---|
Conflict |
string |
Representando o código de erro de conflito. |
Forbidden |
string |
Representando o código de erro proibido. |
InternalCommunicationFailed |
string |
Representando o código de erro de falha de comunicação interna. |
InternalServerError |
string |
Representando o código de erro do servidor interno. |
InvalidArgument |
string |
Representando o código de erro de argumento inválido. |
InvalidRequest |
string |
Representando o código de erro de solicitação inválido. |
NotAllowed |
string |
Representando o código de erro não permitido. |
NotFound |
string |
Representando o código de erro não encontrado. |
PipelineError |
string |
Representando o código de erro do pipeline. |
ServiceUnavailable |
string |
Representando o código de erro indisponível do serviço. |
TooManyRequests |
string |
Representando o código de erro de muitas solicitações. |
Unauthorized |
string |
Representando o código de erro não autorizado. |
UnprocessableEntity |
string |
Representando o código de erro de entidade não processável. |
UnsupportedMediaType |
string |
Representando o código de erro de tipo de mídia sem suporte. |
InnerError
InnerError
Nome | Tipo | Description |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Detalhes adicionais de suporte sobre o erro e/ou as políticas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensagem de erro de alto nível. |
target |
string |
A origem do erro. Por exemplo, seria "documents" ou "document id" no caso de um documento inválido. |
Status
Status
Nome | Tipo | Description |
---|---|---|
Failed |
string |
Falha na operação de execução prolongada. |
NotStarted |
string |
A operação de execução prolongada ainda não foi iniciada. |
Running |
string |
A operação de execução prolongada está sendo processada no momento. |
Succeeded |
string |
A operação de execução prolongada foi concluída com êxito. |
TextNormalizationKind
TextNormalizationKind
Nome | Tipo | Description |
---|---|---|
Default |
string |
A normalização de texto padrão (por exemplo, '2 a 3' é substituída por 'dois a três' no en-US). |
None |
string |
Nenhuma normalização de texto será aplicada ao texto de entrada. Essa é uma opção de substituição que só deve ser usada quando o texto é normalizado antes do upload. |