Compartir a través de


Áreas de trabajo de Microsoft.MachineLearningServices/datasets 2020-05-01-preview

Definición de recursos de Bicep

El tipo de recurso workspaces/datasets se puede implementar con operaciones que tienen como destino:

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente bicep a la plantilla.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  parent: resourceSymbolicName
  datasetType: 'string'
  name: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Valores de propiedad

DatasetCreateRequestParameters

Nombre Descripción Valor
encabezado Tipo de encabezado. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Boolean para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Esto resulta útil al leer varios archivos y desea saber de qué archivo se originó un registro determinado o para mantener información útil en la ruta de acceso del archivo. Bool
partitionFormat La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato '{column_name}' crea una columna de cadena y '{column_name:aaaa/MM/dd/HH/mm/ss}' crea una columna datetime, donde 'aaaa', 'MM', 'dd', 'HH', 'mm' y 'ss' se usan para extraer año, mes, día, hora, minuto y segundo para el tipo datetime. El formato debe comenzar desde la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01 cuerda
camino DatasetCreateRequestParametersPath
consulta DatasetCreateRequestParametersQuery
separador Separador usado para dividir columnas para sourceType "delimited_files". cuerda
sourceType Tipo de origen de datos. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Nombre Descripción Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Dirección URL http. cuerda

DatasetCreateRequestParametersPathDataPath

Nombre Descripción Valor
datastoreName Nombre del almacén de datos. cuerda
relativePath Ruta de acceso dentro del almacén de datos. cuerda

DatasetCreateRequestParametersQuery

Nombre Descripción Valor
datastoreName Nombre del almacén de datos SQL/PostgreSQL/MySQL. cuerda
consulta SQL Quey. cuerda

DatasetCreateRequestRegistration

Nombre Descripción Valor
descripción Descripción del conjunto de datos. cuerda
nombre Nombre del conjunto de datos. cuerda
Etiquetas Etiquetas asociadas al conjunto de datos. DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Nombre Descripción Valor

DatasetCreateRequestTimeSeries

Nombre Descripción Valor
coarseGrainTimestamp Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser igual que "fineGrainTimestamp". cuerda
fineGrainTimestamp Nombre de columna que se va a usar como FineGrainTimestamp cuerda

Microsoft.MachineLearningServices/workspaces/datasets

Nombre Descripción Valor
datasetType Especifica el tipo de conjunto de datos. 'file'
'tabular' (obligatorio)
nombre El nombre del recurso string (obligatorio)
Parámetros DatasetCreateRequestParameters (obligatorio)
padre En Bicep, puede especificar el recurso primario para un recurso secundario. Solo tiene que agregar esta propiedad cuando el recurso secundario se declara fuera del recurso primario.

Para obtener más información, consulte recurso secundario fuera del recurso primario.
Nombre simbólico del recurso de tipo: áreas de trabajo
registro DatasetCreateRequestRegistration (obligatorio)
skipValidation Omita la validación que garantiza que los datos se puedan cargar desde el conjunto de datos antes del registro. Bool
timeSeries DatasetCreateRequestTimeSeries

Definición de recursos de plantilla de ARM

El tipo de recurso workspaces/datasets se puede implementar con operaciones que tienen como destino:

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente JSON a la plantilla.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Valores de propiedad

DatasetCreateRequestParameters

Nombre Descripción Valor
encabezado Tipo de encabezado. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Boolean para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Esto resulta útil al leer varios archivos y desea saber de qué archivo se originó un registro determinado o para mantener información útil en la ruta de acceso del archivo. Bool
partitionFormat La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato '{column_name}' crea una columna de cadena y '{column_name:aaaa/MM/dd/HH/mm/ss}' crea una columna datetime, donde 'aaaa', 'MM', 'dd', 'HH', 'mm' y 'ss' se usan para extraer año, mes, día, hora, minuto y segundo para el tipo datetime. El formato debe comenzar desde la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01 cuerda
camino DatasetCreateRequestParametersPath
consulta DatasetCreateRequestParametersQuery
separador Separador usado para dividir columnas para sourceType "delimited_files". cuerda
sourceType Tipo de origen de datos. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Nombre Descripción Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Dirección URL http. cuerda

DatasetCreateRequestParametersPathDataPath

Nombre Descripción Valor
datastoreName Nombre del almacén de datos. cuerda
relativePath Ruta de acceso dentro del almacén de datos. cuerda

DatasetCreateRequestParametersQuery

Nombre Descripción Valor
datastoreName Nombre del almacén de datos SQL/PostgreSQL/MySQL. cuerda
consulta SQL Quey. cuerda

DatasetCreateRequestRegistration

Nombre Descripción Valor
descripción Descripción del conjunto de datos. cuerda
nombre Nombre del conjunto de datos. cuerda
Etiquetas Etiquetas asociadas al conjunto de datos. DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Nombre Descripción Valor

DatasetCreateRequestTimeSeries

Nombre Descripción Valor
coarseGrainTimestamp Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser igual que "fineGrainTimestamp". cuerda
fineGrainTimestamp Nombre de columna que se va a usar como FineGrainTimestamp cuerda

Microsoft.MachineLearningServices/workspaces/datasets

Nombre Descripción Valor
apiVersion La versión de api '2020-05-01-preview'
datasetType Especifica el tipo de conjunto de datos. 'file'
'tabular' (obligatorio)
nombre El nombre del recurso string (obligatorio)
Parámetros DatasetCreateRequestParameters (obligatorio)
registro DatasetCreateRequestRegistration (obligatorio)
skipValidation Omita la validación que garantiza que los datos se puedan cargar desde el conjunto de datos antes del registro. Bool
timeSeries DatasetCreateRequestTimeSeries
tipo El tipo de recurso "Microsoft.MachineLearningServices/workspaces/datasets"

Plantillas de inicio rápido

Las siguientes plantillas de inicio rápido implementan este tipo de recurso.

Plantilla Descripción
Creación de un área de trabajo de AML con varios conjuntos de datos & almacenes de datos

Implementación en Azure
Esta plantilla crea un área de trabajo de Azure Machine Learning con varios conjuntos de datos & almacenes de datos.
crear un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos

Implementación en Azure
Esta plantilla crea un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos en el área de trabajo de Azure Machine Learning.
crear un conjunto de datos de archivos en el área de trabajo de AML desde la dirección URL web

Implementación en Azure
Esta plantilla crea un conjunto de datos de archivos a partir de la dirección URL web en el área de trabajo de Azure Machine Learning.
crear un conjunto de datos tabular a partir de la ruta de acceso relativa en el almacén de datos

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de una ruta de acceso relativa en el almacén de datos en el área de trabajo de Azure Machine Learning.
crear un conjunto de datos tabular a partir del almacén de datos SQL/PostgreSQL/MySQL

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de una consulta SQL en el almacén de datos SQL/PostgreSQL/MySQL en el área de trabajo de Azure Machine Learning.
crear un conjunto de datos tabular en el área de trabajo de AML desde la dirección URL web

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de la dirección URL web en el área de trabajo de Azure Machine Learning.

Definición de recursos de Terraform (proveedor AzAPI)

El tipo de recurso workspaces/datasets se puede implementar con operaciones que tienen como destino:

  • grupos de recursos de

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de recurso

Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente terraform a la plantilla.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  datasetType = "string"
  parameters = {
    header = "string"
    includePath = bool
    partitionFormat = "string"
    path = {
      dataPath = {
        datastoreName = "string"
        relativePath = "string"
      }
      httpUrl = "string"
    }
    query = {
      datastoreName = "string"
      query = "string"
    }
    separator = "string"
    sourceType = "string"
  }
  registration = {
    description = "string"
    name = "string"
    tags = {
      {customized property} = "string"
    }
  }
  skipValidation = bool
  timeSeries = {
    coarseGrainTimestamp = "string"
    fineGrainTimestamp = "string"
  }
}

Valores de propiedad

DatasetCreateRequestParameters

Nombre Descripción Valor
encabezado Tipo de encabezado. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Boolean para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Esto resulta útil al leer varios archivos y desea saber de qué archivo se originó un registro determinado o para mantener información útil en la ruta de acceso del archivo. Bool
partitionFormat La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato '{column_name}' crea una columna de cadena y '{column_name:aaaa/MM/dd/HH/mm/ss}' crea una columna datetime, donde 'aaaa', 'MM', 'dd', 'HH', 'mm' y 'ss' se usan para extraer año, mes, día, hora, minuto y segundo para el tipo datetime. El formato debe comenzar desde la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01 cuerda
camino DatasetCreateRequestParametersPath
consulta DatasetCreateRequestParametersQuery
separador Separador usado para dividir columnas para sourceType "delimited_files". cuerda
sourceType Tipo de origen de datos. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Nombre Descripción Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Dirección URL http. cuerda

DatasetCreateRequestParametersPathDataPath

Nombre Descripción Valor
datastoreName Nombre del almacén de datos. cuerda
relativePath Ruta de acceso dentro del almacén de datos. cuerda

DatasetCreateRequestParametersQuery

Nombre Descripción Valor
datastoreName Nombre del almacén de datos SQL/PostgreSQL/MySQL. cuerda
consulta SQL Quey. cuerda

DatasetCreateRequestRegistration

Nombre Descripción Valor
descripción Descripción del conjunto de datos. cuerda
nombre Nombre del conjunto de datos. cuerda
Etiquetas Etiquetas asociadas al conjunto de datos. DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Nombre Descripción Valor

DatasetCreateRequestTimeSeries

Nombre Descripción Valor
coarseGrainTimestamp Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser igual que "fineGrainTimestamp". cuerda
fineGrainTimestamp Nombre de columna que se va a usar como FineGrainTimestamp cuerda

Microsoft.MachineLearningServices/workspaces/datasets

Nombre Descripción Valor
datasetType Especifica el tipo de conjunto de datos. 'file'
'tabular' (obligatorio)
nombre El nombre del recurso string (obligatorio)
Parámetros DatasetCreateRequestParameters (obligatorio)
parent_id Identificador del recurso que es el elemento primario de este recurso. Identificador del recurso de tipo: áreas de trabajo
registro DatasetCreateRequestRegistration (obligatorio)
skipValidation Omita la validación que garantiza que los datos se puedan cargar desde el conjunto de datos antes del registro. Bool
timeSeries DatasetCreateRequestTimeSeries
tipo El tipo de recurso "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"