Dela via


Microsoft.MachineLearningServices-arbetsytor/datauppsättningar

Bicep-resursdefinition

Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/arbetsytor/datauppsättningsresurs lägger du till följande Bicep i mallen.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  datasetType: 'string'
  name: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Egenskapsvärden

DatauppsättningSkapaRequestParameters

Namn Beskrivning Värde
rubrik Rubriktyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. Bool
partitionFormat Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:å/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datumtidstypen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med hjälp av sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn "CountryOrRegion" med värdet "USA" och en datetime-kolumn "PartitionDate" med värdet "2019-01-01 sträng
stig DatasetCreateRequestParametersPath
fråga DatasetCreateRequestParametersQuery
separator Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. sträng
sourceType Typ av datakälla. "delimited_files"
"json_lines_files"
"parquet_files"

DatauppsättningSkapaRequestParametersPath

Namn Beskrivning Värde
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http-URL:en. sträng

DatauppsättningSkapaRequestParametersPathDataPath

Namn Beskrivning Värde
datastoreName Namnet på datalagringen. sträng
relativePath Sökväg i dataarkivet. sträng

DatauppsättningSkapaRequestParametersQuery

Namn Beskrivning Värde
datastoreName SQL/PostgreSQL/MySQL-datalagernamnet. sträng
fråga SQL Quey. sträng

DatauppsättningSkapaRequestRegistration

Namn Beskrivning Värde
beskrivning Beskrivningen för datamängden. sträng
Namn Namnet på datauppsättningen. sträng
Taggar Taggar som är associerade med datamängden. DatasetCreateRequestRegistrationTags

DatauppsättningSkapaRequestRegistrationTags

Namn Beskrivning Värde

DatauppsättningSkapaRequestTimeSeries

Namn Beskrivning Värde
coarseGrainTimestamp Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan bara användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". sträng
fineGrainTimestamp Kolumnnamn som ska användas som FineGrainTimestamp sträng

Microsoft.MachineLearningServices/arbetsytor/datauppsättningar

Namn Beskrivning Värde
datasetType Anger datamängdstyp. "file"
"Tabell" (krävs)
Namn Resursnamnet sträng (krävs)
Parametrar DatasetCreateRequestParameters (krävs)
förälder I Bicep kan du ange den överordnade resursen för en underordnad resurs. Du behöver bara lägga till den här egenskapen när den underordnade resursen deklareras utanför den överordnade resursen.

Mer information finns i Underordnad resurs utanför den överordnade resursen.
Symboliskt namn för resurs av typen: arbetsytor
registrering DatasetCreateRequestRegistration (krävs)
skipValidation Hoppa över validering som säkerställer att data kan läsas in från datamängden före registreringen. Bool
timeSeries DatasetCreateRequestTimeSeries

Resursdefinition för ARM-mall

Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/arbetsytor/datauppsättningsresurs lägger du till följande JSON i mallen.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Egenskapsvärden

DatauppsättningSkapaRequestParameters

Namn Beskrivning Värde
rubrik Rubriktyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. Bool
partitionFormat Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:å/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datumtidstypen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med hjälp av sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn "CountryOrRegion" med värdet "USA" och en datetime-kolumn "PartitionDate" med värdet "2019-01-01 sträng
stig DatasetCreateRequestParametersPath
fråga DatasetCreateRequestParametersQuery
separator Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. sträng
sourceType Typ av datakälla. "delimited_files"
"json_lines_files"
"parquet_files"

DatauppsättningSkapaRequestParametersPath

Namn Beskrivning Värde
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http-URL:en. sträng

DatauppsättningSkapaRequestParametersPathDataPath

Namn Beskrivning Värde
datastoreName Namnet på datalagringen. sträng
relativePath Sökväg i dataarkivet. sträng

DatauppsättningSkapaRequestParametersQuery

Namn Beskrivning Värde
datastoreName SQL/PostgreSQL/MySQL-datalagernamnet. sträng
fråga SQL Quey. sträng

DatauppsättningSkapaRequestRegistration

Namn Beskrivning Värde
beskrivning Beskrivningen för datamängden. sträng
Namn Namnet på datauppsättningen. sträng
Taggar Taggar som är associerade med datamängden. DatasetCreateRequestRegistrationTags

DatauppsättningSkapaRequestRegistrationTags

Namn Beskrivning Värde

DatauppsättningSkapaRequestTimeSeries

Namn Beskrivning Värde
coarseGrainTimestamp Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan bara användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". sträng
fineGrainTimestamp Kolumnnamn som ska användas som FineGrainTimestamp sträng

Microsoft.MachineLearningServices/arbetsytor/datauppsättningar

Namn Beskrivning Värde
apiVersion API-versionen "2020-05-01-preview"
datasetType Anger datamängdstyp. "file"
"Tabell" (krävs)
Namn Resursnamnet sträng (krävs)
Parametrar DatasetCreateRequestParameters (krävs)
registrering DatasetCreateRequestRegistration (krävs)
skipValidation Hoppa över validering som säkerställer att data kan läsas in från datamängden före registreringen. Bool
timeSeries DatasetCreateRequestTimeSeries
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/datasets"

Snabbstartsmallar

Följande snabbstartsmallar distribuerar den här resurstypen.

Mall Beskrivning
Skapa AML-arbetsyta med flera datauppsättningar & datalager

Distribuera till Azure
Den här mallen skapar En Azure Machine Learning-arbetsyta med flera datauppsättningar & datalager.
Skapa fildatauppsättning från relativ sökväg i Datalager

Distribuera till Azure
Den här mallen skapar en fildatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan.
Skapa fildatauppsättning i AML-arbetsytan från webb-URL

Distribuera till Azure
Den här mallen skapar en fildatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning från relativ sökväg i Datalager

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning från SQL/PostgreSQL/MySQL-datalager

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från SQL-fråga i SQL/PostgreSQL/MySQL-datalager i Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning i AML-arbetsyta från webb-URL

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan.

Resursdefinition för Terraform (AzAPI-provider)

Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:

  • Resursgrupper

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/arbetsytor/datauppsättningsresurs lägger du till följande Terraform i mallen.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  datasetType = "string"
  parameters = {
    header = "string"
    includePath = bool
    partitionFormat = "string"
    path = {
      dataPath = {
        datastoreName = "string"
        relativePath = "string"
      }
      httpUrl = "string"
    }
    query = {
      datastoreName = "string"
      query = "string"
    }
    separator = "string"
    sourceType = "string"
  }
  registration = {
    description = "string"
    name = "string"
    tags = {
      {customized property} = "string"
    }
  }
  skipValidation = bool
  timeSeries = {
    coarseGrainTimestamp = "string"
    fineGrainTimestamp = "string"
  }
}

Egenskapsvärden

DatauppsättningSkapaRequestParameters

Namn Beskrivning Värde
rubrik Rubriktyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. Bool
partitionFormat Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:å/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datumtidstypen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med hjälp av sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn "CountryOrRegion" med värdet "USA" och en datetime-kolumn "PartitionDate" med värdet "2019-01-01 sträng
stig DatasetCreateRequestParametersPath
fråga DatasetCreateRequestParametersQuery
separator Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. sträng
sourceType Typ av datakälla. "delimited_files"
"json_lines_files"
"parquet_files"

DatauppsättningSkapaRequestParametersPath

Namn Beskrivning Värde
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http-URL:en. sträng

DatauppsättningSkapaRequestParametersPathDataPath

Namn Beskrivning Värde
datastoreName Namnet på datalagringen. sträng
relativePath Sökväg i dataarkivet. sträng

DatauppsättningSkapaRequestParametersQuery

Namn Beskrivning Värde
datastoreName SQL/PostgreSQL/MySQL-datalagernamnet. sträng
fråga SQL Quey. sträng

DatauppsättningSkapaRequestRegistration

Namn Beskrivning Värde
beskrivning Beskrivningen för datamängden. sträng
Namn Namnet på datauppsättningen. sträng
Taggar Taggar som är associerade med datamängden. DatasetCreateRequestRegistrationTags

DatauppsättningSkapaRequestRegistrationTags

Namn Beskrivning Värde

DatauppsättningSkapaRequestTimeSeries

Namn Beskrivning Värde
coarseGrainTimestamp Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan bara användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". sträng
fineGrainTimestamp Kolumnnamn som ska användas som FineGrainTimestamp sträng

Microsoft.MachineLearningServices/arbetsytor/datauppsättningar

Namn Beskrivning Värde
datasetType Anger datamängdstyp. "file"
"Tabell" (krävs)
Namn Resursnamnet sträng (krävs)
Parametrar DatasetCreateRequestParameters (krävs)
parent_id ID för resursen som är överordnad för den här resursen. ID för resurs av typen: arbetsytor
registrering DatasetCreateRequestRegistration (krävs)
skipValidation Hoppa över validering som säkerställer att data kan läsas in från datamängden före registreringen. Bool
timeSeries DatasetCreateRequestTimeSeries
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"