Dela via


Microsoft.MachineLearningServices-arbetsytor/datauppsättningar 2020-05-01-preview

Bicep-resursdefinition

Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/datauppsättningsresurs lägger du till följande Bicep i mallen.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {}
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Egenskapsvärden

arbetsytor/datauppsättningar

Name Beskrivning Värde
name Resursnamnet

Se hur du anger namn och typer för underordnade resurser i Bicep.
sträng (krävs)
parent I Bicep kan du ange den överordnade resursen för en underordnad resurs. Du behöver bara lägga till den här egenskapen när den underordnade resursen deklareras utanför den överordnade resursen.

Mer information finns i Underordnad resurs utanför överordnad resurs.
Symboliskt namn för resurs av typen: arbetsytor
datasetType Anger datauppsättningstyp. "file"
"tabell" (krävs)
parametrar DatauppsättningSkapaRequestParameters (krävs)
Registrering DatauppsättningSkapaRequestRegistration (krävs)
skipValidation Hoppa över validering som säkerställer att data kan läsas in från datauppsättningen före registreringen. boolesk
timeSeries DatauppsättningSkapaRequestTimeSeries

DatauppsättningSkapaRequestParameters

Name Beskrivning Värde
sidhuvud Rubriktyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. boolesk
partitionFormat Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:yyyy/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med tanke på sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn 'CountryOrRegion' med värdet 'USA' och en datetime-kolumn 'PartitionDate' med värdet '2019-01-01 sträng
path DatauppsättningSkapaRequestParametersPath
query DatauppsättningSkapaRequestParametersQuery
Avgränsare Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. sträng
sourceType Typ av datakälla. "delimited_files"
"json_lines_files"
"parquet_files"

DatauppsättningSkapaRequestParametersPath

Name Beskrivning Värde
dataPath DatauppsättningSkapaRequestParametersPathDataPath
httpUrl Http-URL:en. sträng

DatauppsättningSkapaRequestParametersPathDataPath

Name Beskrivning Värde
datastoreName Datalagernamnet. sträng
relativePath Sökväg i dataarkivet. sträng

DatauppsättningSkapaRequestParametersQuery

Name Beskrivning Värde
datastoreName Datalagringsnamnet för SQL/PostgreSQL/MySQL. sträng
query SQL Quey. sträng

DatasetCreateRequestRegistration

Name Beskrivning Värde
beskrivning Beskrivningen av datauppsättningen. sträng
name Namnet på datauppsättningen. sträng
tags Taggar som är associerade med datauppsättningen. objekt

DatasetCreateRequestTimeSeries

Name Beskrivning Värde
coarseGrainTimestamp Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan endast användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". sträng
fineGrainTimestamp Kolumnnamn som ska användas som FineGrainTimestamp sträng

Snabbstartsmallar

Följande snabbstartsmallar distribuerar den här resurstypen.

Mall Description
Skapa fildatauppsättning från relativ sökväg i datalager

Distribuera till Azure
Den här mallen skapar en fildatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan.
Skapa fildatauppsättning i AML-arbetsyta från webb-URL

Distribuera till Azure
Den här mallen skapar en fildatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning från relativ sökväg i datalager

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från en relativ sökväg i datalager i Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning från SQL/PostgreSQL/MySQL-datalager

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från SQL-fråga i SQL/PostgreSQL/MySQL-datalager i Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning i AML-arbetsytan från webb-URL

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan.
Skapa en AML-arbetsyta med flera datauppsättningar & datalager

Distribuera till Azure
Den här mallen skapar En Azure Machine Learning-arbetsyta med flera datauppsättningar & datalager.

Resursdefinition för ARM-mall

Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/datasets-resurs lägger du till följande JSON i mallen.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {}
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Egenskapsvärden

arbetsytor/datauppsättningar

Name Beskrivning Värde
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/datasets"
apiVersion Resurs-API-versionen "2020-05-01-preview"
name Resursnamnet

Se hur du anger namn och typer för underordnade resurser i JSON ARM-mallar.
sträng (krävs)
datasetType Anger datauppsättningstyp. "file"
"tabell" (obligatoriskt)
parametrar DatauppsättningSkapaRequestParameters (krävs)
Registrering DatauppsättningCreateRequestRegistration (krävs)
skipValidation Hoppa över validering som säkerställer att data kan läsas in från datauppsättningen före registreringen. boolesk
timeSeries DatasetCreateRequestTimeSeries

DatauppsättningSkapaRequestParameters

Name Beskrivning Värde
sidhuvud Rubriktyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är False. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. boolesk
partitionFormat Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:åååå/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med tanke på sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn 'CountryOrRegion' med värdet 'USA' och en datetime-kolumn 'PartitionDate' med värdet '2019-01-01 sträng
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Avgränsare Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. sträng
sourceType Typ av datakälla. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name Beskrivning Värde
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http-URL:en. sträng

DatasetCreateRequestParametersPathDataPath

Name Beskrivning Värde
datastoreName Namnet på datalagringen. sträng
relativePath Sökväg i datalagringen. sträng

DatasetCreateRequestParametersQuery

Name Beskrivning Värde
datastoreName Sql/PostgreSQL/MySQL-datalagernamnet. sträng
query SQL Quey. sträng

DatasetCreateRequestRegistration

Name Beskrivning Värde
beskrivning Beskrivningen av datauppsättningen. sträng
name Namnet på datauppsättningen. sträng
tags Taggar som är associerade med datauppsättningen. objekt

DatasetCreateRequestTimeSeries

Name Beskrivning Värde
coarseGrainTimestamp Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan endast användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". sträng
fineGrainTimestamp Kolumnnamn som ska användas som FineGrainTimestamp sträng

Snabbstartsmallar

Följande snabbstartsmallar distribuerar den här resurstypen.

Mall Description
Skapa fildatauppsättning från relativ sökväg i datalager

Distribuera till Azure
Den här mallen skapar en fildatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan.
Skapa fildatauppsättning i AML-arbetsyta från webb-URL

Distribuera till Azure
Den här mallen skapar en fildatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning från relativ sökväg i datalager

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från en relativ sökväg i datalager i Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning från SQL/PostgreSQL/MySQL-datalager

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från SQL-fråga i SQL/PostgreSQL/MySQL-datalager i Azure Machine Learning-arbetsytan.
Skapa tabelldatauppsättning i AML-arbetsytan från webb-URL

Distribuera till Azure
Den här mallen skapar en tabelldatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan.
Skapa en AML-arbetsyta med flera datauppsättningar & datalager

Distribuera till Azure
Den här mallen skapar En Azure Machine Learning-arbetsyta med flera datauppsättningar & datalager.

Resursdefinition för Terraform (AzAPI-provider)

Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:

  • Resursgrupper

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/datasets-resurs lägger du till följande Terraform i mallen.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {}
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Egenskapsvärden

arbetsytor/datauppsättningar

Name Beskrivning Värde
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name Resursnamnet sträng (krävs)
parent_id ID för resursen som är överordnad för den här resursen. ID för resurs av typen: arbetsytor
datasetType Anger datauppsättningstyp. "file"
"tabell" (obligatoriskt)
parametrar DatauppsättningSkapaRequestParameters (krävs)
Registrering DatauppsättningCreateRequestRegistration (krävs)
skipValidation Hoppa över validering som säkerställer att data kan läsas in från datauppsättningen före registreringen. boolesk
timeSeries DatasetCreateRequestTimeSeries

DatauppsättningSkapaRequestParameters

Name Beskrivning Värde
sidhuvud Rubriktyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är False. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. boolesk
partitionFormat Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:åååå/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med tanke på sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn 'CountryOrRegion' med värdet 'USA' och en datetime-kolumn 'PartitionDate' med värdet '2019-01-01 sträng
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Avgränsare Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. sträng
sourceType Typ av datakälla. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name Beskrivning Värde
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http-URL:en. sträng

DatasetCreateRequestParametersPathDataPath

Name Beskrivning Värde
datastoreName Namnet på datalagringen. sträng
relativePath Sökväg i datalagringen. sträng

DatasetCreateRequestParametersQuery

Name Beskrivning Värde
datastoreName Sql/PostgreSQL/MySQL-datalagernamnet. sträng
query SQL Quey. sträng

DatasetCreateRequestRegistration

Name Beskrivning Värde
beskrivning Beskrivningen av datauppsättningen. sträng
name Namnet på datauppsättningen. sträng
tags Taggar som är associerade med datauppsättningen. objekt

DatasetCreateRequestTimeSeries

Name Beskrivning Värde
coarseGrainTimestamp Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan endast användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". sträng
fineGrainTimestamp Kolumnnamn som ska användas som FineGrainTimestamp sträng