Microsoft.MachineLearningServices-arbetsytor/datauppsättningar 2020-05-01-preview
Bicep-resursdefinition
Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:
- Resursgrupper – Se distributionskommandon för resursgrupper
En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.
Resursformat
Om du vill skapa en Microsoft.MachineLearningServices/workspaces/datauppsättningsresurs lägger du till följande Bicep i mallen.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
name: 'string'
parent: resourceSymbolicName
datasetType: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Egenskapsvärden
arbetsytor/datauppsättningar
Name | Beskrivning | Värde |
---|---|---|
name | Resursnamnet Se hur du anger namn och typer för underordnade resurser i Bicep. |
sträng (krävs) |
parent | I Bicep kan du ange den överordnade resursen för en underordnad resurs. Du behöver bara lägga till den här egenskapen när den underordnade resursen deklareras utanför den överordnade resursen. Mer information finns i Underordnad resurs utanför överordnad resurs. |
Symboliskt namn för resurs av typen: arbetsytor |
datasetType | Anger datauppsättningstyp. | "file" "tabell" (krävs) |
parametrar | DatauppsättningSkapaRequestParameters (krävs) | |
Registrering | DatauppsättningSkapaRequestRegistration (krävs) | |
skipValidation | Hoppa över validering som säkerställer att data kan läsas in från datauppsättningen före registreringen. | boolesk |
timeSeries | DatauppsättningSkapaRequestTimeSeries |
DatauppsättningSkapaRequestParameters
Name | Beskrivning | Värde |
---|---|---|
sidhuvud | Rubriktyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. | boolesk |
partitionFormat | Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:yyyy/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med tanke på sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn 'CountryOrRegion' med värdet 'USA' och en datetime-kolumn 'PartitionDate' med värdet '2019-01-01 | sträng |
path | DatauppsättningSkapaRequestParametersPath | |
query | DatauppsättningSkapaRequestParametersQuery | |
Avgränsare | Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. | sträng |
sourceType | Typ av datakälla. | "delimited_files" "json_lines_files" "parquet_files" |
DatauppsättningSkapaRequestParametersPath
Name | Beskrivning | Värde |
---|---|---|
dataPath | DatauppsättningSkapaRequestParametersPathDataPath | |
httpUrl | Http-URL:en. | sträng |
DatauppsättningSkapaRequestParametersPathDataPath
Name | Beskrivning | Värde |
---|---|---|
datastoreName | Datalagernamnet. | sträng |
relativePath | Sökväg i dataarkivet. | sträng |
DatauppsättningSkapaRequestParametersQuery
Name | Beskrivning | Värde |
---|---|---|
datastoreName | Datalagringsnamnet för SQL/PostgreSQL/MySQL. | sträng |
query | SQL Quey. | sträng |
DatasetCreateRequestRegistration
Name | Beskrivning | Värde |
---|---|---|
beskrivning | Beskrivningen av datauppsättningen. | sträng |
name | Namnet på datauppsättningen. | sträng |
tags | Taggar som är associerade med datauppsättningen. | objekt |
DatasetCreateRequestTimeSeries
Name | Beskrivning | Värde |
---|---|---|
coarseGrainTimestamp | Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan endast användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". | sträng |
fineGrainTimestamp | Kolumnnamn som ska användas som FineGrainTimestamp | sträng |
Snabbstartsmallar
Följande snabbstartsmallar distribuerar den här resurstypen.
Mall | Description |
---|---|
Skapa fildatauppsättning från relativ sökväg i datalager |
Den här mallen skapar en fildatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan. |
Skapa fildatauppsättning i AML-arbetsyta från webb-URL |
Den här mallen skapar en fildatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning från relativ sökväg i datalager |
Den här mallen skapar en tabelldatauppsättning från en relativ sökväg i datalager i Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning från SQL/PostgreSQL/MySQL-datalager |
Den här mallen skapar en tabelldatauppsättning från SQL-fråga i SQL/PostgreSQL/MySQL-datalager i Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning i AML-arbetsytan från webb-URL |
Den här mallen skapar en tabelldatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan. |
Skapa en AML-arbetsyta med flera datauppsättningar & datalager |
Den här mallen skapar En Azure Machine Learning-arbetsyta med flera datauppsättningar & datalager. |
Resursdefinition för ARM-mall
Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:
- Resursgrupper – Se kommandon för resursgruppsdistribution
En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.
Resursformat
Om du vill skapa en Microsoft.MachineLearningServices/workspaces/datasets-resurs lägger du till följande JSON i mallen.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Egenskapsvärden
arbetsytor/datauppsättningar
Name | Beskrivning | Värde |
---|---|---|
typ | Resurstypen | "Microsoft.MachineLearningServices/workspaces/datasets" |
apiVersion | Resurs-API-versionen | "2020-05-01-preview" |
name | Resursnamnet Se hur du anger namn och typer för underordnade resurser i JSON ARM-mallar. |
sträng (krävs) |
datasetType | Anger datauppsättningstyp. | "file" "tabell" (obligatoriskt) |
parametrar | DatauppsättningSkapaRequestParameters (krävs) | |
Registrering | DatauppsättningCreateRequestRegistration (krävs) | |
skipValidation | Hoppa över validering som säkerställer att data kan läsas in från datauppsättningen före registreringen. | boolesk |
timeSeries | DatasetCreateRequestTimeSeries |
DatauppsättningSkapaRequestParameters
Name | Beskrivning | Värde |
---|---|---|
sidhuvud | Rubriktyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är False. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. | boolesk |
partitionFormat | Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:åååå/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med tanke på sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn 'CountryOrRegion' med värdet 'USA' och en datetime-kolumn 'PartitionDate' med värdet '2019-01-01 | sträng |
path | DatasetCreateRequestParametersPath | |
query | DatasetCreateRequestParametersQuery | |
Avgränsare | Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. | sträng |
sourceType | Typ av datakälla. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | Beskrivning | Värde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Http-URL:en. | sträng |
DatasetCreateRequestParametersPathDataPath
Name | Beskrivning | Värde |
---|---|---|
datastoreName | Namnet på datalagringen. | sträng |
relativePath | Sökväg i datalagringen. | sträng |
DatasetCreateRequestParametersQuery
Name | Beskrivning | Värde |
---|---|---|
datastoreName | Sql/PostgreSQL/MySQL-datalagernamnet. | sträng |
query | SQL Quey. | sträng |
DatasetCreateRequestRegistration
Name | Beskrivning | Värde |
---|---|---|
beskrivning | Beskrivningen av datauppsättningen. | sträng |
name | Namnet på datauppsättningen. | sträng |
tags | Taggar som är associerade med datauppsättningen. | objekt |
DatasetCreateRequestTimeSeries
Name | Beskrivning | Värde |
---|---|---|
coarseGrainTimestamp | Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan endast användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". | sträng |
fineGrainTimestamp | Kolumnnamn som ska användas som FineGrainTimestamp | sträng |
Snabbstartsmallar
Följande snabbstartsmallar distribuerar den här resurstypen.
Mall | Description |
---|---|
Skapa fildatauppsättning från relativ sökväg i datalager |
Den här mallen skapar en fildatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan. |
Skapa fildatauppsättning i AML-arbetsyta från webb-URL |
Den här mallen skapar en fildatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning från relativ sökväg i datalager |
Den här mallen skapar en tabelldatauppsättning från en relativ sökväg i datalager i Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning från SQL/PostgreSQL/MySQL-datalager |
Den här mallen skapar en tabelldatauppsättning från SQL-fråga i SQL/PostgreSQL/MySQL-datalager i Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning i AML-arbetsytan från webb-URL |
Den här mallen skapar en tabelldatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan. |
Skapa en AML-arbetsyta med flera datauppsättningar & datalager |
Den här mallen skapar En Azure Machine Learning-arbetsyta med flera datauppsättningar & datalager. |
Resursdefinition för Terraform (AzAPI-provider)
Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:
- Resursgrupper
En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.
Resursformat
Om du vill skapa en Microsoft.MachineLearningServices/workspaces/datasets-resurs lägger du till följande Terraform i mallen.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
parent_id = "string"
body = jsonencode({
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
})
}
Egenskapsvärden
arbetsytor/datauppsättningar
Name | Beskrivning | Värde |
---|---|---|
typ | Resurstypen | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |
name | Resursnamnet | sträng (krävs) |
parent_id | ID för resursen som är överordnad för den här resursen. | ID för resurs av typen: arbetsytor |
datasetType | Anger datauppsättningstyp. | "file" "tabell" (obligatoriskt) |
parametrar | DatauppsättningSkapaRequestParameters (krävs) | |
Registrering | DatauppsättningCreateRequestRegistration (krävs) | |
skipValidation | Hoppa över validering som säkerställer att data kan läsas in från datauppsättningen före registreringen. | boolesk |
timeSeries | DatasetCreateRequestTimeSeries |
DatauppsättningSkapaRequestParameters
Name | Beskrivning | Värde |
---|---|---|
sidhuvud | Rubriktyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är False. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. | boolesk |
partitionFormat | Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:åååå/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datetime-typen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med tanke på sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn 'CountryOrRegion' med värdet 'USA' och en datetime-kolumn 'PartitionDate' med värdet '2019-01-01 | sträng |
path | DatasetCreateRequestParametersPath | |
query | DatasetCreateRequestParametersQuery | |
Avgränsare | Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. | sträng |
sourceType | Typ av datakälla. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | Beskrivning | Värde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Http-URL:en. | sträng |
DatasetCreateRequestParametersPathDataPath
Name | Beskrivning | Värde |
---|---|---|
datastoreName | Namnet på datalagringen. | sträng |
relativePath | Sökväg i datalagringen. | sträng |
DatasetCreateRequestParametersQuery
Name | Beskrivning | Värde |
---|---|---|
datastoreName | Sql/PostgreSQL/MySQL-datalagernamnet. | sträng |
query | SQL Quey. | sträng |
DatasetCreateRequestRegistration
Name | Beskrivning | Värde |
---|---|---|
beskrivning | Beskrivningen av datauppsättningen. | sträng |
name | Namnet på datauppsättningen. | sträng |
tags | Taggar som är associerade med datauppsättningen. | objekt |
DatasetCreateRequestTimeSeries
Name | Beskrivning | Värde |
---|---|---|
coarseGrainTimestamp | Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan endast användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". | sträng |
fineGrainTimestamp | Kolumnnamn som ska användas som FineGrainTimestamp | sträng |