Microsoft.MachineLearningServices-arbetsytor/datauppsättningar
Bicep-resursdefinition
Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:
- Resursgrupper – Se resursgruppsdistributionskommandon
En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.
Resursformat
Om du vill skapa en Microsoft.MachineLearningServices/arbetsytor/datauppsättningsresurs lägger du till följande Bicep i mallen.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
datasetType: 'string'
name: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {
{customized property}: 'string'
}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Egenskapsvärden
DatauppsättningSkapaRequestParameters
Namn | Beskrivning | Värde |
---|---|---|
rubrik | Rubriktyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. | Bool |
partitionFormat | Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:å/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datumtidstypen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med hjälp av sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn "CountryOrRegion" med värdet "USA" och en datetime-kolumn "PartitionDate" med värdet "2019-01-01 | sträng |
stig | DatasetCreateRequestParametersPath | |
fråga | DatasetCreateRequestParametersQuery | |
separator | Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. | sträng |
sourceType | Typ av datakälla. | "delimited_files" "json_lines_files" "parquet_files" |
DatauppsättningSkapaRequestParametersPath
Namn | Beskrivning | Värde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Http-URL:en. | sträng |
DatauppsättningSkapaRequestParametersPathDataPath
Namn | Beskrivning | Värde |
---|---|---|
datastoreName | Namnet på datalagringen. | sträng |
relativePath | Sökväg i dataarkivet. | sträng |
DatauppsättningSkapaRequestParametersQuery
Namn | Beskrivning | Värde |
---|---|---|
datastoreName | SQL/PostgreSQL/MySQL-datalagernamnet. | sträng |
fråga | SQL Quey. | sträng |
DatauppsättningSkapaRequestRegistration
Namn | Beskrivning | Värde |
---|---|---|
beskrivning | Beskrivningen för datamängden. | sträng |
Namn | Namnet på datauppsättningen. | sträng |
Taggar | Taggar som är associerade med datamängden. | DatasetCreateRequestRegistrationTags |
DatauppsättningSkapaRequestRegistrationTags
Namn | Beskrivning | Värde |
---|
DatauppsättningSkapaRequestTimeSeries
Namn | Beskrivning | Värde |
---|---|---|
coarseGrainTimestamp | Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan bara användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". | sträng |
fineGrainTimestamp | Kolumnnamn som ska användas som FineGrainTimestamp | sträng |
Microsoft.MachineLearningServices/arbetsytor/datauppsättningar
Namn | Beskrivning | Värde |
---|---|---|
datasetType | Anger datamängdstyp. | "file" "Tabell" (krävs) |
Namn | Resursnamnet | sträng (krävs) |
Parametrar | DatasetCreateRequestParameters (krävs) | |
förälder | I Bicep kan du ange den överordnade resursen för en underordnad resurs. Du behöver bara lägga till den här egenskapen när den underordnade resursen deklareras utanför den överordnade resursen. Mer information finns i Underordnad resurs utanför den överordnade resursen. |
Symboliskt namn för resurs av typen: arbetsytor |
registrering | DatasetCreateRequestRegistration (krävs) | |
skipValidation | Hoppa över validering som säkerställer att data kan läsas in från datamängden före registreringen. | Bool |
timeSeries | DatasetCreateRequestTimeSeries |
Resursdefinition för ARM-mall
Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:
- Resursgrupper – Se resursgruppsdistributionskommandon
En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.
Resursformat
Om du vill skapa en Microsoft.MachineLearningServices/arbetsytor/datauppsättningsresurs lägger du till följande JSON i mallen.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {
"{customized property}": "string"
}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Egenskapsvärden
DatauppsättningSkapaRequestParameters
Namn | Beskrivning | Värde |
---|---|---|
rubrik | Rubriktyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. | Bool |
partitionFormat | Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:å/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datumtidstypen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med hjälp av sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn "CountryOrRegion" med värdet "USA" och en datetime-kolumn "PartitionDate" med värdet "2019-01-01 | sträng |
stig | DatasetCreateRequestParametersPath | |
fråga | DatasetCreateRequestParametersQuery | |
separator | Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. | sträng |
sourceType | Typ av datakälla. | "delimited_files" "json_lines_files" "parquet_files" |
DatauppsättningSkapaRequestParametersPath
Namn | Beskrivning | Värde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Http-URL:en. | sträng |
DatauppsättningSkapaRequestParametersPathDataPath
Namn | Beskrivning | Värde |
---|---|---|
datastoreName | Namnet på datalagringen. | sträng |
relativePath | Sökväg i dataarkivet. | sträng |
DatauppsättningSkapaRequestParametersQuery
Namn | Beskrivning | Värde |
---|---|---|
datastoreName | SQL/PostgreSQL/MySQL-datalagernamnet. | sträng |
fråga | SQL Quey. | sträng |
DatauppsättningSkapaRequestRegistration
Namn | Beskrivning | Värde |
---|---|---|
beskrivning | Beskrivningen för datamängden. | sträng |
Namn | Namnet på datauppsättningen. | sträng |
Taggar | Taggar som är associerade med datamängden. | DatasetCreateRequestRegistrationTags |
DatauppsättningSkapaRequestRegistrationTags
Namn | Beskrivning | Värde |
---|
DatauppsättningSkapaRequestTimeSeries
Namn | Beskrivning | Värde |
---|---|---|
coarseGrainTimestamp | Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan bara användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". | sträng |
fineGrainTimestamp | Kolumnnamn som ska användas som FineGrainTimestamp | sträng |
Microsoft.MachineLearningServices/arbetsytor/datauppsättningar
Namn | Beskrivning | Värde |
---|---|---|
apiVersion | API-versionen | "2020-05-01-preview" |
datasetType | Anger datamängdstyp. | "file" "Tabell" (krävs) |
Namn | Resursnamnet | sträng (krävs) |
Parametrar | DatasetCreateRequestParameters (krävs) | |
registrering | DatasetCreateRequestRegistration (krävs) | |
skipValidation | Hoppa över validering som säkerställer att data kan läsas in från datamängden före registreringen. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
typ | Resurstypen | "Microsoft.MachineLearningServices/workspaces/datasets" |
Snabbstartsmallar
Följande snabbstartsmallar distribuerar den här resurstypen.
Mall | Beskrivning |
---|---|
Skapa AML-arbetsyta med flera datauppsättningar & datalager |
Den här mallen skapar En Azure Machine Learning-arbetsyta med flera datauppsättningar & datalager. |
Skapa fildatauppsättning från relativ sökväg i Datalager |
Den här mallen skapar en fildatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan. |
Skapa fildatauppsättning i AML-arbetsytan från webb-URL |
Den här mallen skapar en fildatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning från relativ sökväg i Datalager |
Den här mallen skapar en tabelldatauppsättning från en relativ sökväg i datalager på Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning från SQL/PostgreSQL/MySQL-datalager |
Den här mallen skapar en tabelldatauppsättning från SQL-fråga i SQL/PostgreSQL/MySQL-datalager i Azure Machine Learning-arbetsytan. |
Skapa tabelldatauppsättning i AML-arbetsyta från webb-URL |
Den här mallen skapar en tabelldatauppsättning från webb-URL:en på Azure Machine Learning-arbetsytan. |
Resursdefinition för Terraform (AzAPI-provider)
Resurstypen arbetsytor/datauppsättningar kan distribueras med åtgärder som mål:
- Resursgrupper
En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.
Resursformat
Om du vill skapa en Microsoft.MachineLearningServices/arbetsytor/datauppsättningsresurs lägger du till följande Terraform i mallen.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {
{customized property} = "string"
}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
}
Egenskapsvärden
DatauppsättningSkapaRequestParameters
Namn | Beskrivning | Värde |
---|---|---|
rubrik | Rubriktyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Booleskt värde för att behålla sökvägsinformation som kolumn i datauppsättningen. Standardvärdet är Falskt. Detta är användbart när du läser flera filer och vill veta vilken fil en viss post kommer från, eller för att behålla användbar information i filsökvägen. | Bool |
partitionFormat | Partitionsinformationen för varje sökväg extraheras till kolumner baserat på det angivna formatet. Formatdelen {column_name} skapar strängkolumnen och {column_name:å/MM/dd/HH/mm/ss} skapar datetime-kolumnen, där "åååå", "MM", "dd", "HH", "mm" och "ss" används för att extrahera år, månad, dag, timme, minut och sekund för datumtidstypen. Formatet bör börja från positionen för den första partitionsnyckeln till slutet av filsökvägen. Till exempel med hjälp av sökvägen .. /USA/2019/01/01/data.parquet' där partitionen är efter land/region och tid, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' skapar en strängkolumn "CountryOrRegion" med värdet "USA" och en datetime-kolumn "PartitionDate" med värdet "2019-01-01 | sträng |
stig | DatasetCreateRequestParametersPath | |
fråga | DatasetCreateRequestParametersQuery | |
separator | Avgränsaren som används för att dela kolumner för "delimited_files" sourceType. | sträng |
sourceType | Typ av datakälla. | "delimited_files" "json_lines_files" "parquet_files" |
DatauppsättningSkapaRequestParametersPath
Namn | Beskrivning | Värde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Http-URL:en. | sträng |
DatauppsättningSkapaRequestParametersPathDataPath
Namn | Beskrivning | Värde |
---|---|---|
datastoreName | Namnet på datalagringen. | sträng |
relativePath | Sökväg i dataarkivet. | sträng |
DatauppsättningSkapaRequestParametersQuery
Namn | Beskrivning | Värde |
---|---|---|
datastoreName | SQL/PostgreSQL/MySQL-datalagernamnet. | sträng |
fråga | SQL Quey. | sträng |
DatauppsättningSkapaRequestRegistration
Namn | Beskrivning | Värde |
---|---|---|
beskrivning | Beskrivningen för datamängden. | sträng |
Namn | Namnet på datauppsättningen. | sträng |
Taggar | Taggar som är associerade med datamängden. | DatasetCreateRequestRegistrationTags |
DatauppsättningSkapaRequestRegistrationTags
Namn | Beskrivning | Värde |
---|
DatauppsättningSkapaRequestTimeSeries
Namn | Beskrivning | Värde |
---|---|---|
coarseGrainTimestamp | Kolumnnamn som ska användas som CoarseGrainTimestamp. Kan bara användas om "fineGrainTimestamp" har angetts och inte kan vara samma som "fineGrainTimestamp". | sträng |
fineGrainTimestamp | Kolumnnamn som ska användas som FineGrainTimestamp | sträng |
Microsoft.MachineLearningServices/arbetsytor/datauppsättningar
Namn | Beskrivning | Värde |
---|---|---|
datasetType | Anger datamängdstyp. | "file" "Tabell" (krävs) |
Namn | Resursnamnet | sträng (krävs) |
Parametrar | DatasetCreateRequestParameters (krävs) | |
parent_id | ID för resursen som är överordnad för den här resursen. | ID för resurs av typen: arbetsytor |
registrering | DatasetCreateRequestRegistration (krävs) | |
skipValidation | Hoppa över validering som säkerställer att data kan läsas in från datamängden före registreringen. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
typ | Resurstypen | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |