Microsoft.MachineLearningServices workspaces/datasets
Definicja zasobu Bicep
Typ zasobu obszary robocze/zestawy danych można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/datasets, dodaj następujący kod Bicep do szablonu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
parent: resourceSymbolicName
datasetType: 'string'
name: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {
{customized property}: 'string'
}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Wartości właściwości
DatasetCreateRequestParameters
Nazwa | Opis | Wartość |
---|---|---|
nagłówek | Typ nagłówka. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Wartość logiczna do przechowywania informacji o ścieżce jako kolumny w zestawie danych. Wartość domyślna to False. Jest to przydatne podczas odczytywania wielu plików i chce wiedzieć, z którego pliku pochodzi określony rekord, lub zachować przydatne informacje w ścieżce pliku. | Bool |
partitionFormat | Informacje o partycji każdej ścieżki zostaną wyodrębnione do kolumn na podstawie określonego formatu. Część formatu "{column_name}" tworzy kolumnę ciągu i "{column_name:rrrr/MM/dd/HH/mm/ss}" tworzy kolumnę datetime, gdzie "rrrr", "MM", "dd", "HH", "mm" i "ss" są używane do wyodrębniania roku, miesiąca, dnia, godziny, minuty i sekundy dla typu daty/godziny. Format powinien rozpoczynać się od pozycji pierwszego klucza partycji do końca ścieżki pliku. Na przykład, biorąc pod uwagę ścieżkę '.. /USA/2019/01/01/data.parquet' gdzie partycja jest według kraju/regionu i czasu, partition_format='/{CountryOrRegion}/{PartitionDate:rrrrrr/MM/dd}/data.csv" tworzy kolumnę ciągu "CountryOrRegion" z wartością "USA" i kolumną datetime "PartitionDate" z wartością "2019-01-01-01" | struna |
ścieżka | DatasetCreateRequestParametersPath | |
zapytanie | DatasetCreateRequestParametersQuery | |
separator | Separator używany do dzielenia kolumn dla parametru sourceType "delimited_files". | struna |
sourceType | Typ źródła danych. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Nazwa | Opis | Wartość |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Adres URL http. | struna |
DatasetCreateRequestParametersPathDataPath
Nazwa | Opis | Wartość |
---|---|---|
datastoreName | Nazwa magazynu danych. | struna |
relativePath | Ścieżka w magazynie danych. | struna |
DatasetCreateRequestParametersQuery
Nazwa | Opis | Wartość |
---|---|---|
datastoreName | Nazwa magazynu danych SQL/PostgreSQL/MySQL. | struna |
zapytanie | Zapytanie SQL. | struna |
DatasetCreateRequestRegistration
Nazwa | Opis | Wartość |
---|---|---|
opis | Opis zestawu danych. | struna |
nazwa | Nazwa zestawu danych. | struna |
Tagi | Tagi skojarzone z zestawem danych. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Nazwa | Opis | Wartość |
---|
DatasetCreateRequestTimeSeries
Nazwa | Opis | Wartość |
---|---|---|
coarseGrainTimestamp | Nazwa kolumny, która ma być używana jako CoarseGrainTimestamp. Można użyć tylko wtedy, gdy określono parametr "fineGrainTimestamp" i nie może być taki sam jak "fineGrainTimestamp". | struna |
fineGrainTimestamp | Nazwa kolumny, która ma być używana jako FineGrainTimestamp | struna |
Microsoft.MachineLearningServices/workspaces/datasets
Nazwa | Opis | Wartość |
---|---|---|
datasetType | Określa typ zestawu danych. | "plik" "Tabelaryczny" (wymagany) |
nazwa | Nazwa zasobu | ciąg (wymagany) |
Parametry | DatasetCreateRequestParameters (wymagane) | |
rodzic | W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym. Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym. |
Nazwa symboliczna zasobu typu: obszarów roboczych |
rejestracja | DatasetCreateRequestRegistration (wymagane) | |
skipValidation | Pomiń walidację, która gwarantuje, że dane można załadować z zestawu danych przed rejestracją. | Bool |
timeSeries | DatasetCreateRequestTimeSeries |
Definicja zasobu szablonu usługi ARM
Typ zasobu obszary robocze/zestawy danych można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/datasets, dodaj następujący kod JSON do szablonu.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {
"{customized property}": "string"
}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Wartości właściwości
DatasetCreateRequestParameters
Nazwa | Opis | Wartość |
---|---|---|
nagłówek | Typ nagłówka. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Wartość logiczna do przechowywania informacji o ścieżce jako kolumny w zestawie danych. Wartość domyślna to False. Jest to przydatne podczas odczytywania wielu plików i chce wiedzieć, z którego pliku pochodzi określony rekord, lub zachować przydatne informacje w ścieżce pliku. | Bool |
partitionFormat | Informacje o partycji każdej ścieżki zostaną wyodrębnione do kolumn na podstawie określonego formatu. Część formatu "{column_name}" tworzy kolumnę ciągu i "{column_name:rrrr/MM/dd/HH/mm/ss}" tworzy kolumnę datetime, gdzie "rrrr", "MM", "dd", "HH", "mm" i "ss" są używane do wyodrębniania roku, miesiąca, dnia, godziny, minuty i sekundy dla typu daty/godziny. Format powinien rozpoczynać się od pozycji pierwszego klucza partycji do końca ścieżki pliku. Na przykład, biorąc pod uwagę ścieżkę '.. /USA/2019/01/01/data.parquet' gdzie partycja jest według kraju/regionu i czasu, partition_format='/{CountryOrRegion}/{PartitionDate:rrrrrr/MM/dd}/data.csv" tworzy kolumnę ciągu "CountryOrRegion" z wartością "USA" i kolumną datetime "PartitionDate" z wartością "2019-01-01-01" | struna |
ścieżka | DatasetCreateRequestParametersPath | |
zapytanie | DatasetCreateRequestParametersQuery | |
separator | Separator używany do dzielenia kolumn dla parametru sourceType "delimited_files". | struna |
sourceType | Typ źródła danych. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Nazwa | Opis | Wartość |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Adres URL http. | struna |
DatasetCreateRequestParametersPathDataPath
Nazwa | Opis | Wartość |
---|---|---|
datastoreName | Nazwa magazynu danych. | struna |
relativePath | Ścieżka w magazynie danych. | struna |
DatasetCreateRequestParametersQuery
Nazwa | Opis | Wartość |
---|---|---|
datastoreName | Nazwa magazynu danych SQL/PostgreSQL/MySQL. | struna |
zapytanie | Zapytanie SQL. | struna |
DatasetCreateRequestRegistration
Nazwa | Opis | Wartość |
---|---|---|
opis | Opis zestawu danych. | struna |
nazwa | Nazwa zestawu danych. | struna |
Tagi | Tagi skojarzone z zestawem danych. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Nazwa | Opis | Wartość |
---|
DatasetCreateRequestTimeSeries
Nazwa | Opis | Wartość |
---|---|---|
coarseGrainTimestamp | Nazwa kolumny, która ma być używana jako CoarseGrainTimestamp. Można użyć tylko wtedy, gdy określono parametr "fineGrainTimestamp" i nie może być taki sam jak "fineGrainTimestamp". | struna |
fineGrainTimestamp | Nazwa kolumny, która ma być używana jako FineGrainTimestamp | struna |
Microsoft.MachineLearningServices/workspaces/datasets
Nazwa | Opis | Wartość |
---|---|---|
apiVersion | Wersja interfejsu API | "2020-05-01-preview" |
datasetType | Określa typ zestawu danych. | "plik" "Tabelaryczny" (wymagany) |
nazwa | Nazwa zasobu | ciąg (wymagany) |
Parametry | DatasetCreateRequestParameters (wymagane) | |
rejestracja | DatasetCreateRequestRegistration (wymagane) | |
skipValidation | Pomiń walidację, która gwarantuje, że dane można załadować z zestawu danych przed rejestracją. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/datasets" |
Przykłady użycia
Szablony szybkiego startu platformy Azure
Następujące szablony szybkiego startu platformy Azure wdrożyć ten typ zasobu.
Szablon | Opis |
---|---|
Tworzenie obszaru roboczego AML z wieloma zestawami danych & Magazyny danych wdrażanie |
Ten szablon tworzy obszar roboczy usługi Azure Machine Learning z wieloma zestawami danych & magazynami danych. |
tworzenie zestawu danych pliku na podstawie ścieżki względnej w magazynie danych wdrażanie |
Ten szablon tworzy zestaw danych pliku na podstawie ścieżki względnej w magazynie danych w obszarze roboczym usługi Azure Machine Learning. |
tworzenie zestawu danych plików w obszarze roboczym usługi AML na podstawie internetowego adresu URL wdrażanie |
Ten szablon tworzy zestaw danych plików na podstawie adresu URL sieci Web w obszarze roboczym usługi Azure Machine Learning. |
tworzenie tabelarycznego zestawu danych na podstawie ścieżki względnej w magazynie danych wdrażanie |
Ten szablon tworzy tabelaryczny zestaw danych na podstawie ścieżki względnej w magazynie danych w obszarze roboczym usługi Azure Machine Learning. |
tworzenie tabelarycznego zestawu danych z SQL/PostgreSQL/MySQL wdrażanie |
Ten szablon tworzy tabelaryczny zestaw danych na podstawie zapytania SQL w magazynie danych SQL/PostgreSQL/MySQL w obszarze roboczym usługi Azure Machine Learning. |
Tworzenie tabelarycznego zestawu danych w obszarze roboczym usługi AML na podstawie internetowego adresu URL wdrażanie |
Ten szablon tworzy tabelaryczny zestaw danych na podstawie adresu URL sieci Web w obszarze roboczym usługi Azure Machine Learning. |
Definicja zasobu narzędzia Terraform (dostawcy AzAPI)
Typ zasobu obszary robocze/zestawy danych można wdrożyć przy użyciu operacji docelowych:
- grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/datasets, dodaj następujący program Terraform do szablonu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {
{customized property} = "string"
}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
}
Wartości właściwości
DatasetCreateRequestParameters
Nazwa | Opis | Wartość |
---|---|---|
nagłówek | Typ nagłówka. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Wartość logiczna do przechowywania informacji o ścieżce jako kolumny w zestawie danych. Wartość domyślna to False. Jest to przydatne podczas odczytywania wielu plików i chce wiedzieć, z którego pliku pochodzi określony rekord, lub zachować przydatne informacje w ścieżce pliku. | Bool |
partitionFormat | Informacje o partycji każdej ścieżki zostaną wyodrębnione do kolumn na podstawie określonego formatu. Część formatu "{column_name}" tworzy kolumnę ciągu i "{column_name:rrrr/MM/dd/HH/mm/ss}" tworzy kolumnę datetime, gdzie "rrrr", "MM", "dd", "HH", "mm" i "ss" są używane do wyodrębniania roku, miesiąca, dnia, godziny, minuty i sekundy dla typu daty/godziny. Format powinien rozpoczynać się od pozycji pierwszego klucza partycji do końca ścieżki pliku. Na przykład, biorąc pod uwagę ścieżkę '.. /USA/2019/01/01/data.parquet' gdzie partycja jest według kraju/regionu i czasu, partition_format='/{CountryOrRegion}/{PartitionDate:rrrrrr/MM/dd}/data.csv" tworzy kolumnę ciągu "CountryOrRegion" z wartością "USA" i kolumną datetime "PartitionDate" z wartością "2019-01-01-01" | struna |
ścieżka | DatasetCreateRequestParametersPath | |
zapytanie | DatasetCreateRequestParametersQuery | |
separator | Separator używany do dzielenia kolumn dla parametru sourceType "delimited_files". | struna |
sourceType | Typ źródła danych. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Nazwa | Opis | Wartość |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Adres URL http. | struna |
DatasetCreateRequestParametersPathDataPath
Nazwa | Opis | Wartość |
---|---|---|
datastoreName | Nazwa magazynu danych. | struna |
relativePath | Ścieżka w magazynie danych. | struna |
DatasetCreateRequestParametersQuery
Nazwa | Opis | Wartość |
---|---|---|
datastoreName | Nazwa magazynu danych SQL/PostgreSQL/MySQL. | struna |
zapytanie | Zapytanie SQL. | struna |
DatasetCreateRequestRegistration
Nazwa | Opis | Wartość |
---|---|---|
opis | Opis zestawu danych. | struna |
nazwa | Nazwa zestawu danych. | struna |
Tagi | Tagi skojarzone z zestawem danych. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Nazwa | Opis | Wartość |
---|
DatasetCreateRequestTimeSeries
Nazwa | Opis | Wartość |
---|---|---|
coarseGrainTimestamp | Nazwa kolumny, która ma być używana jako CoarseGrainTimestamp. Można użyć tylko wtedy, gdy określono parametr "fineGrainTimestamp" i nie może być taki sam jak "fineGrainTimestamp". | struna |
fineGrainTimestamp | Nazwa kolumny, która ma być używana jako FineGrainTimestamp | struna |
Microsoft.MachineLearningServices/workspaces/datasets
Nazwa | Opis | Wartość |
---|---|---|
datasetType | Określa typ zestawu danych. | "plik" "Tabelaryczny" (wymagany) |
nazwa | Nazwa zasobu | ciąg (wymagany) |
Parametry | DatasetCreateRequestParameters (wymagane) | |
parent_id | Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. | Identyfikator zasobu typu: obszarów roboczych |
rejestracja | DatasetCreateRequestRegistration (wymagane) | |
skipValidation | Pomiń walidację, która gwarantuje, że dane można załadować z zestawu danych przed rejestracją. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |