Microsoft.MachineLearningServices-Arbeitsbereiche/Datasets 2020-05-01-preview
Bicep-Ressourcendefinition
Der Ressourcentyp Arbeitsbereiche/Datasets kann mit Vorgängen bereitgestellt werden, die Folgendes zum Ziel haben:
- Ressourcengruppen : Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie der Vorlage den folgenden Bicep hinzu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
name: 'string'
parent: resourceSymbolicName
datasetType: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Eigenschaftswerte
Arbeitsbereiche/Datasets
Name | BESCHREIBUNG | Wert |
---|---|---|
name | Der Ressourcenname Erfahren Sie, wie Sie Namen und Typen für untergeordnete Ressourcen in Bicep festlegen. |
Zeichenfolge (erforderlich) |
parent | In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird. Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource. |
Symbolischer Name für Ressource vom Typ: Arbeitsbereiche |
datasetType | Gibt den Datasettyp an. | 'Datei' "tabellarisch" (erforderlich) |
parameters | DatasetCreateRequestParameters (erforderlich) | |
Registrierung | DatasetCreateRequestRegistration (erforderlich) | |
skipValidation | Überspringen Sie die Überprüfung, um sicherzustellen, dass Daten vor der Registrierung aus dem Dataset geladen werden können. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Name | BESCHREIBUNG | Wert |
---|---|---|
header | Headertyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern. | bool |
partitionFormat | Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Aufgrund des Pfads ".. /USA/2019/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv" erstellt eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01-01". | Zeichenfolge |
path | DatasetCreateRequestParametersPath | |
Abfrage | DatasetCreateRequestParametersQuery | |
Trennzeichen | Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird. | Zeichenfolge |
sourceType | Datenquellentyp. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | BESCHREIBUNG | Wert |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Die HTTP-URL. | Zeichenfolge |
DatasetCreateRequestParametersPathDataPath
Name | BESCHREIBUNG | Wert |
---|---|---|
datastoreName | Der Datenspeichername | Zeichenfolge |
relativePath | Pfad innerhalb des Datenspeichers. | Zeichenfolge |
DatasetCreateRequestParametersQuery
Name | BESCHREIBUNG | Wert |
---|---|---|
datastoreName | Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. | Zeichenfolge |
Abfrage | SQL Quey. | Zeichenfolge |
DatasetCreateRequestRegistration
Name | BESCHREIBUNG | Wert |
---|---|---|
description | Die Beschreibung für das Dataset. | Zeichenfolge |
name | Der Name des Datasets. | Zeichenfolge |
tags | Dem Dataset zugeordnete Tags. | Objekt (object) |
DatasetCreateRequestTimeSeries
Name | BESCHREIBUNG | Wert |
---|---|---|
coarseGrainTimestamp | Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann. | Zeichenfolge |
fineGrainTimestamp | Spaltenname, der als FineGrainTimestamp verwendet werden soll | Zeichenfolge |
Schnellstartvorlagen
In den folgenden Schnellstartvorlagen wird dieser Ressourcentyp bereitgestellt.
Vorlage | BESCHREIBUNG |
---|---|
Erstellen eines Dateidatasets aus dem relativen Pfad im Datenspeicher |
Diese Vorlage erstellt ein Dateidataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines Dateidatasets im AML-Arbeitsbereich über die Web-URL |
Mit dieser Vorlage wird ein Dateidataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich erstellt. |
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher |
Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines tabellarischen Datasets aus dem SQL-/PostgreSQL-/MySQL-Datenspeicher |
Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage im SQL-/PostgreSQL-/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich über die Web-URL |
Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern |
Diese Vorlage erstellt einen Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern. |
Ressourcendefinition mit einer ARM-Vorlage
Der Ressourcentyp workspaces/datasets kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Bereitstellungsbefehle für Ressourcengruppen
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie im Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie der Vorlage den folgenden JSON-Code hinzu.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Eigenschaftswerte
Arbeitsbereiche/Datasets
Name | BESCHREIBUNG | Wert |
---|---|---|
type | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/datasets" |
apiVersion | Die Version der Ressourcen-API | "2020-05-01-preview" |
name | Der Ressourcenname Weitere Informationen finden Sie unter Festlegen von Namen und Typen für untergeordnete Ressourcen in JSON-ARM-Vorlagen. |
Zeichenfolge (erforderlich) |
datasetType | Gibt den Datasettyp an. | "Datei" "tabellarisch" (erforderlich) |
parameters | DatasetCreateRequestParameters (erforderlich) | |
Registrierung | DatasetCreateRequestRegistration (erforderlich) | |
skipValidation | Überspringen Sie die Überprüfung, die sicherstellt, dass Daten vor der Registrierung aus dem Dataset geladen werden können. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Name | BESCHREIBUNG | Wert |
---|---|---|
header | Headertyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern. | bool |
partitionFormat | Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Unter Berücksichtigung des Pfads ".. /USA/2019/01/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/tt}/data.csv" eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01" erstellt. | Zeichenfolge |
path | DatasetCreateRequestParametersPath | |
Abfrage | DatasetCreateRequestParametersQuery | |
Trennzeichen | Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird. | Zeichenfolge |
sourceType | Datenquellentyp. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | BESCHREIBUNG | Wert |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Die HTTP-URL. | Zeichenfolge |
DatasetCreateRequestParametersPathDataPath
Name | BESCHREIBUNG | Wert |
---|---|---|
datastoreName | Der Datenspeichername | Zeichenfolge |
relativePath | Pfad innerhalb des Datenspeichers. | Zeichenfolge |
DatasetCreateRequestParametersQuery
Name | BESCHREIBUNG | Wert |
---|---|---|
datastoreName | Der Name des SQL-/PostgreSQL-/MySQL-Datenspeichers. | Zeichenfolge |
Abfrage | SQL Quey. | Zeichenfolge |
DatasetCreateRequestRegistration
Name | BESCHREIBUNG | Wert |
---|---|---|
description | Die Beschreibung für das Dataset. | Zeichenfolge |
name | Der Name des Datasets. | Zeichenfolge |
tags | Dem Dataset zugeordnete Tags. | Objekt (object) |
DatasetCreateRequestTimeSeries
Name | BESCHREIBUNG | Wert |
---|---|---|
coarseGrainTimestamp | Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann. | Zeichenfolge |
fineGrainTimestamp | Spaltenname, der als FineGrainTimestamp verwendet werden soll | Zeichenfolge |
Schnellstartvorlagen
In den folgenden Schnellstartvorlagen wird dieser Ressourcentyp bereitgestellt.
Vorlage | BESCHREIBUNG |
---|---|
Erstellen eines Dateidatasets aus dem relativen Pfad im Datenspeicher |
Diese Vorlage erstellt ein Dateidataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines Dateidatasets im AML-Arbeitsbereich über die Web-URL |
Mit dieser Vorlage wird ein Dateidataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich erstellt. |
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher |
Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines tabellarischen Datasets aus dem SQL-/PostgreSQL-/MySQL-Datenspeicher |
Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage im SQL-/PostgreSQL-/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich über die Web-URL |
Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern |
Diese Vorlage erstellt einen Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern. |
Terraform-Ressourcendefinition (AzAPI-Anbieter)
Der Ressourcentyp workspaces/datasets kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie im Änderungsprotokoll.
Ressourcenformat
Um eine Ressource "Microsoft.MachineLearningServices/workspaces/datasets" zu erstellen, fügen Sie der Vorlage die folgende Terraform-Ressource hinzu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
parent_id = "string"
body = jsonencode({
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
})
}
Eigenschaftswerte
Arbeitsbereiche/Datasets
Name | BESCHREIBUNG | Wert |
---|---|---|
type | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |
name | Der Ressourcenname | Zeichenfolge (erforderlich) |
parent_id | Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. | ID für Ressource vom Typ: Arbeitsbereiche |
datasetType | Gibt den Datasettyp an. | "File" "tabellarisch" (erforderlich) |
parameters | DatasetCreateRequestParameters (erforderlich) | |
Registrierung | DatasetCreateRequestRegistration (erforderlich) | |
skipValidation | Überspringen Sie die Überprüfung, die sicherstellt, dass Daten vor der Registrierung aus dem Dataset geladen werden können. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Name | BESCHREIBUNG | Wert |
---|---|---|
header | Headertyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern. | bool |
partitionFormat | Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Unter Berücksichtigung des Pfads ".. /USA/2019/01/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/tt}/data.csv" eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01" erstellt. | Zeichenfolge |
path | DatasetCreateRequestParametersPath | |
Abfrage | DatasetCreateRequestParametersQuery | |
Trennzeichen | Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird. | Zeichenfolge |
sourceType | Datenquellentyp. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | BESCHREIBUNG | Wert |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Die HTTP-URL. | Zeichenfolge |
DatasetCreateRequestParametersPathDataPath
Name | BESCHREIBUNG | Wert |
---|---|---|
datastoreName | Der Datenspeichername | Zeichenfolge |
relativePath | Pfad innerhalb des Datenspeichers. | Zeichenfolge |
DatasetCreateRequestParametersQuery
Name | BESCHREIBUNG | Wert |
---|---|---|
datastoreName | Der Name des SQL-/PostgreSQL-/MySQL-Datenspeichers. | Zeichenfolge |
Abfrage | SQL Quey. | Zeichenfolge |
DatasetCreateRequestRegistration
Name | BESCHREIBUNG | Wert |
---|---|---|
description | Die Beschreibung für das Dataset. | Zeichenfolge |
name | Der Name des Datasets. | Zeichenfolge |
tags | Dem Dataset zugeordnete Tags. | Objekt (object) |
DatasetCreateRequestTimeSeries
Name | BESCHREIBUNG | Wert |
---|---|---|
coarseGrainTimestamp | Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann. | Zeichenfolge |
fineGrainTimestamp | Spaltenname, der als FineGrainTimestamp verwendet werden soll | Zeichenfolge |