Microsoft.MachineLearningServices-Arbeitsbereiche/Datasets
Bicep-Ressourcendefinition
Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Bicep hinzu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
parent: resourceSymbolicName
datasetType: 'string'
name: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {
{customized property}: 'string'
}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Eigenschaftswerte
DatasetCreateRequestParameters
Name | Beschreibung | Wert |
---|---|---|
Kopfball | Kopfzeilentyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten. | Bool |
partitionFormat | Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01' | Schnur |
Pfad | DatasetCreateRequestParametersPath- | |
Frage | DatasetCreateRequestParametersQuery | |
Separator | Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird. | Schnur |
sourceType | Datenquellentyp. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | Beschreibung | Wert |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath- | |
httpUrl | Die HTTP-URL. | Schnur |
DatasetCreateRequestParametersPathDataPath
Name | Beschreibung | Wert |
---|---|---|
datastoreName | Der Name des Datenspeichers. | Schnur |
relativePath | Pfad innerhalb des Datenspeichers. | Schnur |
DatasetCreateRequestParametersQuery
Name | Beschreibung | Wert |
---|---|---|
datastoreName | Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. | Schnur |
Frage | SQL Quey. | Schnur |
DatasetCreateRequestRegistration
Name | Beschreibung | Wert |
---|---|---|
Beschreibung | Die Beschreibung für das Dataset. | Schnur |
Name | Der Name des Datasets. | Schnur |
Schilder | Tags, die dem Dataset zugeordnet sind. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Name | Beschreibung | Wert |
---|
DatasetCreateRequestTimeSeries
Name | Beschreibung | Wert |
---|---|---|
grobgrainTimestamp | Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist. | Schnur |
fineGrainTimestamp | Spaltenname, der als FineGrainTimestamp verwendet werden soll | Schnur |
Microsoft.MachineLearningServices/workspaces/datasets
Name | Beschreibung | Wert |
---|---|---|
datasetType | Gibt den Datasettyp an. | 'file' "tabellarisch" (erforderlich) |
Name | Der Ressourcenname | Zeichenfolge (erforderlich) |
Parameter | DatasetCreateRequestParameters (erforderlich) | |
Elternteil | In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird. Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource. |
Symbolischer Name für Ressource des Typs: Arbeitsbereiche |
Registrierung | DatasetCreateRequestRegistration (erforderlich) | |
skipValidation | Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können. | Bool |
timeSeries | DatasetCreateRequestTimeSeries |
ARM-Vorlagenressourcendefinition
Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage den folgenden JSON-Code hinzu.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {
"{customized property}": "string"
}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Eigenschaftswerte
DatasetCreateRequestParameters
Name | Beschreibung | Wert |
---|---|---|
Kopfball | Kopfzeilentyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten. | Bool |
partitionFormat | Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01' | Schnur |
Pfad | DatasetCreateRequestParametersPath- | |
Frage | DatasetCreateRequestParametersQuery | |
Separator | Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird. | Schnur |
sourceType | Datenquellentyp. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | Beschreibung | Wert |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath- | |
httpUrl | Die HTTP-URL. | Schnur |
DatasetCreateRequestParametersPathDataPath
Name | Beschreibung | Wert |
---|---|---|
datastoreName | Der Name des Datenspeichers. | Schnur |
relativePath | Pfad innerhalb des Datenspeichers. | Schnur |
DatasetCreateRequestParametersQuery
Name | Beschreibung | Wert |
---|---|---|
datastoreName | Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. | Schnur |
Frage | SQL Quey. | Schnur |
DatasetCreateRequestRegistration
Name | Beschreibung | Wert |
---|---|---|
Beschreibung | Die Beschreibung für das Dataset. | Schnur |
Name | Der Name des Datasets. | Schnur |
Schilder | Tags, die dem Dataset zugeordnet sind. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Name | Beschreibung | Wert |
---|
DatasetCreateRequestTimeSeries
Name | Beschreibung | Wert |
---|---|---|
grobgrainTimestamp | Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist. | Schnur |
fineGrainTimestamp | Spaltenname, der als FineGrainTimestamp verwendet werden soll | Schnur |
Microsoft.MachineLearningServices/workspaces/datasets
Name | Beschreibung | Wert |
---|---|---|
apiVersion | Die API-Version | "2020-05-01-preview" |
datasetType | Gibt den Datasettyp an. | 'file' "tabellarisch" (erforderlich) |
Name | Der Ressourcenname | Zeichenfolge (erforderlich) |
Parameter | DatasetCreateRequestParameters (erforderlich) | |
Registrierung | DatasetCreateRequestRegistration (erforderlich) | |
skipValidation | Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/datasets" |
Schnellstartvorlagen
Die folgenden Schnellstartvorlagen stellen diesen Ressourcentyp bereit.
Schablone | Beschreibung |
---|---|
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern |
Diese Vorlage erstellt den Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern. |
Erstellen eines Dateidatensets aus dem relativen Pfad im Datenspeicher- |
Diese Vorlage erstellt ein Datei-Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines Dateidatensets im AML-Arbeitsbereich aus web-URL- |
Diese Vorlage erstellt ein Datei-Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher- |
Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines tabellarischen Datasets aus SQL/PostgreSQL/MySQL Datastore |
Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage in SQL/PostgreSQL/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich. |
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich aus web-URL- |
Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich. |
Terraform -Ressourcendefinition (AzAPI-Anbieter)
Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {
{customized property} = "string"
}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
}
Eigenschaftswerte
DatasetCreateRequestParameters
Name | Beschreibung | Wert |
---|---|---|
Kopfball | Kopfzeilentyp. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten. | Bool |
partitionFormat | Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01' | Schnur |
Pfad | DatasetCreateRequestParametersPath- | |
Frage | DatasetCreateRequestParametersQuery | |
Separator | Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird. | Schnur |
sourceType | Datenquellentyp. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Name | Beschreibung | Wert |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath- | |
httpUrl | Die HTTP-URL. | Schnur |
DatasetCreateRequestParametersPathDataPath
Name | Beschreibung | Wert |
---|---|---|
datastoreName | Der Name des Datenspeichers. | Schnur |
relativePath | Pfad innerhalb des Datenspeichers. | Schnur |
DatasetCreateRequestParametersQuery
Name | Beschreibung | Wert |
---|---|---|
datastoreName | Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. | Schnur |
Frage | SQL Quey. | Schnur |
DatasetCreateRequestRegistration
Name | Beschreibung | Wert |
---|---|---|
Beschreibung | Die Beschreibung für das Dataset. | Schnur |
Name | Der Name des Datasets. | Schnur |
Schilder | Tags, die dem Dataset zugeordnet sind. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Name | Beschreibung | Wert |
---|
DatasetCreateRequestTimeSeries
Name | Beschreibung | Wert |
---|---|---|
grobgrainTimestamp | Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist. | Schnur |
fineGrainTimestamp | Spaltenname, der als FineGrainTimestamp verwendet werden soll | Schnur |
Microsoft.MachineLearningServices/workspaces/datasets
Name | Beschreibung | Wert |
---|---|---|
datasetType | Gibt den Datasettyp an. | 'file' "tabellarisch" (erforderlich) |
Name | Der Ressourcenname | Zeichenfolge (erforderlich) |
Parameter | DatasetCreateRequestParameters (erforderlich) | |
parent_id | Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. | ID für Ressource des Typs: Arbeitsbereiche |
Registrierung | DatasetCreateRequestRegistration (erforderlich) | |
skipValidation | Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |