Microsoft.MachineLearningServices/workspaces/datasets 2020-05-01-preview - Bicep, ARM template & Terraform AzAPI reference

Bicep-Ressourcendefinition

Der Ressourcentyp Arbeitsbereiche/Datasets kann mit Vorgängen bereitgestellt werden, die Folgendes zum Ziel haben:

Ressourcengruppen : Siehe Ressourcengruppenbereitstellungsbefehle

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie der Vorlage den folgenden Bicep hinzu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {}
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Eigenschaftswerte

Arbeitsbereiche/Datasets

Name	BESCHREIBUNG	Wert
name	Der Ressourcenname Erfahren Sie, wie Sie Namen und Typen für untergeordnete Ressourcen in Bicep festlegen.	Zeichenfolge (erforderlich)
parent	In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird. Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource.	Symbolischer Name für Ressource vom Typ: Arbeitsbereiche
datasetType	Gibt den Datasettyp an.	'Datei' "tabellarisch" (erforderlich)
parameters		DatasetCreateRequestParameters (erforderlich)
Registrierung		DatasetCreateRequestRegistration (erforderlich)
skipValidation	Überspringen Sie die Überprüfung, um sicherzustellen, dass Daten vor der Registrierung aus dem Dataset geladen werden können.	bool
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Name	BESCHREIBUNG	Wert
header	Headertyp.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern.	bool
partitionFormat	Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Aufgrund des Pfads ".. /USA/2019/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv" erstellt eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01-01".	Zeichenfolge
path		DatasetCreateRequestParametersPath
Abfrage		DatasetCreateRequestParametersQuery
Trennzeichen	Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird.	Zeichenfolge
sourceType	Datenquellentyp.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Name	BESCHREIBUNG	Wert
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	Die HTTP-URL.	Zeichenfolge

DatasetCreateRequestParametersPathDataPath

Name	BESCHREIBUNG	Wert
datastoreName	Der Datenspeichername	Zeichenfolge
relativePath	Pfad innerhalb des Datenspeichers.	Zeichenfolge

DatasetCreateRequestParametersQuery

Name	BESCHREIBUNG	Wert
datastoreName	Der Name des SQL/PostgreSQL/MySQL-Datenspeichers.	Zeichenfolge
Abfrage	SQL Quey.	Zeichenfolge

DatasetCreateRequestRegistration

Name	BESCHREIBUNG	Wert
description	Die Beschreibung für das Dataset.	Zeichenfolge
name	Der Name des Datasets.	Zeichenfolge
tags	Dem Dataset zugeordnete Tags.	Objekt (object)

DatasetCreateRequestTimeSeries

Name	BESCHREIBUNG	Wert
coarseGrainTimestamp	Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann.	Zeichenfolge
fineGrainTimestamp	Spaltenname, der als FineGrainTimestamp verwendet werden soll	Zeichenfolge

Schnellstartvorlagen

In den folgenden Schnellstartvorlagen wird dieser Ressourcentyp bereitgestellt.

Vorlage	BESCHREIBUNG
Erstellen eines Dateidatasets aus dem relativen Pfad im Datenspeicher	Diese Vorlage erstellt ein Dateidataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines Dateidatasets im AML-Arbeitsbereich über die Web-URL	Mit dieser Vorlage wird ein Dateidataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich erstellt.
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher	Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus dem SQL-/PostgreSQL-/MySQL-Datenspeicher	Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage im SQL-/PostgreSQL-/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich über die Web-URL	Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern	Diese Vorlage erstellt einen Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern.

Ressourcendefinition mit einer ARM-Vorlage

Der Ressourcentyp workspaces/datasets kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Ressourcengruppen – Siehe Bereitstellungsbefehle für Ressourcengruppen

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie im Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie der Vorlage den folgenden JSON-Code hinzu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {}
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Eigenschaftswerte

Arbeitsbereiche/Datasets

Name	BESCHREIBUNG	Wert
type	Der Ressourcentyp	"Microsoft.MachineLearningServices/workspaces/datasets"
apiVersion	Die Version der Ressourcen-API	"2020-05-01-preview"
name	Der Ressourcenname Weitere Informationen finden Sie unter Festlegen von Namen und Typen für untergeordnete Ressourcen in JSON-ARM-Vorlagen.	Zeichenfolge (erforderlich)
datasetType	Gibt den Datasettyp an.	"Datei" "tabellarisch" (erforderlich)
parameters		DatasetCreateRequestParameters (erforderlich)
Registrierung		DatasetCreateRequestRegistration (erforderlich)
skipValidation	Überspringen Sie die Überprüfung, die sicherstellt, dass Daten vor der Registrierung aus dem Dataset geladen werden können.	bool
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Name	BESCHREIBUNG	Wert
header	Headertyp.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern.	bool
partitionFormat	Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Unter Berücksichtigung des Pfads ".. /USA/2019/01/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/tt}/data.csv" eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01" erstellt.	Zeichenfolge
path		DatasetCreateRequestParametersPath
Abfrage		DatasetCreateRequestParametersQuery
Trennzeichen	Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird.	Zeichenfolge
sourceType	Datenquellentyp.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Name	BESCHREIBUNG	Wert
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	Die HTTP-URL.	Zeichenfolge

DatasetCreateRequestParametersPathDataPath

Name	BESCHREIBUNG	Wert
datastoreName	Der Datenspeichername	Zeichenfolge
relativePath	Pfad innerhalb des Datenspeichers.	Zeichenfolge

DatasetCreateRequestParametersQuery

Name	BESCHREIBUNG	Wert
datastoreName	Der Name des SQL-/PostgreSQL-/MySQL-Datenspeichers.	Zeichenfolge
Abfrage	SQL Quey.	Zeichenfolge

DatasetCreateRequestRegistration

Name	BESCHREIBUNG	Wert
description	Die Beschreibung für das Dataset.	Zeichenfolge
name	Der Name des Datasets.	Zeichenfolge
tags	Dem Dataset zugeordnete Tags.	Objekt (object)

DatasetCreateRequestTimeSeries

Name	BESCHREIBUNG	Wert
coarseGrainTimestamp	Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann.	Zeichenfolge
fineGrainTimestamp	Spaltenname, der als FineGrainTimestamp verwendet werden soll	Zeichenfolge

Schnellstartvorlagen

In den folgenden Schnellstartvorlagen wird dieser Ressourcentyp bereitgestellt.

Vorlage	BESCHREIBUNG
Erstellen eines Dateidatasets aus dem relativen Pfad im Datenspeicher	Diese Vorlage erstellt ein Dateidataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines Dateidatasets im AML-Arbeitsbereich über die Web-URL	Mit dieser Vorlage wird ein Dateidataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich erstellt.
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher	Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus dem SQL-/PostgreSQL-/MySQL-Datenspeicher	Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage im SQL-/PostgreSQL-/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich über die Web-URL	Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern	Diese Vorlage erstellt einen Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern.

Terraform-Ressourcendefinition (AzAPI-Anbieter)

Der Ressourcentyp workspaces/datasets kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Ressourcengruppen

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie im Änderungsprotokoll.

Ressourcenformat

Um eine Ressource "Microsoft.MachineLearningServices/workspaces/datasets" zu erstellen, fügen Sie der Vorlage die folgende Terraform-Ressource hinzu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {}
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Eigenschaftswerte

Arbeitsbereiche/Datasets

Name	BESCHREIBUNG	Wert
type	Der Ressourcentyp	"Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name	Der Ressourcenname	Zeichenfolge (erforderlich)
parent_id	Die ID der Ressource, die das übergeordnete Element für diese Ressource ist.	ID für Ressource vom Typ: Arbeitsbereiche
datasetType	Gibt den Datasettyp an.	"File" "tabellarisch" (erforderlich)
parameters		DatasetCreateRequestParameters (erforderlich)
Registrierung		DatasetCreateRequestRegistration (erforderlich)
skipValidation	Überspringen Sie die Überprüfung, die sicherstellt, dass Daten vor der Registrierung aus dem Dataset geladen werden können.	bool
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Name	BESCHREIBUNG	Wert
header	Headertyp.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Ein boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Der Standardwert lautet „False“. Dies ist hilfreich, wenn Sie mehrere Dateien lesen und wissen möchten, aus welcher Datei ein bestimmter Datensatz stammt. Außerdem können Sie damit nützliche Informationen im Dateipfad speichern.	bool
partitionFormat	Die Partitionsinformationen für die einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Mit dem Formatteil „{column_name}“ wird eine Zeichenfolgenspalte erstellt, und „{column_name:yyyyyy/MM/dd/HH/mm/ss}“ erstellt eine datetime-Spalte, wobei „yyyy“, „MM“, „dd“, „HH“, „mm“ und „ss“ verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den datetime-Typ zu extrahieren. Das Format muss an der Position des ersten Partitionsschlüssels beginnen und bis zum Ende des Dateipfads reichen. Beispiel: Unter Berücksichtigung des Pfads ".. /USA/2019/01/01/data.parquet", wobei die Partition nach Land/Region und Uhrzeit partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/tt}/data.csv" eine Zeichenfolgenspalte "CountryOrRegion" mit dem Wert "USA" und eine datetime-Spalte "PartitionDate" mit dem Wert "2019-01-01" erstellt.	Zeichenfolge
path		DatasetCreateRequestParametersPath
Abfrage		DatasetCreateRequestParametersQuery
Trennzeichen	Das Trennzeichen, das zum Aufteilen von Spalten für "delimited_files" sourceType verwendet wird.	Zeichenfolge
sourceType	Datenquellentyp.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Name	BESCHREIBUNG	Wert
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	Die HTTP-URL.	Zeichenfolge

DatasetCreateRequestParametersPathDataPath

Name	BESCHREIBUNG	Wert
datastoreName	Der Datenspeichername	Zeichenfolge
relativePath	Pfad innerhalb des Datenspeichers.	Zeichenfolge

DatasetCreateRequestParametersQuery

Name	BESCHREIBUNG	Wert
datastoreName	Der Name des SQL-/PostgreSQL-/MySQL-Datenspeichers.	Zeichenfolge
Abfrage	SQL Quey.	Zeichenfolge

DatasetCreateRequestRegistration

Name	BESCHREIBUNG	Wert
description	Die Beschreibung für das Dataset.	Zeichenfolge
name	Der Name des Datasets.	Zeichenfolge
tags	Dem Dataset zugeordnete Tags.	Objekt (object)

DatasetCreateRequestTimeSeries

Name	BESCHREIBUNG	Wert
coarseGrainTimestamp	Spaltenname, der als CoarseGrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn "fineGrainTimestamp" angegeben ist und nicht mit "fineGrainTimestamp" identisch sein kann.	Zeichenfolge
fineGrainTimestamp	Spaltenname, der als FineGrainTimestamp verwendet werden soll	Zeichenfolge

Freigeben über

Microsoft.MachineLearningServices-Arbeitsbereiche/Datasets 2020-05-01-preview

Bicep-Ressourcendefinition

Ressourcenformat

Eigenschaftswerte

Arbeitsbereiche/Datasets

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Schnellstartvorlagen

Ressourcendefinition mit einer ARM-Vorlage

Ressourcenformat

Eigenschaftswerte

Arbeitsbereiche/Datasets

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Schnellstartvorlagen

Terraform-Ressourcendefinition (AzAPI-Anbieter)

Ressourcenformat

Eigenschaftswerte

Arbeitsbereiche/Datasets

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Feedback

Zusätzliche Ressourcen