Microsoft.MachineLearningServices-Arbeitsbereiche/Datasets

Artikel
12/09/2024

Bicep-Ressourcendefinition

Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Bicep hinzu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  parent: resourceSymbolicName
  datasetType: 'string'
  name: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Eigenschaftswerte

DatasetCreateRequestParameters

Name	Beschreibung	Wert
Kopfball	Kopfzeilentyp.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten.	Bool
partitionFormat	Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01'	Schnur
Pfad		DatasetCreateRequestParametersPath-
Frage		DatasetCreateRequestParametersQuery
Separator	Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird.	Schnur
sourceType	Datenquellentyp.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Name	Beschreibung	Wert
dataPath		DatasetCreateRequestParametersPathDataPath-
httpUrl	Die HTTP-URL.	Schnur

DatasetCreateRequestParametersPathDataPath

Name	Beschreibung	Wert
datastoreName	Der Name des Datenspeichers.	Schnur
relativePath	Pfad innerhalb des Datenspeichers.	Schnur

DatasetCreateRequestParametersQuery

Name	Beschreibung	Wert
datastoreName	Der Name des SQL/PostgreSQL/MySQL-Datenspeichers.	Schnur
Frage	SQL Quey.	Schnur

DatasetCreateRequestRegistration

Name	Beschreibung	Wert
Beschreibung	Die Beschreibung für das Dataset.	Schnur
Name	Der Name des Datasets.	Schnur
Schilder	Tags, die dem Dataset zugeordnet sind.	DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Name	Beschreibung	Wert

DatasetCreateRequestTimeSeries

Name	Beschreibung	Wert
grobgrainTimestamp	Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist.	Schnur
fineGrainTimestamp	Spaltenname, der als FineGrainTimestamp verwendet werden soll	Schnur

Microsoft.MachineLearningServices/workspaces/datasets

Name	Beschreibung	Wert
datasetType	Gibt den Datasettyp an.	'file' "tabellarisch" (erforderlich)
Name	Der Ressourcenname	Zeichenfolge (erforderlich)
Parameter		DatasetCreateRequestParameters (erforderlich)
Elternteil	In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird. Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource.	Symbolischer Name für Ressource des Typs: Arbeitsbereiche
Registrierung		DatasetCreateRequestRegistration (erforderlich)
skipValidation	Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können.	Bool
timeSeries		DatasetCreateRequestTimeSeries

ARM-Vorlagenressourcendefinition

Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage den folgenden JSON-Code hinzu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Eigenschaftswerte

DatasetCreateRequestParameters

Name	Beschreibung	Wert
Kopfball	Kopfzeilentyp.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten.	Bool
partitionFormat	Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01'	Schnur
Pfad		DatasetCreateRequestParametersPath-
Frage		DatasetCreateRequestParametersQuery
Separator	Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird.	Schnur
sourceType	Datenquellentyp.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Name	Beschreibung	Wert
dataPath		DatasetCreateRequestParametersPathDataPath-
httpUrl	Die HTTP-URL.	Schnur

DatasetCreateRequestParametersPathDataPath

Name	Beschreibung	Wert
datastoreName	Der Name des Datenspeichers.	Schnur
relativePath	Pfad innerhalb des Datenspeichers.	Schnur

DatasetCreateRequestParametersQuery

Name	Beschreibung	Wert
datastoreName	Der Name des SQL/PostgreSQL/MySQL-Datenspeichers.	Schnur
Frage	SQL Quey.	Schnur

DatasetCreateRequestRegistration

Name	Beschreibung	Wert
Beschreibung	Die Beschreibung für das Dataset.	Schnur
Name	Der Name des Datasets.	Schnur
Schilder	Tags, die dem Dataset zugeordnet sind.	DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Name	Beschreibung	Wert

DatasetCreateRequestTimeSeries

Name	Beschreibung	Wert
grobgrainTimestamp	Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist.	Schnur
fineGrainTimestamp	Spaltenname, der als FineGrainTimestamp verwendet werden soll	Schnur

Microsoft.MachineLearningServices/workspaces/datasets

Name	Beschreibung	Wert
apiVersion	Die API-Version	"2020-05-01-preview"
datasetType	Gibt den Datasettyp an.	'file' "tabellarisch" (erforderlich)
Name	Der Ressourcenname	Zeichenfolge (erforderlich)
Parameter		DatasetCreateRequestParameters (erforderlich)
Registrierung		DatasetCreateRequestRegistration (erforderlich)
skipValidation	Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können.	Bool
timeSeries		DatasetCreateRequestTimeSeries
Art	Der Ressourcentyp	"Microsoft.MachineLearningServices/workspaces/datasets"

Schnellstartvorlagen

Die folgenden Schnellstartvorlagen stellen diesen Ressourcentyp bereit.

Schablone	Beschreibung
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern	Diese Vorlage erstellt den Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern.
Erstellen eines Dateidatensets aus dem relativen Pfad im Datenspeicher-	Diese Vorlage erstellt ein Datei-Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines Dateidatensets im AML-Arbeitsbereich aus web-URL-	Diese Vorlage erstellt ein Datei-Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher-	Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus SQL/PostgreSQL/MySQL Datastore	Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage in SQL/PostgreSQL/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich aus web-URL-	Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.

Terraform -Ressourcendefinition (AzAPI-Anbieter)

Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Ressourcengruppen

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  datasetType = "string"
  parameters = {
    header = "string"
    includePath = bool
    partitionFormat = "string"
    path = {
      dataPath = {
        datastoreName = "string"
        relativePath = "string"
      }
      httpUrl = "string"
    }
    query = {
      datastoreName = "string"
      query = "string"
    }
    separator = "string"
    sourceType = "string"
  }
  registration = {
    description = "string"
    name = "string"
    tags = {
      {customized property} = "string"
    }
  }
  skipValidation = bool
  timeSeries = {
    coarseGrainTimestamp = "string"
    fineGrainTimestamp = "string"
  }
}

Eigenschaftswerte

DatasetCreateRequestParameters

Name	Beschreibung	Wert
Kopfball	Kopfzeilentyp.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten.	Bool
partitionFormat	Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01'	Schnur
Pfad		DatasetCreateRequestParametersPath-
Frage		DatasetCreateRequestParametersQuery
Separator	Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird.	Schnur
sourceType	Datenquellentyp.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Name	Beschreibung	Wert
dataPath		DatasetCreateRequestParametersPathDataPath-
httpUrl	Die HTTP-URL.	Schnur

DatasetCreateRequestParametersPathDataPath

Name	Beschreibung	Wert
datastoreName	Der Name des Datenspeichers.	Schnur
relativePath	Pfad innerhalb des Datenspeichers.	Schnur

DatasetCreateRequestParametersQuery

Name	Beschreibung	Wert
datastoreName	Der Name des SQL/PostgreSQL/MySQL-Datenspeichers.	Schnur
Frage	SQL Quey.	Schnur

DatasetCreateRequestRegistration

Name	Beschreibung	Wert
Beschreibung	Die Beschreibung für das Dataset.	Schnur
Name	Der Name des Datasets.	Schnur
Schilder	Tags, die dem Dataset zugeordnet sind.	DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Name	Beschreibung	Wert

DatasetCreateRequestTimeSeries

Name	Beschreibung	Wert
grobgrainTimestamp	Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist.	Schnur
fineGrainTimestamp	Spaltenname, der als FineGrainTimestamp verwendet werden soll	Schnur

Microsoft.MachineLearningServices/workspaces/datasets

Name	Beschreibung	Wert
datasetType	Gibt den Datasettyp an.	'file' "tabellarisch" (erforderlich)
Name	Der Ressourcenname	Zeichenfolge (erforderlich)
Parameter		DatasetCreateRequestParameters (erforderlich)
parent_id	Die ID der Ressource, die das übergeordnete Element für diese Ressource ist.	ID für Ressource des Typs: Arbeitsbereiche
Registrierung		DatasetCreateRequestRegistration (erforderlich)
skipValidation	Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können.	Bool
timeSeries		DatasetCreateRequestTimeSeries
Art	Der Ressourcentyp	"Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"

Freigeben über

Microsoft.MachineLearningServices-Arbeitsbereiche/Datasets

Bicep-Ressourcendefinition

Ressourcenformat

Eigenschaftswerte

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestRegistrationTags

DatasetCreateRequestTimeSeries

Microsoft.MachineLearningServices/workspaces/datasets

ARM-Vorlagenressourcendefinition

Ressourcenformat

Eigenschaftswerte

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestRegistrationTags

DatasetCreateRequestTimeSeries

Microsoft.MachineLearningServices/workspaces/datasets

Schnellstartvorlagen

Terraform -Ressourcendefinition (AzAPI-Anbieter)

Ressourcenformat

Eigenschaftswerte

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestRegistrationTags

DatasetCreateRequestTimeSeries

Microsoft.MachineLearningServices/workspaces/datasets

Feedback

Zusätzliche Ressourcen