Freigeben über


Microsoft.MachineLearningServices-Arbeitsbereiche/Datasets

Bicep-Ressourcendefinition

Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Bicep hinzu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  parent: resourceSymbolicName
  datasetType: 'string'
  name: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Eigenschaftswerte

DatasetCreateRequestParameters

Name Beschreibung Wert
Kopfball Kopfzeilentyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten. Bool
partitionFormat Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01' Schnur
Pfad DatasetCreateRequestParametersPath-
Frage DatasetCreateRequestParametersQuery
Separator Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird. Schnur
sourceType Datenquellentyp. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name Beschreibung Wert
dataPath DatasetCreateRequestParametersPathDataPath-
httpUrl Die HTTP-URL. Schnur

DatasetCreateRequestParametersPathDataPath

Name Beschreibung Wert
datastoreName Der Name des Datenspeichers. Schnur
relativePath Pfad innerhalb des Datenspeichers. Schnur

DatasetCreateRequestParametersQuery

Name Beschreibung Wert
datastoreName Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. Schnur
Frage SQL Quey. Schnur

DatasetCreateRequestRegistration

Name Beschreibung Wert
Beschreibung Die Beschreibung für das Dataset. Schnur
Name Der Name des Datasets. Schnur
Schilder Tags, die dem Dataset zugeordnet sind. DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Name Beschreibung Wert

DatasetCreateRequestTimeSeries

Name Beschreibung Wert
grobgrainTimestamp Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist. Schnur
fineGrainTimestamp Spaltenname, der als FineGrainTimestamp verwendet werden soll Schnur

Microsoft.MachineLearningServices/workspaces/datasets

Name Beschreibung Wert
datasetType Gibt den Datasettyp an. 'file'
"tabellarisch" (erforderlich)
Name Der Ressourcenname Zeichenfolge (erforderlich)
Parameter DatasetCreateRequestParameters (erforderlich)
Elternteil In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird.

Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource.
Symbolischer Name für Ressource des Typs: Arbeitsbereiche
Registrierung DatasetCreateRequestRegistration (erforderlich)
skipValidation Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können. Bool
timeSeries DatasetCreateRequestTimeSeries

ARM-Vorlagenressourcendefinition

Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage den folgenden JSON-Code hinzu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Eigenschaftswerte

DatasetCreateRequestParameters

Name Beschreibung Wert
Kopfball Kopfzeilentyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten. Bool
partitionFormat Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01' Schnur
Pfad DatasetCreateRequestParametersPath-
Frage DatasetCreateRequestParametersQuery
Separator Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird. Schnur
sourceType Datenquellentyp. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name Beschreibung Wert
dataPath DatasetCreateRequestParametersPathDataPath-
httpUrl Die HTTP-URL. Schnur

DatasetCreateRequestParametersPathDataPath

Name Beschreibung Wert
datastoreName Der Name des Datenspeichers. Schnur
relativePath Pfad innerhalb des Datenspeichers. Schnur

DatasetCreateRequestParametersQuery

Name Beschreibung Wert
datastoreName Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. Schnur
Frage SQL Quey. Schnur

DatasetCreateRequestRegistration

Name Beschreibung Wert
Beschreibung Die Beschreibung für das Dataset. Schnur
Name Der Name des Datasets. Schnur
Schilder Tags, die dem Dataset zugeordnet sind. DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Name Beschreibung Wert

DatasetCreateRequestTimeSeries

Name Beschreibung Wert
grobgrainTimestamp Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist. Schnur
fineGrainTimestamp Spaltenname, der als FineGrainTimestamp verwendet werden soll Schnur

Microsoft.MachineLearningServices/workspaces/datasets

Name Beschreibung Wert
apiVersion Die API-Version "2020-05-01-preview"
datasetType Gibt den Datasettyp an. 'file'
"tabellarisch" (erforderlich)
Name Der Ressourcenname Zeichenfolge (erforderlich)
Parameter DatasetCreateRequestParameters (erforderlich)
Registrierung DatasetCreateRequestRegistration (erforderlich)
skipValidation Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können. Bool
timeSeries DatasetCreateRequestTimeSeries
Art Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/datasets"

Schnellstartvorlagen

Die folgenden Schnellstartvorlagen stellen diesen Ressourcentyp bereit.

Schablone Beschreibung
Erstellen eines AML-Arbeitsbereichs mit mehreren Datasets & Datenspeichern

Bereitstellen in Azure
Diese Vorlage erstellt den Azure Machine Learning-Arbeitsbereich mit mehreren Datasets & Datenspeichern.
Erstellen eines Dateidatensets aus dem relativen Pfad im Datenspeicher-

Bereitstellen in Azure
Diese Vorlage erstellt ein Datei-Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines Dateidatensets im AML-Arbeitsbereich aus web-URL-

Bereitstellen in Azure
Diese Vorlage erstellt ein Datei-Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus dem relativen Pfad im Datenspeicher-

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus dem relativen Pfad im Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets aus SQL/PostgreSQL/MySQL Datastore

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus SQL-Abfrage in SQL/PostgreSQL/MySQL-Datenspeicher im Azure Machine Learning-Arbeitsbereich.
Erstellen eines tabellarischen Datasets im AML-Arbeitsbereich aus web-URL-

Bereitstellen in Azure
Diese Vorlage erstellt ein tabellarisches Dataset aus der Web-URL im Azure Machine Learning-Arbeitsbereich.

Terraform -Ressourcendefinition (AzAPI-Anbieter)

Der Ressourcentyp "Arbeitsbereiche/Datasets" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:

  • Ressourcengruppen

Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.

Ressourcenformat

Um eine Microsoft.MachineLearningServices/workspaces/datasets-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  datasetType = "string"
  parameters = {
    header = "string"
    includePath = bool
    partitionFormat = "string"
    path = {
      dataPath = {
        datastoreName = "string"
        relativePath = "string"
      }
      httpUrl = "string"
    }
    query = {
      datastoreName = "string"
      query = "string"
    }
    separator = "string"
    sourceType = "string"
  }
  registration = {
    description = "string"
    name = "string"
    tags = {
      {customized property} = "string"
    }
  }
  skipValidation = bool
  timeSeries = {
    coarseGrainTimestamp = "string"
    fineGrainTimestamp = "string"
  }
}

Eigenschaftswerte

DatasetCreateRequestParameters

Name Beschreibung Wert
Kopfball Kopfzeilentyp. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Boolescher Wert, um Pfadinformationen als Spalte im Dataset beizubehalten. Standardwert ist "False". Dies ist nützlich, wenn Sie mehrere Dateien lesen und wissen möchten, von welcher Datei ein bestimmter Datensatz stammt, oder um nützliche Informationen im Dateipfad zu behalten. Bool
partitionFormat Die Partitionsinformationen der einzelnen Pfade werden basierend auf dem angegebenen Format in Spalten extrahiert. Der Formatteil "{column_name}" erstellt Zeichenfolgenspalte, und "{column_name:jjjj/MM/TT/HH/mm/ss}" erstellt datumstime-Spalte, wobei "yyyyy", "MM", "dd", "HH", "mm" und "ss" verwendet werden, um Jahr, Monat, Tag, Stunde, Minute und Sekunde für den Datetime-Typ zu extrahieren. Das Format sollte von der Position des ersten Partitionsschlüssels bis zum Ende des Dateipfads beginnen. Geben Sie z. B. den Pfad ".. /USA/2019/01/01/data.parkett", wobei die Partition nach Land/Region und Zeit ist, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' erstellt eine Zeichenfolgenspalte 'CountryOrRegion' mit dem Wert 'USA' und einer Datetime-Spalte 'PartitionDate' mit dem Wert '2019-01-01-01' Schnur
Pfad DatasetCreateRequestParametersPath-
Frage DatasetCreateRequestParametersQuery
Separator Das Trennzeichen, das zum Teilen von Spalten für "delimited_files" sourceType verwendet wird. Schnur
sourceType Datenquellentyp. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Name Beschreibung Wert
dataPath DatasetCreateRequestParametersPathDataPath-
httpUrl Die HTTP-URL. Schnur

DatasetCreateRequestParametersPathDataPath

Name Beschreibung Wert
datastoreName Der Name des Datenspeichers. Schnur
relativePath Pfad innerhalb des Datenspeichers. Schnur

DatasetCreateRequestParametersQuery

Name Beschreibung Wert
datastoreName Der Name des SQL/PostgreSQL/MySQL-Datenspeichers. Schnur
Frage SQL Quey. Schnur

DatasetCreateRequestRegistration

Name Beschreibung Wert
Beschreibung Die Beschreibung für das Dataset. Schnur
Name Der Name des Datasets. Schnur
Schilder Tags, die dem Dataset zugeordnet sind. DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Name Beschreibung Wert

DatasetCreateRequestTimeSeries

Name Beschreibung Wert
grobgrainTimestamp Spaltenname, der als GrobgrainTimestamp verwendet werden soll. Kann nur verwendet werden, wenn 'fineGrainTimestamp' angegeben ist und nicht mit 'fineGrainTimestamp' identisch ist. Schnur
fineGrainTimestamp Spaltenname, der als FineGrainTimestamp verwendet werden soll Schnur

Microsoft.MachineLearningServices/workspaces/datasets

Name Beschreibung Wert
datasetType Gibt den Datasettyp an. 'file'
"tabellarisch" (erforderlich)
Name Der Ressourcenname Zeichenfolge (erforderlich)
Parameter DatasetCreateRequestParameters (erforderlich)
parent_id Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. ID für Ressource des Typs: Arbeitsbereiche
Registrierung DatasetCreateRequestRegistration (erforderlich)
skipValidation Überspringen Sie die Überprüfung, mit der sichergestellt wird, dass Daten vor der Registrierung aus dem Dataset geladen werden können. Bool
timeSeries DatasetCreateRequestTimeSeries
Art Der Ressourcentyp "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"