Microsoft.MachineLearningServices workspaces/datasets

Artykuł
02/22/2025

Definicja zasobu Bicep

Typ zasobu obszary robocze/zestawy danych można wdrożyć przy użyciu operacji docelowych:

grupy zasobów — zobacz polecenia wdrażania grupy zasobów

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/datasets, dodaj następujący kod Bicep do szablonu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  parent: resourceSymbolicName
  datasetType: 'string'
  name: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Wartości właściwości

DatasetCreateRequestParameters

Nazwa	Opis	Wartość
nagłówek	Typ nagłówka.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Wartość logiczna do przechowywania informacji o ścieżce jako kolumny w zestawie danych. Wartość domyślna to False. Jest to przydatne podczas odczytywania wielu plików i chce wiedzieć, z którego pliku pochodzi określony rekord, lub zachować przydatne informacje w ścieżce pliku.	Bool
partitionFormat	Informacje o partycji każdej ścieżki zostaną wyodrębnione do kolumn na podstawie określonego formatu. Część formatu "{column_name}" tworzy kolumnę ciągu i "{column_name:rrrr/MM/dd/HH/mm/ss}" tworzy kolumnę datetime, gdzie "rrrr", "MM", "dd", "HH", "mm" i "ss" są używane do wyodrębniania roku, miesiąca, dnia, godziny, minuty i sekundy dla typu daty/godziny. Format powinien rozpoczynać się od pozycji pierwszego klucza partycji do końca ścieżki pliku. Na przykład, biorąc pod uwagę ścieżkę '.. /USA/2019/01/01/data.parquet' gdzie partycja jest według kraju/regionu i czasu, partition_format='/{CountryOrRegion}/{PartitionDate:rrrrrr/MM/dd}/data.csv" tworzy kolumnę ciągu "CountryOrRegion" z wartością "USA" i kolumną datetime "PartitionDate" z wartością "2019-01-01-01"	struna
ścieżka		DatasetCreateRequestParametersPath
zapytanie		DatasetCreateRequestParametersQuery
separator	Separator używany do dzielenia kolumn dla parametru sourceType "delimited_files".	struna
sourceType	Typ źródła danych.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Nazwa	Opis	Wartość
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	Adres URL http.	struna

DatasetCreateRequestParametersPathDataPath

Nazwa	Opis	Wartość
datastoreName	Nazwa magazynu danych.	struna
relativePath	Ścieżka w magazynie danych.	struna

DatasetCreateRequestParametersQuery

Nazwa	Opis	Wartość
datastoreName	Nazwa magazynu danych SQL/PostgreSQL/MySQL.	struna
zapytanie	Zapytanie SQL.	struna

DatasetCreateRequestRegistration

Nazwa	Opis	Wartość
opis	Opis zestawu danych.	struna
nazwa	Nazwa zestawu danych.	struna
Tagi	Tagi skojarzone z zestawem danych.	DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Nazwa	Opis	Wartość

DatasetCreateRequestTimeSeries

Nazwa	Opis	Wartość
coarseGrainTimestamp	Nazwa kolumny, która ma być używana jako CoarseGrainTimestamp. Można użyć tylko wtedy, gdy określono parametr "fineGrainTimestamp" i nie może być taki sam jak "fineGrainTimestamp".	struna
fineGrainTimestamp	Nazwa kolumny, która ma być używana jako FineGrainTimestamp	struna

Microsoft.MachineLearningServices/workspaces/datasets

Nazwa	Opis	Wartość
datasetType	Określa typ zestawu danych.	"plik" "Tabelaryczny" (wymagany)
nazwa	Nazwa zasobu	ciąg (wymagany)
Parametry		DatasetCreateRequestParameters (wymagane)
rodzic	W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym. Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym.	Nazwa symboliczna zasobu typu: obszarów roboczych
rejestracja		DatasetCreateRequestRegistration (wymagane)
skipValidation	Pomiń walidację, która gwarantuje, że dane można załadować z zestawu danych przed rejestracją.	Bool
timeSeries		DatasetCreateRequestTimeSeries

Definicja zasobu szablonu usługi ARM

Typ zasobu obszary robocze/zestawy danych można wdrożyć przy użyciu operacji docelowych:

grupy zasobów — zobacz polecenia wdrażania grupy zasobów

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/datasets, dodaj następujący kod JSON do szablonu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Wartości właściwości

DatasetCreateRequestParameters

Nazwa	Opis	Wartość
nagłówek	Typ nagłówka.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Wartość logiczna do przechowywania informacji o ścieżce jako kolumny w zestawie danych. Wartość domyślna to False. Jest to przydatne podczas odczytywania wielu plików i chce wiedzieć, z którego pliku pochodzi określony rekord, lub zachować przydatne informacje w ścieżce pliku.	Bool
partitionFormat	Informacje o partycji każdej ścieżki zostaną wyodrębnione do kolumn na podstawie określonego formatu. Część formatu "{column_name}" tworzy kolumnę ciągu i "{column_name:rrrr/MM/dd/HH/mm/ss}" tworzy kolumnę datetime, gdzie "rrrr", "MM", "dd", "HH", "mm" i "ss" są używane do wyodrębniania roku, miesiąca, dnia, godziny, minuty i sekundy dla typu daty/godziny. Format powinien rozpoczynać się od pozycji pierwszego klucza partycji do końca ścieżki pliku. Na przykład, biorąc pod uwagę ścieżkę '.. /USA/2019/01/01/data.parquet' gdzie partycja jest według kraju/regionu i czasu, partition_format='/{CountryOrRegion}/{PartitionDate:rrrrrr/MM/dd}/data.csv" tworzy kolumnę ciągu "CountryOrRegion" z wartością "USA" i kolumną datetime "PartitionDate" z wartością "2019-01-01-01"	struna
ścieżka		DatasetCreateRequestParametersPath
zapytanie		DatasetCreateRequestParametersQuery
separator	Separator używany do dzielenia kolumn dla parametru sourceType "delimited_files".	struna
sourceType	Typ źródła danych.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Nazwa	Opis	Wartość
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	Adres URL http.	struna

DatasetCreateRequestParametersPathDataPath

Nazwa	Opis	Wartość
datastoreName	Nazwa magazynu danych.	struna
relativePath	Ścieżka w magazynie danych.	struna

DatasetCreateRequestParametersQuery

Nazwa	Opis	Wartość
datastoreName	Nazwa magazynu danych SQL/PostgreSQL/MySQL.	struna
zapytanie	Zapytanie SQL.	struna

DatasetCreateRequestRegistration

Nazwa	Opis	Wartość
opis	Opis zestawu danych.	struna
nazwa	Nazwa zestawu danych.	struna
Tagi	Tagi skojarzone z zestawem danych.	DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Nazwa	Opis	Wartość

DatasetCreateRequestTimeSeries

Nazwa	Opis	Wartość
coarseGrainTimestamp	Nazwa kolumny, która ma być używana jako CoarseGrainTimestamp. Można użyć tylko wtedy, gdy określono parametr "fineGrainTimestamp" i nie może być taki sam jak "fineGrainTimestamp".	struna
fineGrainTimestamp	Nazwa kolumny, która ma być używana jako FineGrainTimestamp	struna

Microsoft.MachineLearningServices/workspaces/datasets

Nazwa	Opis	Wartość
apiVersion	Wersja interfejsu API	"2020-05-01-preview"
datasetType	Określa typ zestawu danych.	"plik" "Tabelaryczny" (wymagany)
nazwa	Nazwa zasobu	ciąg (wymagany)
Parametry		DatasetCreateRequestParameters (wymagane)
rejestracja		DatasetCreateRequestRegistration (wymagane)
skipValidation	Pomiń walidację, która gwarantuje, że dane można załadować z zestawu danych przed rejestracją.	Bool
timeSeries		DatasetCreateRequestTimeSeries
typ	Typ zasobu	"Microsoft.MachineLearningServices/workspaces/datasets"

Przykłady użycia

Szablony szybkiego startu platformy Azure

Następujące szablony szybkiego startu platformy Azure wdrożyć ten typ zasobu.

Szablon	Opis
Tworzenie obszaru roboczego AML z wieloma zestawami danych & Magazyny danych wdrażanie	Ten szablon tworzy obszar roboczy usługi Azure Machine Learning z wieloma zestawami danych & magazynami danych.
tworzenie zestawu danych pliku na podstawie ścieżki względnej w magazynie danych wdrażanie	Ten szablon tworzy zestaw danych pliku na podstawie ścieżki względnej w magazynie danych w obszarze roboczym usługi Azure Machine Learning.
tworzenie zestawu danych plików w obszarze roboczym usługi AML na podstawie internetowego adresu URL wdrażanie	Ten szablon tworzy zestaw danych plików na podstawie adresu URL sieci Web w obszarze roboczym usługi Azure Machine Learning.
tworzenie tabelarycznego zestawu danych na podstawie ścieżki względnej w magazynie danych wdrażanie	Ten szablon tworzy tabelaryczny zestaw danych na podstawie ścieżki względnej w magazynie danych w obszarze roboczym usługi Azure Machine Learning.
tworzenie tabelarycznego zestawu danych z SQL/PostgreSQL/MySQL wdrażanie	Ten szablon tworzy tabelaryczny zestaw danych na podstawie zapytania SQL w magazynie danych SQL/PostgreSQL/MySQL w obszarze roboczym usługi Azure Machine Learning.
Tworzenie tabelarycznego zestawu danych w obszarze roboczym usługi AML na podstawie internetowego adresu URL wdrażanie	Ten szablon tworzy tabelaryczny zestaw danych na podstawie adresu URL sieci Web w obszarze roboczym usługi Azure Machine Learning.

Definicja zasobu narzędzia Terraform (dostawcy AzAPI)

Typ zasobu obszary robocze/zestawy danych można wdrożyć przy użyciu operacji docelowych:

grupy zasobów

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennika zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/datasets, dodaj następujący program Terraform do szablonu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  datasetType = "string"
  parameters = {
    header = "string"
    includePath = bool
    partitionFormat = "string"
    path = {
      dataPath = {
        datastoreName = "string"
        relativePath = "string"
      }
      httpUrl = "string"
    }
    query = {
      datastoreName = "string"
      query = "string"
    }
    separator = "string"
    sourceType = "string"
  }
  registration = {
    description = "string"
    name = "string"
    tags = {
      {customized property} = "string"
    }
  }
  skipValidation = bool
  timeSeries = {
    coarseGrainTimestamp = "string"
    fineGrainTimestamp = "string"
  }
}

Wartości właściwości

DatasetCreateRequestParameters

Nazwa	Opis	Wartość
nagłówek	Typ nagłówka.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Wartość logiczna do przechowywania informacji o ścieżce jako kolumny w zestawie danych. Wartość domyślna to False. Jest to przydatne podczas odczytywania wielu plików i chce wiedzieć, z którego pliku pochodzi określony rekord, lub zachować przydatne informacje w ścieżce pliku.	Bool
partitionFormat	Informacje o partycji każdej ścieżki zostaną wyodrębnione do kolumn na podstawie określonego formatu. Część formatu "{column_name}" tworzy kolumnę ciągu i "{column_name:rrrr/MM/dd/HH/mm/ss}" tworzy kolumnę datetime, gdzie "rrrr", "MM", "dd", "HH", "mm" i "ss" są używane do wyodrębniania roku, miesiąca, dnia, godziny, minuty i sekundy dla typu daty/godziny. Format powinien rozpoczynać się od pozycji pierwszego klucza partycji do końca ścieżki pliku. Na przykład, biorąc pod uwagę ścieżkę '.. /USA/2019/01/01/data.parquet' gdzie partycja jest według kraju/regionu i czasu, partition_format='/{CountryOrRegion}/{PartitionDate:rrrrrr/MM/dd}/data.csv" tworzy kolumnę ciągu "CountryOrRegion" z wartością "USA" i kolumną datetime "PartitionDate" z wartością "2019-01-01-01"	struna
ścieżka		DatasetCreateRequestParametersPath
zapytanie		DatasetCreateRequestParametersQuery
separator	Separator używany do dzielenia kolumn dla parametru sourceType "delimited_files".	struna
sourceType	Typ źródła danych.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Nazwa	Opis	Wartość
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	Adres URL http.	struna

DatasetCreateRequestParametersPathDataPath

Nazwa	Opis	Wartość
datastoreName	Nazwa magazynu danych.	struna
relativePath	Ścieżka w magazynie danych.	struna

DatasetCreateRequestParametersQuery

Nazwa	Opis	Wartość
datastoreName	Nazwa magazynu danych SQL/PostgreSQL/MySQL.	struna
zapytanie	Zapytanie SQL.	struna

DatasetCreateRequestRegistration

Nazwa	Opis	Wartość
opis	Opis zestawu danych.	struna
nazwa	Nazwa zestawu danych.	struna
Tagi	Tagi skojarzone z zestawem danych.	DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Nazwa	Opis	Wartość

DatasetCreateRequestTimeSeries

Nazwa	Opis	Wartość
coarseGrainTimestamp	Nazwa kolumny, która ma być używana jako CoarseGrainTimestamp. Można użyć tylko wtedy, gdy określono parametr "fineGrainTimestamp" i nie może być taki sam jak "fineGrainTimestamp".	struna
fineGrainTimestamp	Nazwa kolumny, która ma być używana jako FineGrainTimestamp	struna

Microsoft.MachineLearningServices/workspaces/datasets

Nazwa	Opis	Wartość
datasetType	Określa typ zestawu danych.	"plik" "Tabelaryczny" (wymagany)
nazwa	Nazwa zasobu	ciąg (wymagany)
Parametry		DatasetCreateRequestParameters (wymagane)
parent_id	Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu.	Identyfikator zasobu typu: obszarów roboczych
rejestracja		DatasetCreateRequestRegistration (wymagane)
skipValidation	Pomiń walidację, która gwarantuje, że dane można załadować z zestawu danych przed rejestracją.	Bool
timeSeries		DatasetCreateRequestTimeSeries
typ	Typ zasobu	"Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"

Udostępnij za pośrednictwem

Microsoft.MachineLearningServices workspaces/datasets

Definicja zasobu Bicep

Format zasobu

Wartości właściwości

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestRegistrationTags

DatasetCreateRequestTimeSeries

Microsoft.MachineLearningServices/workspaces/datasets

Definicja zasobu szablonu usługi ARM

Format zasobu

Wartości właściwości

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestRegistrationTags

DatasetCreateRequestTimeSeries

Microsoft.MachineLearningServices/workspaces/datasets

Przykłady użycia

Szablony szybkiego startu platformy Azure

Definicja zasobu narzędzia Terraform (dostawcy AzAPI)

Format zasobu

Wartości właściwości

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestRegistrationTags

DatasetCreateRequestTimeSeries

Microsoft.MachineLearningServices/workspaces/datasets

Opinia

Dodatkowe zasoby