Microsoft.MachineLearningServices-werkruimten/gegevenssets
Bicep-resourcedefinitie
Het resourcetype werkruimten/gegevenssets kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor de implementatie van resourcegroepen
Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een Resource microsoft.MachineLearningServices/werkruimten/gegevenssets wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
parent: resourceSymbolicName
datasetType: 'string'
name: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {
{customized property}: 'string'
}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Eigenschapswaarden
DatasetCreateRequestParameters
Naam | Beschrijving | Waarde |
---|---|---|
rubriek | Type koptekst. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Booleaanse waarde om padgegevens als kolom in de gegevensset te bewaren. De standaardwaarde is Onwaar. Dit is handig bij het lezen van meerdere bestanden en wilt weten van welk bestand een bepaalde record afkomstig is of om nuttige informatie in het bestandspad te bewaren. | Bool |
partitionFormat | De partitiegegevens van elk pad worden geëxtraheerd in kolommen op basis van de opgegeven indeling. Als onderdeel {column_name} wordt een tekenreekskolom gemaakt en {column_name:jjjj/MM/dd/HH/mm/ss} wordt een datum/tijdkolom gemaakt, waarbij 'jjjj', 'MM', 'dd', 'uu', 'mm' en 'ss' worden gebruikt voor het extraheren van jaar, maand, dag, uur en seconde voor het datum/tijd-type. De indeling moet beginnen vanaf de positie van de eerste partitiesleutel tot het einde van het bestandspad. Bijvoorbeeld, op basis van het pad '.. /USA/2019/01/01/data.parquet' waarbij de partitie per land/regio en tijd is, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' maakt een tekenreekskolom 'CountryOrRegion' met de waarde 'USA' en een datum/tijd-kolom 'PartitionDate' met de waarde '2019-01-01 | snaar |
pad | DatasetCreateRequestParametersPath | |
vraag | DatasetCreateRequestParametersQuery- | |
afscheider | Het scheidingsteken dat wordt gebruikt om kolommen te splitsen voor 'delimited_files' sourceType. | snaar |
sourceType | Gegevensbrontype. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Naam | Beschrijving | Waarde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | De HTTP-URL. | snaar |
DatasetCreateRequestParametersPathDataPath
Naam | Beschrijving | Waarde |
---|---|---|
datastoreName | De naam van het gegevensarchief. | snaar |
relativePath | Pad binnen het gegevensarchief. | snaar |
DatasetCreateRequestParametersQuery
Naam | Beschrijving | Waarde |
---|---|---|
datastoreName | De naam van het SQL/PostgreSQL/MySQL-gegevensarchief. | snaar |
vraag | SQL Quey. | snaar |
DatasetCreateRequestRegistration
Naam | Beschrijving | Waarde |
---|---|---|
beschrijving | De beschrijving voor de gegevensset. | snaar |
naam | De naam van de gegevensset. | snaar |
Tags | Tags die zijn gekoppeld aan de gegevensset. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Naam | Beschrijving | Waarde |
---|
DatasetCreateRequestTimeSeries
Naam | Beschrijving | Waarde |
---|---|---|
coarseGrainTimestamp | Kolomnaam die moet worden gebruikt als CoarseGrainTimestamp. Kan alleen worden gebruikt als 'fineGrainTimestamp' is opgegeven en niet hetzelfde kan zijn als 'fineGrainTimestamp'. | snaar |
fineGrainTimestamp | Kolomnaam die moet worden gebruikt als FineGrainTimestamp | snaar |
Microsoft.MachineLearningServices/workspaces/datasets
Naam | Beschrijving | Waarde |
---|---|---|
datasetType | Hiermee geeft u het type gegevensset op. | 'bestand' 'tabellair' (vereist) |
naam | De resourcenaam | tekenreeks (vereist) |
Parameters | DatasetCreateRequestParameters (vereist) | |
ouder | In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd. Zie onderliggende resource buiten de bovenliggende resourcevoor meer informatie. |
Symbolische naam voor resource van het type: werkruimten |
registratie | DatasetCreateRequestRegistration (vereist) | |
skipValidation | Validatie overslaan die ervoor zorgt dat gegevens vóór de registratie uit de gegevensset kunnen worden geladen. | Bool |
timeSeries | DatasetCreateRequestTimeSeries |
Resourcedefinitie van ARM-sjabloon
Het resourcetype werkruimten/gegevenssets kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor de implementatie van resourcegroepen
Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource voor Microsoft.MachineLearningServices/werkruimten/gegevenssets wilt maken, voegt u de volgende JSON toe aan uw sjabloon.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {
"{customized property}": "string"
}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Eigenschapswaarden
DatasetCreateRequestParameters
Naam | Beschrijving | Waarde |
---|---|---|
rubriek | Type koptekst. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Booleaanse waarde om padgegevens als kolom in de gegevensset te bewaren. De standaardwaarde is Onwaar. Dit is handig bij het lezen van meerdere bestanden en wilt weten van welk bestand een bepaalde record afkomstig is of om nuttige informatie in het bestandspad te bewaren. | Bool |
partitionFormat | De partitiegegevens van elk pad worden geëxtraheerd in kolommen op basis van de opgegeven indeling. Als onderdeel {column_name} wordt een tekenreekskolom gemaakt en {column_name:jjjj/MM/dd/HH/mm/ss} wordt een datum/tijdkolom gemaakt, waarbij 'jjjj', 'MM', 'dd', 'uu', 'mm' en 'ss' worden gebruikt voor het extraheren van jaar, maand, dag, uur en seconde voor het datum/tijd-type. De indeling moet beginnen vanaf de positie van de eerste partitiesleutel tot het einde van het bestandspad. Bijvoorbeeld, op basis van het pad '.. /USA/2019/01/01/data.parquet' waarbij de partitie per land/regio en tijd is, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' maakt een tekenreekskolom 'CountryOrRegion' met de waarde 'USA' en een datum/tijd-kolom 'PartitionDate' met de waarde '2019-01-01 | snaar |
pad | DatasetCreateRequestParametersPath | |
vraag | DatasetCreateRequestParametersQuery- | |
afscheider | Het scheidingsteken dat wordt gebruikt om kolommen te splitsen voor 'delimited_files' sourceType. | snaar |
sourceType | Gegevensbrontype. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Naam | Beschrijving | Waarde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | De HTTP-URL. | snaar |
DatasetCreateRequestParametersPathDataPath
Naam | Beschrijving | Waarde |
---|---|---|
datastoreName | De naam van het gegevensarchief. | snaar |
relativePath | Pad binnen het gegevensarchief. | snaar |
DatasetCreateRequestParametersQuery
Naam | Beschrijving | Waarde |
---|---|---|
datastoreName | De naam van het SQL/PostgreSQL/MySQL-gegevensarchief. | snaar |
vraag | SQL Quey. | snaar |
DatasetCreateRequestRegistration
Naam | Beschrijving | Waarde |
---|---|---|
beschrijving | De beschrijving voor de gegevensset. | snaar |
naam | De naam van de gegevensset. | snaar |
Tags | Tags die zijn gekoppeld aan de gegevensset. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Naam | Beschrijving | Waarde |
---|
DatasetCreateRequestTimeSeries
Naam | Beschrijving | Waarde |
---|---|---|
coarseGrainTimestamp | Kolomnaam die moet worden gebruikt als CoarseGrainTimestamp. Kan alleen worden gebruikt als 'fineGrainTimestamp' is opgegeven en niet hetzelfde kan zijn als 'fineGrainTimestamp'. | snaar |
fineGrainTimestamp | Kolomnaam die moet worden gebruikt als FineGrainTimestamp | snaar |
Microsoft.MachineLearningServices/workspaces/datasets
Naam | Beschrijving | Waarde |
---|---|---|
apiVersion | De API-versie | '2020-05-01-preview' |
datasetType | Hiermee geeft u het type gegevensset op. | 'bestand' 'tabellair' (vereist) |
naam | De resourcenaam | tekenreeks (vereist) |
Parameters | DatasetCreateRequestParameters (vereist) | |
registratie | DatasetCreateRequestRegistration (vereist) | |
skipValidation | Validatie overslaan die ervoor zorgt dat gegevens vóór de registratie uit de gegevensset kunnen worden geladen. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
type | Het resourcetype | 'Microsoft.MachineLearningServices/workspaces/datasets' |
Gebruiksvoorbeelden
Azure-snelstartsjablonen
De volgende Azure-quickstartsjablonen dit resourcetype implementeren.
Sjabloon | Beschrijving |
---|---|
AML-werkruimte maken met meerdere gegevenssets & gegevensarchieven |
Met deze sjabloon maakt u een Azure Machine Learning-werkruimte met meerdere gegevenssets & gegevensarchieven. |
Een bestandsgegevensset maken op een relatief pad in het gegevensarchief |
Met deze sjabloon maakt u een bestandsgegevensset op basis van een relatief pad in het gegevensarchief in de Azure Machine Learning-werkruimte. |
Een bestandsgegevensset maken in een AML-werkruimte vanuit de web-URL |
Met deze sjabloon maakt u een bestandsgegevensset op basis van de web-URL in de Azure Machine Learning-werkruimte. |
Gegevensset in tabelvorm maken op basis van relatief pad in gegevensopslag |
Met deze sjabloon maakt u een tabellaire gegevensset op basis van een relatief pad in het gegevensarchief in de Azure Machine Learning-werkruimte. |
Tabelgegevensset maken op basis van SQL/PostgreSQL/MySQL Datastore |
Met deze sjabloon maakt u een tabellaire gegevensset op basis van EEN SQL-query in SQL/PostgreSQL/MySQL-gegevensopslag in de Azure Machine Learning-werkruimte. |
Tabelgegevensset maken in AML-werkruimte vanuit de web-URL |
Met deze sjabloon maakt u een tabellaire gegevensset op basis van de web-URL in de Azure Machine Learning-werkruimte. |
Resourcedefinitie van Terraform (AzAPI-provider)
Het resourcetype werkruimten/gegevenssets kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- resourcegroepen
Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een Resource microsoft.MachineLearningServices/werkruimten/gegevenssets wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {
{customized property} = "string"
}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
}
Eigenschapswaarden
DatasetCreateRequestParameters
Naam | Beschrijving | Waarde |
---|---|---|
rubriek | Type koptekst. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Booleaanse waarde om padgegevens als kolom in de gegevensset te bewaren. De standaardwaarde is Onwaar. Dit is handig bij het lezen van meerdere bestanden en wilt weten van welk bestand een bepaalde record afkomstig is of om nuttige informatie in het bestandspad te bewaren. | Bool |
partitionFormat | De partitiegegevens van elk pad worden geëxtraheerd in kolommen op basis van de opgegeven indeling. Als onderdeel {column_name} wordt een tekenreekskolom gemaakt en {column_name:jjjj/MM/dd/HH/mm/ss} wordt een datum/tijdkolom gemaakt, waarbij 'jjjj', 'MM', 'dd', 'uu', 'mm' en 'ss' worden gebruikt voor het extraheren van jaar, maand, dag, uur en seconde voor het datum/tijd-type. De indeling moet beginnen vanaf de positie van de eerste partitiesleutel tot het einde van het bestandspad. Bijvoorbeeld, op basis van het pad '.. /USA/2019/01/01/data.parquet' waarbij de partitie per land/regio en tijd is, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' maakt een tekenreekskolom 'CountryOrRegion' met de waarde 'USA' en een datum/tijd-kolom 'PartitionDate' met de waarde '2019-01-01 | snaar |
pad | DatasetCreateRequestParametersPath | |
vraag | DatasetCreateRequestParametersQuery- | |
afscheider | Het scheidingsteken dat wordt gebruikt om kolommen te splitsen voor 'delimited_files' sourceType. | snaar |
sourceType | Gegevensbrontype. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Naam | Beschrijving | Waarde |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | De HTTP-URL. | snaar |
DatasetCreateRequestParametersPathDataPath
Naam | Beschrijving | Waarde |
---|---|---|
datastoreName | De naam van het gegevensarchief. | snaar |
relativePath | Pad binnen het gegevensarchief. | snaar |
DatasetCreateRequestParametersQuery
Naam | Beschrijving | Waarde |
---|---|---|
datastoreName | De naam van het SQL/PostgreSQL/MySQL-gegevensarchief. | snaar |
vraag | SQL Quey. | snaar |
DatasetCreateRequestRegistration
Naam | Beschrijving | Waarde |
---|---|---|
beschrijving | De beschrijving voor de gegevensset. | snaar |
naam | De naam van de gegevensset. | snaar |
Tags | Tags die zijn gekoppeld aan de gegevensset. | DatasetCreateRequestRegistrationTags |
DatasetCreateRequestRegistrationTags
Naam | Beschrijving | Waarde |
---|
DatasetCreateRequestTimeSeries
Naam | Beschrijving | Waarde |
---|---|---|
coarseGrainTimestamp | Kolomnaam die moet worden gebruikt als CoarseGrainTimestamp. Kan alleen worden gebruikt als 'fineGrainTimestamp' is opgegeven en niet hetzelfde kan zijn als 'fineGrainTimestamp'. | snaar |
fineGrainTimestamp | Kolomnaam die moet worden gebruikt als FineGrainTimestamp | snaar |
Microsoft.MachineLearningServices/workspaces/datasets
Naam | Beschrijving | Waarde |
---|---|---|
datasetType | Hiermee geeft u het type gegevensset op. | 'bestand' 'tabellair' (vereist) |
naam | De resourcenaam | tekenreeks (vereist) |
Parameters | DatasetCreateRequestParameters (vereist) | |
parent_id | De id van de resource die het bovenliggende item voor deze resource is. | Id voor resource van het type: werkruimten |
registratie | DatasetCreateRequestRegistration (vereist) | |
skipValidation | Validatie overslaan die ervoor zorgt dat gegevens vóór de registratie uit de gegevensset kunnen worden geladen. | Bool |
timeSeries | DatasetCreateRequestTimeSeries | |
type | Het resourcetype | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |