Microsoft.MachineLearningServices/workspaces/datasets

Bicep-resourcedefinitie

Het resourcetype werkruimten/gegevenssets kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Resourcegroepen - Zie opdrachten voor de implementatie van resourcegroepen

Zie logboek wijzigenvoor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een Resource microsoft.MachineLearningServices/werkruimten/gegevenssets wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  parent: resourceSymbolicName
  datasetType: 'string'
  name: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Eigenschapswaarden

DatasetCreateRequestParameters

Naam	Beschrijving	Waarde
rubriek	Type koptekst.	'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers'
includePath	Booleaanse waarde om padgegevens als kolom in de gegevensset te bewaren. De standaardwaarde is Onwaar. Dit is handig bij het lezen van meerdere bestanden en wilt weten van welk bestand een bepaalde record afkomstig is of om nuttige informatie in het bestandspad te bewaren.	Bool
partitionFormat	De partitiegegevens van elk pad worden geëxtraheerd in kolommen op basis van de opgegeven indeling. Als onderdeel {column_name} wordt een tekenreekskolom gemaakt en {column_name:jjjj/MM/dd/HH/mm/ss} wordt een datum/tijdkolom gemaakt, waarbij 'jjjj', 'MM', 'dd', 'uu', 'mm' en 'ss' worden gebruikt voor het extraheren van jaar, maand, dag, uur en seconde voor het datum/tijd-type. De indeling moet beginnen vanaf de positie van de eerste partitiesleutel tot het einde van het bestandspad. Bijvoorbeeld, op basis van het pad '.. /USA/2019/01/01/data.parquet' waarbij de partitie per land/regio en tijd is, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' maakt een tekenreekskolom 'CountryOrRegion' met de waarde 'USA' en een datum/tijd-kolom 'PartitionDate' met de waarde '2019-01-01	snaar
pad		DatasetCreateRequestParametersPath
vraag		DatasetCreateRequestParametersQuery-
afscheider	Het scheidingsteken dat wordt gebruikt om kolommen te splitsen voor 'delimited_files' sourceType.	snaar
sourceType	Gegevensbrontype.	'delimited_files' 'json_lines_files' 'parquet_files'

DatasetCreateRequestParametersPath

Naam	Beschrijving	Waarde
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	De HTTP-URL.	snaar

DatasetCreateRequestParametersPathDataPath

Naam	Beschrijving	Waarde
datastoreName	De naam van het gegevensarchief.	snaar
relativePath	Pad binnen het gegevensarchief.	snaar

DatasetCreateRequestParametersQuery

Naam	Beschrijving	Waarde
datastoreName	De naam van het SQL/PostgreSQL/MySQL-gegevensarchief.	snaar
vraag	SQL Quey.	snaar

DatasetCreateRequestRegistration

Naam	Beschrijving	Waarde
beschrijving	De beschrijving voor de gegevensset.	snaar
naam	De naam van de gegevensset.	snaar
Tags	Tags die zijn gekoppeld aan de gegevensset.	DatasetCreateRequestRegistrationTags

DatasetCreateRequestRegistrationTags

Naam	Beschrijving	Waarde

DatasetCreateRequestTimeSeries

Naam	Beschrijving	Waarde
coarseGrainTimestamp	Kolomnaam die moet worden gebruikt als CoarseGrainTimestamp. Kan alleen worden gebruikt als 'fineGrainTimestamp' is opgegeven en niet hetzelfde kan zijn als 'fineGrainTimestamp'.	snaar
fineGrainTimestamp	Kolomnaam die moet worden gebruikt als FineGrainTimestamp	snaar

Naam	Beschrijving	Waarde
datasetType	Hiermee geeft u het type gegevensset op.	'bestand' 'tabellair' (vereist)
naam	De resourcenaam	tekenreeks (vereist)
Parameters		DatasetCreateRequestParameters (vereist)
ouder	In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd. Zie onderliggende resource buiten de bovenliggende resourcevoor meer informatie.	Symbolische naam voor resource van het type: werkruimten
registratie		DatasetCreateRequestRegistration (vereist)
skipValidation	Validatie overslaan die ervoor zorgt dat gegevens vóór de registratie uit de gegevensset kunnen worden geladen.	Bool
timeSeries		DatasetCreateRequestTimeSeries

Resourcedefinitie van ARM-sjabloon