dataset_partition_prep Modul

Enthält Funktionen zum Angeben der Vorbereitung von Datasetpartitionen.

Die Partitionsvorbereitung erfolgt automatisch, wenn Sie eine opendatasets-Klasse verwenden, die eine Partition der Daten erfordert, z. B. die NycTlcGreen-Klasse.

Functions

prep_partition_datetime

Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.

prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])

Parameter

Name Beschreibung
dflow
Erforderlich
<xref:azureml.dataprep.Dataflow>

Eine Instanz von dataprep.Dataflow.

start_date
Erforderlich

Startdatum und -uhrzeit des Datasets.

end_date
Erforderlich

Enddatum und -uhrzeit des Datasets.

pattern
Erforderlich

Das datetime-Muster.

prep_partition_puYear_puMonth

Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.

prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

Parameter

Name Beschreibung
dflow
Erforderlich
<xref:azureml.dataprep.Dataflow>

Eine Instanz von dataprep.Dataflow.

start_date
Erforderlich

Startdatum und -uhrzeit des Datasets.

end_date
Erforderlich

Enddatum und -uhrzeit des Datasets.

pattern
Erforderlich

Das datetime-Muster.

Nur Schlüsselwortparameter

Name Beschreibung
pattern
Standardwert: ['puYear', 'puMonth']

prep_partition_year

Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.

prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])

Parameter

Name Beschreibung
dflow
Erforderlich
<xref:azureml.dataprep.Dataflow>

Eine Instanz von dataprep.Dataflow.

start_date
Erforderlich

Startdatum und -uhrzeit des Datasets.

end_date
Erforderlich

Enddatum und -uhrzeit des Datasets.

pattern
Erforderlich

Das datetime-Muster.

Nur Schlüsselwortparameter

Name Beschreibung
pattern
Standardwert: ['year']

prep_partition_year_month

Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.

prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])

Parameter

Name Beschreibung
dflow
Erforderlich
<xref:azureml.dataprep.Dataflow>

Eine Instanz von dataprep.Dataflow.

start_date
Erforderlich

Startdatum und -uhrzeit des Datasets.

end_date
Erforderlich

Enddatum und -uhrzeit des Datasets.

pattern
Erforderlich

Das datetime-Muster.

Nur Schlüsselwortparameter

Name Beschreibung
pattern
Standardwert: ['year', 'month']

prep_partition_year_month_day

Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.

prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])

Parameter

Name Beschreibung
dflow
Erforderlich
<xref:azureml.dataprep.Dataflow>

Eine Instanz von dataprep.Dataflow.

start_date
Erforderlich

Startdatum und -uhrzeit des Datasets.

end_date
Erforderlich

Enddatum und -uhrzeit des Datasets.

pattern
Erforderlich

Das datetime-Muster.

Nur Schlüsselwortparameter

Name Beschreibung
pattern
Standardwert: ['year', 'month', 'day']