dataset_partition_prep Modul
Enthält Funktionen zum Angeben der Vorbereitung von Datasetpartitionen.
Die Partitionsvorbereitung erfolgt automatisch, wenn Sie eine opendatasets-Klasse verwenden, die eine Partition der Daten erfordert, z. B. die NycTlcGreen-Klasse.
Functions
prep_partition_datetime
Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.
prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])
Parameter
Name | Beschreibung |
---|---|
dflow
Erforderlich
|
<xref:azureml.dataprep.Dataflow>
Eine Instanz von dataprep.Dataflow. |
start_date
Erforderlich
|
Startdatum und -uhrzeit des Datasets. |
end_date
Erforderlich
|
Enddatum und -uhrzeit des Datasets. |
pattern
Erforderlich
|
Das datetime-Muster. |
prep_partition_puYear_puMonth
Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.
prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])
Parameter
Name | Beschreibung |
---|---|
dflow
Erforderlich
|
<xref:azureml.dataprep.Dataflow>
Eine Instanz von dataprep.Dataflow. |
start_date
Erforderlich
|
Startdatum und -uhrzeit des Datasets. |
end_date
Erforderlich
|
Enddatum und -uhrzeit des Datasets. |
pattern
Erforderlich
|
Das datetime-Muster. |
Nur Schlüsselwortparameter
Name | Beschreibung |
---|---|
pattern
|
Standardwert: ['puYear', 'puMonth']
|
prep_partition_year
Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.
prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])
Parameter
Name | Beschreibung |
---|---|
dflow
Erforderlich
|
<xref:azureml.dataprep.Dataflow>
Eine Instanz von dataprep.Dataflow. |
start_date
Erforderlich
|
Startdatum und -uhrzeit des Datasets. |
end_date
Erforderlich
|
Enddatum und -uhrzeit des Datasets. |
pattern
Erforderlich
|
Das datetime-Muster. |
Nur Schlüsselwortparameter
Name | Beschreibung |
---|---|
pattern
|
Standardwert: ['year']
|
prep_partition_year_month
Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.
prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])
Parameter
Name | Beschreibung |
---|---|
dflow
Erforderlich
|
<xref:azureml.dataprep.Dataflow>
Eine Instanz von dataprep.Dataflow. |
start_date
Erforderlich
|
Startdatum und -uhrzeit des Datasets. |
end_date
Erforderlich
|
Enddatum und -uhrzeit des Datasets. |
pattern
Erforderlich
|
Das datetime-Muster. |
Nur Schlüsselwortparameter
Name | Beschreibung |
---|---|
pattern
|
Standardwert: ['year', 'month']
|
prep_partition_year_month_day
Bereitet den Partitionspfad „year=\d+/month=\d+/“ vor.
prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])
Parameter
Name | Beschreibung |
---|---|
dflow
Erforderlich
|
<xref:azureml.dataprep.Dataflow>
Eine Instanz von dataprep.Dataflow. |
start_date
Erforderlich
|
Startdatum und -uhrzeit des Datasets. |
end_date
Erforderlich
|
Enddatum und -uhrzeit des Datasets. |
pattern
Erforderlich
|
Das datetime-Muster. |
Nur Schlüsselwortparameter
Name | Beschreibung |
---|---|
pattern
|
Standardwert: ['year', 'month', 'day']
|