dataset_partition_prep Modulo

Contiene la funzionalità per specificare la preparazione della partizione del set di dati.

La preparazione della partizione viene eseguita automaticamente quando si usa una opendatasets classe che richiede una partizione di dati, ad esempio la NycTlcGreen classe .

Funzioni

prep_partition_datetime

Preparare il percorso di partizione 'year=\d+/month=\d+/'.

prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])

Parametri

Nome Descrizione
dflow
Necessario
<xref:azureml.dataprep.Dataflow>

Istanza di dataprep. Flusso.

start_date
Necessario

Data/ora di inizio del set di dati.

end_date
Necessario

Data/ora di fine del set di dati.

pattern
Necessario

Modello datetime.

prep_partition_puYear_puMonth

Preparare il percorso di partizione 'year=\d+/month=\d+/'.

prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

Parametri

Nome Descrizione
dflow
Necessario
<xref:azureml.dataprep.Dataflow>

Istanza di dataprep. Flusso.

start_date
Necessario

Data/ora di inizio del set di dati.

end_date
Necessario

Data/ora di fine del set di dati.

pattern
Necessario

Modello datetime.

Parametri di sole parole chiave

Nome Descrizione
pattern
Valore predefinito: ['puYear', 'puMonth']

prep_partition_year

Preparare il percorso di partizione 'year=\d+/month=\d+/'.

prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])

Parametri

Nome Descrizione
dflow
Necessario
<xref:azureml.dataprep.Dataflow>

Istanza di dataprep. Flusso.

start_date
Necessario

Data/ora di inizio del set di dati.

end_date
Necessario

Data/ora di fine del set di dati.

pattern
Necessario

Modello datetime.

Parametri di sole parole chiave

Nome Descrizione
pattern
Valore predefinito: ['year']

prep_partition_year_month

Preparare il percorso di partizione 'year=\d+/month=\d+/'.

prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])

Parametri

Nome Descrizione
dflow
Necessario
<xref:azureml.dataprep.Dataflow>

Istanza di dataprep. Flusso.

start_date
Necessario

Data/ora di inizio del set di dati.

end_date
Necessario

Data/ora di fine del set di dati.

pattern
Necessario

Modello datetime.

Parametri di sole parole chiave

Nome Descrizione
pattern
Valore predefinito: ['year', 'month']

prep_partition_year_month_day

Preparare il percorso di partizione 'year=\d+/month=\d+/'.

prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])

Parametri

Nome Descrizione
dflow
Necessario
<xref:azureml.dataprep.Dataflow>

Istanza di dataprep. Flusso.

start_date
Necessario

Data/ora di inizio del set di dati.

end_date
Necessario

Data/ora di fine del set di dati.

pattern
Necessario

Modello datetime.

Parametri di sole parole chiave

Nome Descrizione
pattern
Valore predefinito: ['year', 'month', 'day']