dataset_partition_prep Module

Contient les fonctionnalités permettant de spécifier la préparation du partitionnement du jeu de données.

La préparation du partitionnement s’effectue automatiquement, quand vous utilisez une classe opendatasets qui nécessite un partitionnement de données, par exemple la classe NycTlcGreen.

Functions

prep_partition_datetime

Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».

prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])

Paramètres

Nom Description
dflow
Obligatoire
<xref:azureml.dataprep.Dataflow>

Instance de dataprep.Dataflow.

start_date
Obligatoire

Date/heure de début du jeu de données.

end_date
Obligatoire

Date/heure de fin du jeu de données.

pattern
Obligatoire

Modèle DateHeure.

prep_partition_puYear_puMonth

Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».

prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

Paramètres

Nom Description
dflow
Obligatoire
<xref:azureml.dataprep.Dataflow>

Instance de dataprep.Dataflow.

start_date
Obligatoire

Date/heure de début du jeu de données.

end_date
Obligatoire

Date/heure de fin du jeu de données.

pattern
Obligatoire

Modèle DateHeure.

Paramètres de mot clé uniquement

Nom Description
pattern
Valeur par défaut: ['puYear', 'puMonth']

prep_partition_year

Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».

prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])

Paramètres

Nom Description
dflow
Obligatoire
<xref:azureml.dataprep.Dataflow>

Instance de dataprep.Dataflow.

start_date
Obligatoire

Date/heure de début du jeu de données.

end_date
Obligatoire

Date/heure de fin du jeu de données.

pattern
Obligatoire

Modèle DateHeure.

Paramètres de mot clé uniquement

Nom Description
pattern
Valeur par défaut: ['year']

prep_partition_year_month

Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».

prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])

Paramètres

Nom Description
dflow
Obligatoire
<xref:azureml.dataprep.Dataflow>

Instance de dataprep.Dataflow.

start_date
Obligatoire

Date/heure de début du jeu de données.

end_date
Obligatoire

Date/heure de fin du jeu de données.

pattern
Obligatoire

Modèle DateHeure.

Paramètres de mot clé uniquement

Nom Description
pattern
Valeur par défaut: ['year', 'month']

prep_partition_year_month_day

Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».

prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])

Paramètres

Nom Description
dflow
Obligatoire
<xref:azureml.dataprep.Dataflow>

Instance de dataprep.Dataflow.

start_date
Obligatoire

Date/heure de début du jeu de données.

end_date
Obligatoire

Date/heure de fin du jeu de données.

pattern
Obligatoire

Modèle DateHeure.

Paramètres de mot clé uniquement

Nom Description
pattern
Valeur par défaut: ['year', 'month', 'day']