dataset_partition_prep Module
Contient les fonctionnalités permettant de spécifier la préparation du partitionnement du jeu de données.
La préparation du partitionnement s’effectue automatiquement, quand vous utilisez une classe opendatasets qui nécessite un partitionnement de données, par exemple la classe NycTlcGreen.
Functions
prep_partition_datetime
Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».
prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])
Paramètres
Nom | Description |
---|---|
dflow
Obligatoire
|
<xref:azureml.dataprep.Dataflow>
Instance de dataprep.Dataflow. |
start_date
Obligatoire
|
Date/heure de début du jeu de données. |
end_date
Obligatoire
|
Date/heure de fin du jeu de données. |
pattern
Obligatoire
|
Modèle DateHeure. |
prep_partition_puYear_puMonth
Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».
prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])
Paramètres
Nom | Description |
---|---|
dflow
Obligatoire
|
<xref:azureml.dataprep.Dataflow>
Instance de dataprep.Dataflow. |
start_date
Obligatoire
|
Date/heure de début du jeu de données. |
end_date
Obligatoire
|
Date/heure de fin du jeu de données. |
pattern
Obligatoire
|
Modèle DateHeure. |
Paramètres de mot clé uniquement
Nom | Description |
---|---|
pattern
|
Valeur par défaut: ['puYear', 'puMonth']
|
prep_partition_year
Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».
prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])
Paramètres
Nom | Description |
---|---|
dflow
Obligatoire
|
<xref:azureml.dataprep.Dataflow>
Instance de dataprep.Dataflow. |
start_date
Obligatoire
|
Date/heure de début du jeu de données. |
end_date
Obligatoire
|
Date/heure de fin du jeu de données. |
pattern
Obligatoire
|
Modèle DateHeure. |
Paramètres de mot clé uniquement
Nom | Description |
---|---|
pattern
|
Valeur par défaut: ['year']
|
prep_partition_year_month
Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».
prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])
Paramètres
Nom | Description |
---|---|
dflow
Obligatoire
|
<xref:azureml.dataprep.Dataflow>
Instance de dataprep.Dataflow. |
start_date
Obligatoire
|
Date/heure de début du jeu de données. |
end_date
Obligatoire
|
Date/heure de fin du jeu de données. |
pattern
Obligatoire
|
Modèle DateHeure. |
Paramètres de mot clé uniquement
Nom | Description |
---|---|
pattern
|
Valeur par défaut: ['year', 'month']
|
prep_partition_year_month_day
Permet de préparer le chemin de partition « year=\d+/month=\d+/ ».
prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])
Paramètres
Nom | Description |
---|---|
dflow
Obligatoire
|
<xref:azureml.dataprep.Dataflow>
Instance de dataprep.Dataflow. |
start_date
Obligatoire
|
Date/heure de début du jeu de données. |
end_date
Obligatoire
|
Date/heure de fin du jeu de données. |
pattern
Obligatoire
|
Modèle DateHeure. |
Paramètres de mot clé uniquement
Nom | Description |
---|---|
pattern
|
Valeur par défaut: ['year', 'month', 'day']
|