dataset_partition_prep Módulo

Contém a funcionalidade para especificar a preparação da partição do conjuntos de dados.

A preparação da partição ocorre automaticamente quando você usa uma classe opendatasets que requer uma partição de dados, como a classe NycTlcGreen.

Funções

prep_partition_datetime

Preparar o caminho da partição 'year=\d+/month=\d+/'.

prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])

Parâmetros

Nome Description
dflow
Obrigatório
<xref:azureml.dataprep.Dataflow>

Uma instância de dataprep.Dataflow.

start_date
Obrigatório

O datetime de início do conjunto de dados.

end_date
Obrigatório

O datetime de término do conjunto de dados.

pattern
Obrigatório

O padrão do datetime.

prep_partition_puYear_puMonth

Preparar o caminho da partição 'year=\d+/month=\d+/'.

prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

Parâmetros

Nome Description
dflow
Obrigatório
<xref:azureml.dataprep.Dataflow>

Uma instância de dataprep.Dataflow.

start_date
Obrigatório

O datetime de início do conjunto de dados.

end_date
Obrigatório

O datetime de término do conjunto de dados.

pattern
Obrigatório

O padrão do datetime.

Parâmetros somente de palavra-chave

Nome Description
pattern
Valor padrão: ['puYear', 'puMonth']

prep_partition_year

Preparar o caminho da partição 'year=\d+/month=\d+/'.

prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])

Parâmetros

Nome Description
dflow
Obrigatório
<xref:azureml.dataprep.Dataflow>

Uma instância de dataprep.Dataflow.

start_date
Obrigatório

O datetime de início do conjunto de dados.

end_date
Obrigatório

O datetime de término do conjunto de dados.

pattern
Obrigatório

O padrão do datetime.

Parâmetros somente de palavra-chave

Nome Description
pattern
Valor padrão: ['year']

prep_partition_year_month

Preparar o caminho da partição 'year=\d+/month=\d+/'.

prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])

Parâmetros

Nome Description
dflow
Obrigatório
<xref:azureml.dataprep.Dataflow>

Uma instância de dataprep.Dataflow.

start_date
Obrigatório

O datetime de início do conjunto de dados.

end_date
Obrigatório

O datetime de término do conjunto de dados.

pattern
Obrigatório

O padrão do datetime.

Parâmetros somente de palavra-chave

Nome Description
pattern
Valor padrão: ['year', 'month']

prep_partition_year_month_day

Preparar o caminho da partição 'year=\d+/month=\d+/'.

prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])

Parâmetros

Nome Description
dflow
Obrigatório
<xref:azureml.dataprep.Dataflow>

Uma instância de dataprep.Dataflow.

start_date
Obrigatório

O datetime de início do conjunto de dados.

end_date
Obrigatório

O datetime de término do conjunto de dados.

pattern
Obrigatório

O padrão do datetime.

Parâmetros somente de palavra-chave

Nome Description
pattern
Valor padrão: ['year', 'month', 'day']