dataset_partition_prep 模組
包含指定資料集分割準備的功能。
當您使用 opendatasets 需要資料分割的類別,例如 NycTlcGreen 類別時,就會自動進行資料分割準備。
函式
prep_partition_datetime
準備分割區路徑 'year=\d+/month=\d+/'。
prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])
參數
名稱 | Description |
---|---|
dflow
必要
|
<xref:azureml.dataprep.Dataflow>
dataprep 的實例。資料流程。 |
start_date
必要
|
資料集的開始日期時間。 |
end_date
必要
|
資料集的結束日期時間。 |
pattern
必要
|
日期時間模式。 |
prep_partition_puYear_puMonth
準備分割區路徑 'year=\d+/month=\d+/'。
prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])
參數
名稱 | Description |
---|---|
dflow
必要
|
<xref:azureml.dataprep.Dataflow>
dataprep 的實例。資料流程。 |
start_date
必要
|
資料集的開始日期時間。 |
end_date
必要
|
資料集的結束日期時間。 |
pattern
必要
|
日期時間模式。 |
僅限關鍵字的參數
名稱 | Description |
---|---|
pattern
|
預設值: ['puYear', 'puMonth']
|
prep_partition_year
準備分割區路徑 'year=\d+/month=\d+/'。
prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])
參數
名稱 | Description |
---|---|
dflow
必要
|
<xref:azureml.dataprep.Dataflow>
dataprep 的實例。資料流程。 |
start_date
必要
|
資料集的開始日期時間。 |
end_date
必要
|
資料集的結束日期時間。 |
pattern
必要
|
日期時間模式。 |
僅限關鍵字的參數
名稱 | Description |
---|---|
pattern
|
預設值: ['year']
|
prep_partition_year_month
準備分割區路徑 'year=\d+/month=\d+/'。
prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])
參數
名稱 | Description |
---|---|
dflow
必要
|
<xref:azureml.dataprep.Dataflow>
dataprep 的實例。資料流程。 |
start_date
必要
|
資料集的開始日期時間。 |
end_date
必要
|
資料集的結束日期時間。 |
pattern
必要
|
日期時間模式。 |
僅限關鍵字的參數
名稱 | Description |
---|---|
pattern
|
預設值: ['year', 'month']
|
prep_partition_year_month_day
準備分割區路徑 'year=\d+/month=\d+/'。
prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])
參數
名稱 | Description |
---|---|
dflow
必要
|
<xref:azureml.dataprep.Dataflow>
dataprep 的實例。資料流程。 |
start_date
必要
|
資料集的開始日期時間。 |
end_date
必要
|
資料集的結束日期時間。 |
pattern
必要
|
日期時間模式。 |
僅限關鍵字的參數
名稱 | Description |
---|---|
pattern
|
預設值: ['year', 'month', 'day']
|