PandasDataLoadLimitToDay 类

定义到最后一天的 pandas 数据加载限制。

可以使用 PandasDataLoadLimitToDay 来控制要加载的 parquet 天数。

将 pandas 数据负载限制初始化为最后一天。

继承
PandasDataLoadLimitToDay

构造函数

PandasDataLoadLimitToDay(start_date, end_date, path_pattern='/year=%d/month=%d/day=%d/', limit=-1)

参数

名称 说明
start_date
必需

要查询的开始日期(含)。

end_date
必需

要查询的结束日期(含)。

path_pattern
str

Blob 路径模式。

默认值: /year=%d/month=%d/day=%d/
limit
int

可返回的最大路径数的限制。

默认值: -1

方法

get_target_blob_paths

获取目标 Blob 路径(根据其自己的筛选器)。

get_target_blob_paths

获取目标 Blob 路径(根据其自己的筛选器)。

get_target_blob_paths(blob_service: BlobServiceClient, blob_container_name: str, blob_relative_path: str)

参数

名称 说明
blob_service
必需

块 Blob 服务。

blob_container_name
必需
str

Blob 容器名称。

blob_relative_path
必需
str

Blob 相对路径。

返回

类型 说明

筛选器范围内的目标 Blob 路径的列表。