dataaccess 包

包含提供 Blob 文件访问方法的功能。

使用 opendatasets 包中的类(如 ChicagoSafety 类)时,此包中的 dataaccess 类和函数在内部使用。 一般情况下,无需直接使用 dataaccess 包中的功能。

模块

base_blob_info

包含 Blob 信息基类。

blob_parquet_descriptor

包含 Blob Parquet 的描述符。

dataset_partition_prep

包含用于指定数据集分区准备工作的功能。

在你使用某个需要数据分区的 opendatasets 类(如 NycTlcGreen 类)时,分区准备会自动进行。

pandas_data_load_limit

包含在 parquet 文件较大时用于控制 pandas 数据加载限制方式的功能。

借助此模块的功能,可以指定在 parquet 文件因太大而无法加载时如何限制 pandas 数据的加载。