PublicData 类

定义公开数据的基类。

公共数据类包含每个开放数据集的常见属性和方法。

使用列进行初始化。

继承
builtins.object
PublicData

构造函数

PublicData(cols: List[str] | None, enable_telemetry: bool = True)

参数

名称 说明
cols
必需

要扩充的列名称的列表。

enable_telemetry

指示是否发送遥测数据。

默认值: True
cols
必需

用户要扩充的列名称列表

enable_telemetry
必需

是否发送遥测数据

方法

get_enricher

获取扩充器。

to_pandas_dataframe

到 pandas 数据帧。

to_spark_dataframe

到 spark 数据帧。

get_enricher

获取扩充器。

get_enricher()

to_pandas_dataframe

到 pandas 数据帧。

to_pandas_dataframe()

to_spark_dataframe

到 spark 数据帧。

to_spark_dataframe()

属性

cols

获取要检索的列名列表。

env

返回运行时环境。

id

获取开放数据的位置 ID。

registry_id

获取在后端注册的此公共数据集的注册表 ID。

Azure 使用此注册表 ID 获取存储位置等最新元数据。 你应预期所有公共数据子类都分配 _registry_id。

返回

类型 说明
str

注册表 ID。

logger

logger = <Logger azureml.opendatasets (DEBUG)>

mandatory_columns

mandatory_columns = []