PublicData 类
定义公开数据的基类。
公共数据类包含每个开放数据集的常见属性和方法。
使用列进行初始化。
- 继承
-
builtins.objectPublicData
构造函数
PublicData(cols: List[str] | None, enable_telemetry: bool = True)
参数
名称 | 说明 |
---|---|
cols
必需
|
要扩充的列名称的列表。 |
enable_telemetry
|
指示是否发送遥测数据。 默认值: True
|
cols
必需
|
用户要扩充的列名称列表 |
enable_telemetry
必需
|
是否发送遥测数据 |
方法
get_enricher |
获取扩充器。 |
to_pandas_dataframe |
到 pandas 数据帧。 |
to_spark_dataframe |
到 spark 数据帧。 |
get_enricher
获取扩充器。
get_enricher()
to_pandas_dataframe
到 pandas 数据帧。
to_pandas_dataframe()
to_spark_dataframe
到 spark 数据帧。
to_spark_dataframe()
属性
cols
获取要检索的列名列表。
env
返回运行时环境。
id
获取开放数据的位置 ID。
registry_id
获取在后端注册的此公共数据集的注册表 ID。
Azure 使用此注册表 ID 获取存储位置等最新元数据。 你应预期所有公共数据子类都分配 _registry_id。
返回
类型 | 说明 |
---|---|
注册表 ID。 |
logger
logger = <Logger azureml.opendatasets (DEBUG)>
mandatory_columns
mandatory_columns = []