OpenDatasetBase Класс
Базовый класс открытого набора данных для наследования.
Создание открытых наборов данных.
- Наследование
-
OpenDatasetBase
Конструктор
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Параметры
Имя | Описание |
---|---|
cols
|
Список имен столбцов для загрузки из набора данных, по умолчанию — Нет. Default value: None
|
enable_telemetry
|
Указывает, следует ли включить телеметрию для этого набора данных, по умолчанию используется значение True. Default value: True
|
kwargs
Обязательно
|
аргументы для фильтра |
Методы
get_file_dataset |
Возвращает файловый набор данных для открытого набора данных. |
get_tabular_dataset |
Инициализация AbstractTabularOpenDataset с помощью URL-адреса BLOB-объекта. |
to_pandas_dataframe |
К кадру данных Pandas. |
to_spark_dataframe |
К кадру данных Spark. |
get_file_dataset
Возвращает файловый набор данных для открытого набора данных.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Параметры
Имя | Описание |
---|---|
cls
Обязательно
|
текущий класс |
start_date
Обязательно
|
дата начала, значение по умолчанию — None |
end_date
Обязательно
|
дата окончания, значение по умолчанию — None |
enable_telemetry
Обязательно
|
включение телеметрии, значение по умолчанию — True |
Возвращаемое значение
Тип | Описание |
---|---|
файловый набор данных |
get_tabular_dataset
Инициализация AbstractTabularOpenDataset с помощью URL-адреса BLOB-объекта.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Параметры
Имя | Описание |
---|---|
cls
Обязательно
|
имя типа открытого набора данных. |
start_date
Обязательно
|
Дата начала для запроса включительно. |
end_date
Обязательно
|
Дата окончания для запроса включительно. |
cols
Обязательно
|
Список имен столбцов для извлечения. По всем столбцам вернется значение None. |
enable_telemetry
Обязательно
|
Следует ли включить телеметрию, отключить только для UT. |
Возвращаемое значение
Тип | Описание |
---|---|
Табличный набор данных |
to_pandas_dataframe
К кадру данных Pandas.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
К кадру данных Spark.
to_spark_dataframe()
Атрибуты
cols
Возвращает список имен столбцов для извлечения.
data
Возвращает данные объекта OpenDataset.
id
Возвращает идентификатор расположения открытых данных.
log_properties
Возвращает свойства журнала.
registry_id
Получение идентификатора реестра этого общедоступного набора данных, зарегистрированного в серверной части.
Этот идентификатор реестра используется для получения последних метаданных, таких как место хранения. Однако, всем подклассам общедоступных данных должен быть назначен _registry_id.
Возвращаемое значение
Тип | Описание |
---|---|
Строка идентификатора реестра. |
time_column_name
Имя столбца времени.