Udostępnij za pośrednictwem


OpenDatasetBase Klasa

Otwórz klasę bazową zestawu danych, aby dziedziczyć.

Konstruowanie otwartych zestawów danych.

Dziedziczenie
OpenDatasetBase

Konstruktor

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parametry

Nazwa Opis
cols

Lista nazw kolumn do załadowania z zestawu danych domyślnie to None

Domyślna wartość: None
enable_telemetry

Czy włączyć telemetrię dla tego zestawu danych, domyślnie ma wartość True

Domyślna wartość: True
kwargs
Wymagane

args dla filtru

Metody

get_file_dataset

Pobierz zestaw danych pliku dla otwartego zestawu danych.

get_tabular_dataset

Zainicjuj element AbstractTabularOpenDataset przy użyciu adresu URL obiektu blob.

to_pandas_dataframe

Do ramki danych biblioteki pandas.

to_spark_dataframe

Aby wyśmieć ramkę danych.

get_file_dataset

Pobierz zestaw danych pliku dla otwartego zestawu danych.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parametry

Nazwa Opis
cls
Wymagane

current, klasa

start_date
Wymagane

data rozpoczęcia, domyślnie wartość Brak

end_date
Wymagane

data zakończenia, wartość domyślna to None

enable_telemetry
Wymagane

włącz telemetrię lub nie, wartość domyślna to True

Zwraca

Typ Opis

zestaw danych plików

get_tabular_dataset

Zainicjuj element AbstractTabularOpenDataset przy użyciu adresu URL obiektu blob.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parametry

Nazwa Opis
cls
Wymagane

wpisz nazwę otwartego zestawu danych.

start_date
Wymagane

Data rozpoczęcia zapytania włącznie.

end_date
Wymagane

Data zakończenia zapytania włącznie.

cols
Wymagane

Lista nazw kolumn do pobrania. Żadna z nich nie uzyska wszystkich kolumn.

enable_telemetry
Wymagane

Czy włączyć dane telemetryczne, wyłączone tylko dla ut.

Zwraca

Typ Opis

Tabelaryczny zestaw danych

to_pandas_dataframe

Do ramki danych biblioteki pandas.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Aby wyśmieć ramkę danych.

to_spark_dataframe()

Atrybuty

cols

Pobierz listę nazw kolumn, aby pobrać.

data

Pobierz dane obiektu OpenDataset.

id

Pobierz identyfikator lokalizacji otwartych danych.

log_properties

Pobieranie właściwości dziennika.

registry_id

Pobierz identyfikator rejestru tego publicznego zestawu danych zarejestrowanego w zapleczu.

Ten identyfikator rejestru służy do pobierania najnowszych metadanych, takich jak lokalizacja magazynu. Oczekuje się, że wszystkie publiczne klasy podrzędne danych przypiszeją _registry_id.

Zwraca

Typ Opis
str

Ciąg identyfikatora rejestru.

time_column_name

Nazwa kolumny czasowej.