OpenDatasetBase Klasa
Otwórz klasę bazową zestawu danych, aby dziedziczyć.
Konstruowanie otwartych zestawów danych.
- Dziedziczenie
-
OpenDatasetBase
Konstruktor
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Parametry
Nazwa | Opis |
---|---|
cols
|
Lista nazw kolumn do załadowania z zestawu danych domyślnie to None Domyślna wartość: None
|
enable_telemetry
|
Czy włączyć telemetrię dla tego zestawu danych, domyślnie ma wartość True Domyślna wartość: True
|
kwargs
Wymagane
|
args dla filtru |
Metody
get_file_dataset |
Pobierz zestaw danych pliku dla otwartego zestawu danych. |
get_tabular_dataset |
Zainicjuj element AbstractTabularOpenDataset przy użyciu adresu URL obiektu blob. |
to_pandas_dataframe |
Do ramki danych biblioteki pandas. |
to_spark_dataframe |
Aby wyśmieć ramkę danych. |
get_file_dataset
Pobierz zestaw danych pliku dla otwartego zestawu danych.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Parametry
Nazwa | Opis |
---|---|
cls
Wymagane
|
current, klasa |
start_date
Wymagane
|
data rozpoczęcia, domyślnie wartość Brak |
end_date
Wymagane
|
data zakończenia, wartość domyślna to None |
enable_telemetry
Wymagane
|
włącz telemetrię lub nie, wartość domyślna to True |
Zwraca
Typ | Opis |
---|---|
zestaw danych plików |
get_tabular_dataset
Zainicjuj element AbstractTabularOpenDataset przy użyciu adresu URL obiektu blob.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Parametry
Nazwa | Opis |
---|---|
cls
Wymagane
|
wpisz nazwę otwartego zestawu danych. |
start_date
Wymagane
|
Data rozpoczęcia zapytania włącznie. |
end_date
Wymagane
|
Data zakończenia zapytania włącznie. |
cols
Wymagane
|
Lista nazw kolumn do pobrania. Żadna z nich nie uzyska wszystkich kolumn. |
enable_telemetry
Wymagane
|
Czy włączyć dane telemetryczne, wyłączone tylko dla ut. |
Zwraca
Typ | Opis |
---|---|
Tabelaryczny zestaw danych |
to_pandas_dataframe
Do ramki danych biblioteki pandas.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
Aby wyśmieć ramkę danych.
to_spark_dataframe()
Atrybuty
cols
Pobierz listę nazw kolumn, aby pobrać.
data
Pobierz dane obiektu OpenDataset.
id
Pobierz identyfikator lokalizacji otwartych danych.
log_properties
Pobieranie właściwości dziennika.
registry_id
Pobierz identyfikator rejestru tego publicznego zestawu danych zarejestrowanego w zapleczu.
Ten identyfikator rejestru służy do pobierania najnowszych metadanych, takich jak lokalizacja magazynu. Oczekuje się, że wszystkie publiczne klasy podrzędne danych przypiszeją _registry_id.
Zwraca
Typ | Opis |
---|---|
Ciąg identyfikatora rejestru. |
time_column_name
Nazwa kolumny czasowej.