Sdílet prostřednictvím


OpenDatasetBase Třída

Otevřete základní třídu Dataset pro dědění.

Vytváření otevřených datových sad

Dědičnost
OpenDatasetBase

Konstruktor

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parametry

Name Description
cols

Seznam názvů sloupců, které se mají načíst z datové sady, výchozí hodnota je None (Žádný).

Default value: None
enable_telemetry

Jestli se má povolit telemetrie pro tuto datovou sadu, výchozí hodnota je True

Default value: True
kwargs
Vyžadováno

argumenty pro filtr

Metody

get_file_dataset

Získejte datovou sadu souboru pro otevřenou datovou sadu.

get_tabular_dataset

Inicializace AbstractTabularOpenDataset s adresou URL objektu blob.

to_pandas_dataframe

Do datového rámce pandas.

to_spark_dataframe

Do datového rámce Sparku.

get_file_dataset

Získejte datovou sadu souboru pro otevřenou datovou sadu.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parametry

Name Description
cls
Vyžadováno

current – třída

start_date
Vyžadováno

počáteční datum, výchozí hodnota je Žádná

end_date
Vyžadováno

koncové datum, výchozí hodnota je None (Žádné).

enable_telemetry
Vyžadováno

povolit telemetrii nebo ne, výchozí hodnota je True

Návraty

Typ Description

souborová datová sada

get_tabular_dataset

Inicializace AbstractTabularOpenDataset s adresou URL objektu blob.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parametry

Name Description
cls
Vyžadováno

zadejte název open dataset.

start_date
Vyžadováno

Počáteční datum pro inkluzivní dotaz.

end_date
Vyžadováno

Koncové datum, které se má dotazovat včetně.

cols
Vyžadováno

Seznam názvů sloupců, které se mají načíst. Možnost Žádná nebude mít všechny sloupce.

enable_telemetry
Vyžadováno

Jestli se má povolit telemetrie, zakázaná jenom pro UT.

Návraty

Typ Description

Tabulková datová sada

to_pandas_dataframe

Do datového rámce pandas.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Do datového rámce Sparku.

to_spark_dataframe()

Atributy

cols

Načte seznam názvů sloupců, který chcete načíst.

data

Získejte data objektu OpenDataset.

id

Získejte ID umístění otevřených dat.

log_properties

Získejte vlastnosti protokolu.

registry_id

Získejte ID registru této veřejné datové sady zaregistrované na back-endu.

Toto ID registru slouží k získání nejnovějších metadat, jako je umístění úložiště. Očekávejte, že _registry_id přiřadí všechny veřejné datové podt třídy.

Návraty

Typ Description
str

Řetězec ID registru.

time_column_name

Název sloupce času.