OpenDatasetBase Třída
Otevřete základní třídu Dataset pro dědění.
Vytváření otevřených datových sad
- Dědičnost
-
OpenDatasetBase
Konstruktor
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Parametry
Name | Description |
---|---|
cols
|
Seznam názvů sloupců, které se mají načíst z datové sady, výchozí hodnota je None (Žádný). Default value: None
|
enable_telemetry
|
Jestli se má povolit telemetrie pro tuto datovou sadu, výchozí hodnota je True Default value: True
|
kwargs
Vyžadováno
|
argumenty pro filtr |
Metody
get_file_dataset |
Získejte datovou sadu souboru pro otevřenou datovou sadu. |
get_tabular_dataset |
Inicializace AbstractTabularOpenDataset s adresou URL objektu blob. |
to_pandas_dataframe |
Do datového rámce pandas. |
to_spark_dataframe |
Do datového rámce Sparku. |
get_file_dataset
Získejte datovou sadu souboru pro otevřenou datovou sadu.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Parametry
Name | Description |
---|---|
cls
Vyžadováno
|
current – třída |
start_date
Vyžadováno
|
počáteční datum, výchozí hodnota je Žádná |
end_date
Vyžadováno
|
koncové datum, výchozí hodnota je None (Žádné). |
enable_telemetry
Vyžadováno
|
povolit telemetrii nebo ne, výchozí hodnota je True |
Návraty
Typ | Description |
---|---|
souborová datová sada |
get_tabular_dataset
Inicializace AbstractTabularOpenDataset s adresou URL objektu blob.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Parametry
Name | Description |
---|---|
cls
Vyžadováno
|
zadejte název open dataset. |
start_date
Vyžadováno
|
Počáteční datum pro inkluzivní dotaz. |
end_date
Vyžadováno
|
Koncové datum, které se má dotazovat včetně. |
cols
Vyžadováno
|
Seznam názvů sloupců, které se mají načíst. Možnost Žádná nebude mít všechny sloupce. |
enable_telemetry
Vyžadováno
|
Jestli se má povolit telemetrie, zakázaná jenom pro UT. |
Návraty
Typ | Description |
---|---|
Tabulková datová sada |
to_pandas_dataframe
Do datového rámce pandas.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
Do datového rámce Sparku.
to_spark_dataframe()
Atributy
cols
Načte seznam názvů sloupců, který chcete načíst.
data
Získejte data objektu OpenDataset.
id
Získejte ID umístění otevřených dat.
log_properties
Získejte vlastnosti protokolu.
registry_id
Získejte ID registru této veřejné datové sady zaregistrované na back-endu.
Toto ID registru slouží k získání nejnovějších metadat, jako je umístění úložiště. Očekávejte, že _registry_id přiřadí všechny veřejné datové podt třídy.
Návraty
Typ | Description |
---|---|
Řetězec ID registru. |
time_column_name
Název sloupce času.