Delen via


OpenDatasetBase Klas

Open De basisklasse van de gegevensset voor overnemen.

Open gegevenssets maken.

Overname
OpenDatasetBase

Constructor

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parameters

Name Description
cols

Een lijst met kolomnamen die uit de gegevensset moeten worden geladen, wordt standaard ingesteld op Geen

Default value: None
enable_telemetry

Of telemetrie voor deze gegevensset moet worden ingeschakeld, wordt standaard ingesteld op True

Default value: True
kwargs
Vereist

argumenten voor filter

Methoden

get_file_dataset

Haal de bestandsgegevensset op voor het openen van de gegevensset.

get_tabular_dataset

Initialiseer AbstractTabularOpenDataset met blob-URL.

to_pandas_dataframe

Naar pandas dataframe.

to_spark_dataframe

Om een dataframe te maken.

get_file_dataset

Haal de bestandsgegevensset op voor het openen van de gegevensset.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parameters

Name Description
cls
Vereist

huidige klasse

start_date
Vereist

begindatum, standaard ingesteld op Geen

end_date
Vereist

einddatum, standaard ingesteld op Geen

enable_telemetry
Vereist

telemetrie inschakelen of niet, standaard ingesteld op True

Retouren

Type Description

bestandsgegevensset

get_tabular_dataset

Initialiseer AbstractTabularOpenDataset met blob-URL.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parameters

Name Description
cls
Vereist

typt u de naam van de open gegevensset.

start_date
Vereist

De begindatum waarop een query moet worden uitgevoerd.

end_date
Vereist

De einddatum waarop een query moet worden uitgevoerd.

cols
Vereist

Een lijst met kolomnamen die moeten worden opgehaald. Geen krijgt alle kolommen.

enable_telemetry
Vereist

Of telemetrie moet worden ingeschakeld, alleen uitgeschakeld voor UT.

Retouren

Type Description

TabularDataset

to_pandas_dataframe

Naar pandas dataframe.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Om een dataframe te maken.

to_spark_dataframe()

Kenmerken

cols

Haal de lijst met kolomnamen op om op te halen.

data

Haal de gegevens van het OpenDataset-object op.

id

Haal de locatie-id van de geopende gegevens op.

log_properties

Logboekeigenschappen ophalen.

registry_id

Haal de register-id op van deze openbare gegevensset die is geregistreerd op de back-end.

Deze register-id wordt gebruikt om de meest recente metagegevens op te halen, zoals opslaglocatie. Verwacht dat alle subklassen van openbare gegevens _registry_id toewijzen.

Retouren

Type Description
str

Register-id-tekenreeks.

time_column_name

Tijdkolomnaam.