OpenDatasetBase Klas
Open De basisklasse van de gegevensset voor overnemen.
Open gegevenssets maken.
- Overname
-
OpenDatasetBase
Constructor
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Parameters
Name | Description |
---|---|
cols
|
Een lijst met kolomnamen die uit de gegevensset moeten worden geladen, wordt standaard ingesteld op Geen Default value: None
|
enable_telemetry
|
Of telemetrie voor deze gegevensset moet worden ingeschakeld, wordt standaard ingesteld op True Default value: True
|
kwargs
Vereist
|
argumenten voor filter |
Methoden
get_file_dataset |
Haal de bestandsgegevensset op voor het openen van de gegevensset. |
get_tabular_dataset |
Initialiseer AbstractTabularOpenDataset met blob-URL. |
to_pandas_dataframe |
Naar pandas dataframe. |
to_spark_dataframe |
Om een dataframe te maken. |
get_file_dataset
Haal de bestandsgegevensset op voor het openen van de gegevensset.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Parameters
Name | Description |
---|---|
cls
Vereist
|
huidige klasse |
start_date
Vereist
|
begindatum, standaard ingesteld op Geen |
end_date
Vereist
|
einddatum, standaard ingesteld op Geen |
enable_telemetry
Vereist
|
telemetrie inschakelen of niet, standaard ingesteld op True |
Retouren
Type | Description |
---|---|
bestandsgegevensset |
get_tabular_dataset
Initialiseer AbstractTabularOpenDataset met blob-URL.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Parameters
Name | Description |
---|---|
cls
Vereist
|
typt u de naam van de open gegevensset. |
start_date
Vereist
|
De begindatum waarop een query moet worden uitgevoerd. |
end_date
Vereist
|
De einddatum waarop een query moet worden uitgevoerd. |
cols
Vereist
|
Een lijst met kolomnamen die moeten worden opgehaald. Geen krijgt alle kolommen. |
enable_telemetry
Vereist
|
Of telemetrie moet worden ingeschakeld, alleen uitgeschakeld voor UT. |
Retouren
Type | Description |
---|---|
TabularDataset |
to_pandas_dataframe
Naar pandas dataframe.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
Om een dataframe te maken.
to_spark_dataframe()
Kenmerken
cols
Haal de lijst met kolomnamen op om op te halen.
data
Haal de gegevens van het OpenDataset-object op.
id
Haal de locatie-id van de geopende gegevens op.
log_properties
Logboekeigenschappen ophalen.
registry_id
Haal de register-id op van deze openbare gegevensset die is geregistreerd op de back-end.
Deze register-id wordt gebruikt om de meest recente metagegevens op te halen, zoals opslaglocatie. Verwacht dat alle subklassen van openbare gegevens _registry_id toewijzen.
Retouren
Type | Description |
---|---|
Register-id-tekenreeks. |
time_column_name
Tijdkolomnaam.