Condividi tramite


OpenDatasetBase Classe

Aprire La classe base set di dati per ereditare.

Costruire set di dati aperti.

Ereditarietà
OpenDatasetBase

Costruttore

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parametri

Nome Descrizione
cols

Elenco di nomi di colonne da caricare dal set di dati, impostazione predefinita none

Valore predefinito: None
enable_telemetry

Se abilitare i dati di telemetria in questo set di dati, il valore predefinito è True

Valore predefinito: True
kwargs
Necessario

args per il filtro

Metodi

get_file_dataset

Ottenere il set di dati di file per aprire il set di dati.

get_tabular_dataset

Inizializzare AbstractTabularOpenDataset con URL BLOB.

to_pandas_dataframe

Per pandas dataframe.

to_spark_dataframe

Per spark dataframe.

get_file_dataset

Ottenere il set di dati di file per aprire il set di dati.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parametri

Nome Descrizione
cls
Necessario

classe corrente

start_date
Necessario

data di inizio, impostazione predefinita none

end_date
Necessario

data di fine, impostazione predefinita none

enable_telemetry
Necessario

abilitare i dati di telemetria o meno, impostazione predefinita su True

Restituisce

Tipo Descrizione

set di dati file

get_tabular_dataset

Inizializzare AbstractTabularOpenDataset con URL BLOB.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parametri

Nome Descrizione
cls
Necessario

nome del tipo del set di dati Open.

start_date
Necessario

Data di inizio per eseguire query in modo inclusivo.

end_date
Necessario

Data di fine per eseguire query in modo inclusivo.

cols
Necessario

Elenco di nomi di colonna da recuperare. Nessuno otterrà tutte le colonne.

enable_telemetry
Necessario

Se abilitare i dati di telemetria, disabilitati solo per l'UT.

Restituisce

Tipo Descrizione

TabularDataset

to_pandas_dataframe

Per pandas dataframe.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Per spark dataframe.

to_spark_dataframe()

Attributi

cols

Ottenere l'elenco dei nomi di colonna da recuperare.

data

Ottenere i dati dell'oggetto OpenDataset.

id

Ottenere l'ID percorso dei dati aperti.

log_properties

Ottenere le proprietà del log.

registry_id

Ottenere l'ID del Registro di sistema di questo set di dati pubblico registrato nel back-end.

Questo ID del Registro di sistema viene usato per ottenere i metadati più recenti, ad esempio il percorso di archiviazione. Si prevede che tutte le sottoclassi di dati pubbliche vengano assegnate _registry_id.

Restituisce

Tipo Descrizione
str

Stringa ID registro.

time_column_name

Nome colonna temporale.