OpenDatasetBase Classe

Riferimento

Aprire La classe base set di dati per ereditare.

Costruire set di dati aperti.

Ereditarietà: PublicData

OpenDatasetBase

Costruttore

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parametri

Nome	Descrizione
cols	list[str] Elenco di nomi di colonne da caricare dal set di dati, impostazione predefinita none Valore predefinito: None
enable_telemetry	bool Se abilitare i dati di telemetria in questo set di dati, il valore predefinito è True Valore predefinito: True
kwargs Necessario	dict args per il filtro

Metodi

get_file_dataset	Ottenere il set di dati di file per aprire il set di dati.
get_tabular_dataset	Inizializzare AbstractTabularOpenDataset con URL BLOB.
to_pandas_dataframe	Per pandas dataframe.
to_spark_dataframe	Per spark dataframe.

get_file_dataset

Ottenere il set di dati di file per aprire il set di dati.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parametri

Nome	Descrizione
cls Necessario	type classe corrente
start_date Necessario	datetime data di inizio, impostazione predefinita none
end_date Necessario	datetime data di fine, impostazione predefinita none
enable_telemetry Necessario	bool abilitare i dati di telemetria o meno, impostazione predefinita su True

Restituisce

Tipo	Descrizione
FileDataset	set di dati file

get_tabular_dataset

Inizializzare AbstractTabularOpenDataset con URL BLOB.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parametri

Nome	Descrizione
cls Necessario	type nome del tipo del set di dati Open.
start_date Necessario	datetime Data di inizio per eseguire query in modo inclusivo.
end_date Necessario	datetime Data di fine per eseguire query in modo inclusivo.
cols Necessario	list[str] Elenco di nomi di colonna da recuperare. Nessuno otterrà tutte le colonne.
enable_telemetry Necessario	bool Se abilitare i dati di telemetria, disabilitati solo per l'UT.

Restituisce

Tipo	Descrizione
TabularDataset	TabularDataset

to_pandas_dataframe

Per pandas dataframe.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Per spark dataframe.

to_spark_dataframe()

Attributi

cols

Ottenere l'elenco dei nomi di colonna da recuperare.

data

Ottenere i dati dell'oggetto OpenDataset.

id

Ottenere l'ID percorso dei dati aperti.

log_properties

Ottenere le proprietà del log.

registry_id

Ottenere l'ID del Registro di sistema di questo set di dati pubblico registrato nel back-end.

Questo ID del Registro di sistema viene usato per ottenere i metadati più recenti, ad esempio il percorso di archiviazione. Si prevede che tutte le sottoclassi di dati pubbliche vengano assegnate _registry_id.

Restituisce

Tipo	Descrizione
str	Stringa ID registro.

time_column_name

Nome colonna temporale.

Condividi tramite

OpenDatasetBase Classe

Costruttore

Parametri

Metodi

get_file_dataset

Parametri

Restituisce

get_tabular_dataset

Parametri

Restituisce

to_pandas_dataframe

to_spark_dataframe

Attributi

cols

data

id

log_properties

registry_id

Restituisce

time_column_name

Commenti e suggerimenti

Risorse aggiuntive