OpenDatasetBase Classe
Aprire La classe base set di dati per ereditare.
Costruire set di dati aperti.
- Ereditarietà
-
OpenDatasetBase
Costruttore
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Parametri
Nome | Descrizione |
---|---|
cols
|
Elenco di nomi di colonne da caricare dal set di dati, impostazione predefinita none Valore predefinito: None
|
enable_telemetry
|
Se abilitare i dati di telemetria in questo set di dati, il valore predefinito è True Valore predefinito: True
|
kwargs
Necessario
|
args per il filtro |
Metodi
get_file_dataset |
Ottenere il set di dati di file per aprire il set di dati. |
get_tabular_dataset |
Inizializzare AbstractTabularOpenDataset con URL BLOB. |
to_pandas_dataframe |
Per pandas dataframe. |
to_spark_dataframe |
Per spark dataframe. |
get_file_dataset
Ottenere il set di dati di file per aprire il set di dati.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Parametri
Nome | Descrizione |
---|---|
cls
Necessario
|
classe corrente |
start_date
Necessario
|
data di inizio, impostazione predefinita none |
end_date
Necessario
|
data di fine, impostazione predefinita none |
enable_telemetry
Necessario
|
abilitare i dati di telemetria o meno, impostazione predefinita su True |
Restituisce
Tipo | Descrizione |
---|---|
set di dati file |
get_tabular_dataset
Inizializzare AbstractTabularOpenDataset con URL BLOB.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Parametri
Nome | Descrizione |
---|---|
cls
Necessario
|
nome del tipo del set di dati Open. |
start_date
Necessario
|
Data di inizio per eseguire query in modo inclusivo. |
end_date
Necessario
|
Data di fine per eseguire query in modo inclusivo. |
cols
Necessario
|
Elenco di nomi di colonna da recuperare. Nessuno otterrà tutte le colonne. |
enable_telemetry
Necessario
|
Se abilitare i dati di telemetria, disabilitati solo per l'UT. |
Restituisce
Tipo | Descrizione |
---|---|
TabularDataset |
to_pandas_dataframe
Per pandas dataframe.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
Per spark dataframe.
to_spark_dataframe()
Attributi
cols
Ottenere l'elenco dei nomi di colonna da recuperare.
data
Ottenere i dati dell'oggetto OpenDataset.
id
Ottenere l'ID percorso dei dati aperti.
log_properties
Ottenere le proprietà del log.
registry_id
Ottenere l'ID del Registro di sistema di questo set di dati pubblico registrato nel back-end.
Questo ID del Registro di sistema viene usato per ottenere i metadati più recenti, ad esempio il percorso di archiviazione. Si prevede che tutte le sottoclassi di dati pubbliche vengano assegnate _registry_id.
Restituisce
Tipo | Descrizione |
---|---|
Stringa ID registro. |
time_column_name
Nome colonna temporale.