OpenDatasetBase クラス
継承用のオープン データセットの基底クラス。
開いているデータセットを構築します。
- 継承
-
OpenDatasetBase
コンストラクター
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
パラメーター
名前 | 説明 |
---|---|
cols
|
データセットから読み込む列名の一覧(既定値は None) 規定値: None
|
enable_telemetry
|
このデータセットでテレメトリを有効にするかどうか、既定値は True です 規定値: True
|
kwargs
必須
|
フィルターの args |
メソッド
get_file_dataset |
オープン データセットのファイル データセットを取得します。 |
get_tabular_dataset |
BLOB URL を使用して AbstractTabularOpenDataset を初期化します。 |
to_pandas_dataframe |
pandas データフレームへ。 |
to_spark_dataframe |
spark データフレームへ。 |
get_file_dataset
オープン データセットのファイル データセットを取得します。
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
パラメーター
名前 | 説明 |
---|---|
cls
必須
|
現在のクラス |
start_date
必須
|
開始日。既定値は None です |
end_date
必須
|
終了日。既定値は None です |
enable_telemetry
必須
|
テレメトリを有効にするかどうか。既定値は True です |
戻り値
型 | 説明 |
---|---|
ファイル データセット |
get_tabular_dataset
BLOB URL を使用して AbstractTabularOpenDataset を初期化します。
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
パラメーター
名前 | 説明 |
---|---|
cls
必須
|
オープン データセットの型名。 |
start_date
必須
|
クエリ実行の開始日 (その日付を含む)。 |
end_date
必須
|
クエリ実行の終了日 (その日付を含む)。 |
cols
必須
|
取得する列名のリスト。 None の場合、すべての列が取得されます。 |
enable_telemetry
必須
|
テレメトリを有効にするかどうか。UT の場合にのみ無効になります。 |
戻り値
型 | 説明 |
---|---|
TabularDataset |
to_pandas_dataframe
pandas データフレームへ。
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
spark データフレームへ。
to_spark_dataframe()
属性
cols
取得対象の列名のリストを取得します。
data
OpenDataset オブジェクトのデータを取得します。
id
オープン データの場所 ID を取得します。
log_properties
ログのプロパティを取得します。
registry_id
バックエンドで登録されているこのパブリック データセットのレジストリ ID を取得します。
このレジストリ ID は、保存場所などの最新のメタデータを取得するために使用されます。 すべてのパブリック データ サブクラスが _registry_id を割り当てることを想定しています。
戻り値
型 | 説明 |
---|---|
レジストリ ID 文字列。 |
time_column_name
時刻列の名前。