PublicHolidays クラス
祝日のパブリック データセットを表します。
このデータセットには、PyPI holidays パッケージと Wikipedia をソースとする世界の祝日データが含まれており、1970 年から 2099 年まで、38 の国または地域を対象としています。 各行は、特定の日付、国または地域、ほとんどの人が有給休暇かどうかに関する祝日情報を示しています。 列の説明、データセットにアクセスするためのさまざまな方法、例など、このデータセットの詳細については、Microsoft Azure Open Datasets カタログの「Public Holidays」を参照してください。
フィルター フィールドを初期化します。
- 継承
-
PublicHolidays
コンストラクター
PublicHolidays(country_or_region: str = '', start_date: datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)
パラメーター
名前 | 説明 |
---|---|
country_or_region
必須
|
データを返す国または地域。 |
start_date
|
データの読み込みを開始する日付 (その日を含む)。 None の場合は、 規定値: 2008-01-01 00:00:00
|
end_date
|
データの読み込みを終了する日付 (その日付を含む)。 None の場合は、 規定値: 2024-12-13 00:00:00
|
cols
|
データセットから読み込む列名のリスト。 None の場合は、すべての列が読み込まれます。 このデータセットで使用できる列の詳細については、「祝日」を参照してください。 規定値: None
|
enable_telemetry
|
このデータセットでテレメトリを有効にするかどうか。 規定値: True
|
country_or_region
必須
|
クエリを実行する国または地域。 |
start_date
必須
|
包括的にクエリを実行する開始日。 |
end_date
必須
|
包括的にクエリを実行する終了日。 |
cols
必須
|
取得する列名の一覧。 None の場合、すべての列が取得されます。 |
enable_telemetry
必須
|
テレメトリを送信するかどうかを示します。 |
注釈
データセットにアクセスする方法の例を次に示します。
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
メソッド
filter |
時間をフィルター処理します。 |
filter
時間をフィルター処理します。
filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)
パラメーター
名前 | 説明 |
---|---|
env
必須
|
ランタイム環境。 |
min_date
必須
|
最小の日付。 |
max_date
必須
|
最大の日付。 |
戻り値
型 | 説明 |
---|---|
フィルター処理されたデータ フレーム。 |
属性
country_or_region_column_name
country_or_region_column_name = 'countryOrRegion'
countrycode_column_name
countrycode_column_name = 'countryRegionCode'
default_end_date
default_end_date = datetime.datetime(2024, 12, 13, 0, 0)
default_max_end_date
default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)
default_start_date
default_start_date = datetime.datetime(2008, 1, 1, 0, 0)