次の方法で共有


PublicHolidays クラス

祝日のパブリック データセットを表します。

このデータセットには、PyPI holidays パッケージと Wikipedia をソースとする世界の祝日データが含まれており、1970 年から 2099 年まで、38 の国または地域を対象としています。 各行は、特定の日付、国または地域、ほとんどの人が有給休暇かどうかに関する祝日情報を示しています。 列の説明、データセットにアクセスするためのさまざまな方法、例など、このデータセットの詳細については、Microsoft Azure Open Datasets カタログの「Public Holidays」を参照してください。

フィルター フィールドを初期化します。

継承
PublicHolidays

コンストラクター

PublicHolidays(country_or_region: str = '', start_date: datetime = datetime.datetime(2008, 1, 1, 0, 0), end_date: datetime = datetime.datetime(2024, 12, 13, 0, 0), cols: List[str] | None = None, enable_telemetry: bool = True)

パラメーター

名前 説明
country_or_region
必須
str

データを返す国または地域。

start_date

データの読み込みを開始する日付 (その日を含む)。 None の場合は、default_start_date が使用されます。

規定値: 2008-01-01 00:00:00
end_date

データの読み込みを終了する日付 (その日付を含む)。 None の場合は、default_end_date が使用されます。

規定値: 2024-12-13 00:00:00
cols

データセットから読み込む列名のリスト。 None の場合は、すべての列が読み込まれます。 このデータセットで使用できる列の詳細については、「祝日」を参照してください。

規定値: None
enable_telemetry

このデータセットでテレメトリを有効にするかどうか。

規定値: True
country_or_region
必須
str

クエリを実行する国または地域。

start_date
必須

包括的にクエリを実行する開始日。

end_date
必須

包括的にクエリを実行する終了日。

cols
必須

取得する列名の一覧。 None の場合、すべての列が取得されます。

enable_telemetry
必須

テレメトリを送信するかどうかを示します。

注釈

データセットにアクセスする方法の例を次に示します。


   from azureml.opendatasets import PublicHolidays
   from datetime import datetime
   from dateutil.relativedelta import relativedelta


   end_date = datetime.today()
   start_date = datetime.today() - relativedelta(months=1)
   hol = PublicHolidays(start_date=start_date, end_date=end_date)
   hol_df = hol.to_pandas_dataframe()

メソッド

filter

時間をフィルター処理します。

filter

時間をフィルター処理します。

filter(env: SparkEnv | PandasEnv, min_date: datetime, max_date: datetime)

パラメーター

名前 説明
env
必須

ランタイム環境。

min_date
必須

最小の日付。

max_date
必須

最大の日付。

戻り値

説明

フィルター処理されたデータ フレーム。

属性

country_or_region_column_name

country_or_region_column_name = 'countryOrRegion'

countrycode_column_name

countrycode_column_name = 'countryRegionCode'

default_end_date

default_end_date = datetime.datetime(2024, 12, 13, 0, 0)

default_max_end_date

default_max_end_date = datetime.datetime(2099, 1, 1, 0, 0)

default_start_date

default_start_date = datetime.datetime(2008, 1, 1, 0, 0)