Svátcích
Data o celosvětových svátcích pocházející z balíčku PyPI holidays a z Wikipedie, která pokrývají 38 zemí nebo oblastí od roku 1970 do roku 2099.
Každý řádek obsahuje informace o svátcích pro konkrétní datum a zemi nebo oblast a uvádí, jestli má během daného svátku většina lidí placené volno.
Poznámka:
Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.
Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.
Objem a uchovávání
Tato datová sada se uchovává ve formátu Parquet. Jedná se o snímek s informacemi o svátce od 1. ledna 1970 do 1. ledna 2099. Velikost dat je přibližně 500 kB.
Dočasné úložiště
Tato datová sada se uchovává v oblasti Azure Východní USA. Pro spřažení doporučujeme vyhledat výpočetní prostředky v oblasti USA – východ.
Další informace
Tato datová sada kombinuje data pocházející z Wikipedie (WikiMedia Foundation Inc) a balíčku PyPI Holidays.
- Wikipedie: původní zdroj, původní licence
- PyPI Holidays: původní zdroj, původní licence
Tato kombinovaná datová sada se poskytuje v rámci licence Creative Commons Attribution-ShareAlike 3.0 Unported License.
Pokud ohledně tohoto zdroje dat máte jakékoli dotazy, zašlete e-mail na adresu aod@microsoft.com.
Sloupce
Name | Datový typ | Jedinečný | Values (sample) | Popis |
---|---|---|---|---|
countryOrRegion | string | 38 | Švédsko Norsko | Celý název země nebo oblasti |
countryRegionCode | string | 35 | SE NE | Kód země nebo oblasti v tomto formátu |
datum | časové razítko | 20,665 | 2074-01-01 00:00:00 2025-12-25 00:00:00 | Datum svátku |
holidayName | string | 483 | Søndag Söndag | Celý název svátku |
isPaidTimeOff | boolean | 3 | True | Určete, jestli většina lidí v tomto datu zaplatila volno (k dispozici pouze pro USA, GB a Indii). Hodnota NULL znamená neznámý stav. |
normalizeHolidayName | string | 438 | Søndag Söndag | Normalizovaný název svátku |
Preview
countryOrRegion | holidayName | normalizeHolidayName | countryRegionCode | datum |
---|---|---|---|---|
Norsko | Søndag | Søndag | NE | 28.12.2098 12:00:00 |
Švédsko | Söndag | Söndag | SE | 28.12.2098 12:00:00 |
Austrálie | Den boxingu | Den boxingu | AU | 26. 12. 2098 12:00:00 |
Maďarsko | Karácsony másnapja | Karácsony másnapja | HU | 26. 12. 2098 12:00:00 |
Rakousko | Stefanitag | Stefanitag | AT | 26. 12. 2098 12:00:00 |
Kanada | Den boxingu | Den boxingu | CA | 26. 12. 2098 12:00:00 |
Chorvatsko | Sveti Stjepan | Sveti Stjepan | HR | 26. 12. 2098 12:00:00 |
Čeština | 2. svátek vánoční | 2. svátek vánoční | CZ | 26. 12. 2098 12:00:00 |
Přístup k datům
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))
Další kroky
Prohlédněte si zbývající datové sady v katalogu Open Datasets.