Święta
Dane dotyczące świąt na całym świecie pobrane z pakietu PyPI holidays oraz witryny Wikipedia, obejmujące 38 krajów i regionów w latach 1970–2099.
Każdy wiersz wskazuje informacje na temat świąt dotyczące konkretnej daty, kraju lub regionu i tego, czy większość osób ma wówczas płatny dzień wolny.
Uwaga
Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Wolumin i przechowywanie
Ten zestaw danych jest przechowywany w formacie Parquet. Jest to migawka z informacjami o wakacjach od 1 stycznia 1970 do 1 stycznia 2099 r. Rozmiar danych to około 500 KB.
Lokalizacja usługi Storage
Ten zestaw danych jest przechowywany w regionie platformy Azure Wschodnie stany USA. Zalecamy lokalizowanie zasobów obliczeniowych w regionie Wschodnie stany USA pod kątem koligacji.
Dodatkowe informacje
Ten zestaw danych łączy dane pobrane z witryny Wikipedia (WikiMedia Foundation Inc.) oraz pakietu PyPI holidays.
- Wikipedia: oryginalne źródło, oryginalna licencja
- PyPI holidays: oryginalne źródło, oryginalna licencja
Ten połączony zestaw danych jest udostępniany w ramach licencji Creative Commons Attribution-ShareAlike 3.0 Unported License.
Jeśli masz pytania dotyczące tego zestawu danych, napisz wiadomość e-mail na adres aod@microsoft.com.
Kolumny
Nazwisko | Typ danych | Unikatowe | Wartości (przykładowe) | opis |
---|---|---|---|---|
countryOrRegion | string | 38 | Szwecja Norwegia | Pełna nazwa kraju lub regionu. |
countryRegionCode | string | 35 | SE NIE | Kod kraju lub regionu zgodny z formatem podanym tutaj. |
data | timestamp | 20,665 | 2074-01-01 00:00:00 2025-12-25 00:00:00 | Data święta. |
holidayName | string | 483 | Søndag Söndag | Pełna nazwa święta. |
isPaidTimeOff | boolean | 3 | Prawda | Wskaż, czy większość osób zapłaciła czas wolny od tej daty (obecnie jest dostępna tylko dla STANÓW Zjednoczonych, GB i Indii). Wartość NULL oznacza „nie wiadomo”. |
normalizeHolidayName | string | 438 | Søndag Söndag | Znormalizowana nazwa święta. |
Podgląd
countryOrRegion | holidayName | normalizeHolidayName | countryRegionCode | data |
---|---|---|---|---|
Norwegia | Søndag | Søndag | NIE | 12/28/2098 12:00:00 |
Szwecja | Söndag | Söndag | SE | 12/28/2098 12:00:00 |
Australia | Dzień Boksu | Dzień Boksu | AU | 12/26/2098 12:00:00 |
Węgry | Karácsony másnapja | Karácsony másnapja | HU | 12/26/2098 12:00:00 |
Austria | Stefanitag | Stefanitag | AT | 12/26/2098 12:00:00 |
Kanada | Dzień Boksu | Dzień Boksu | CA | 12/26/2098 12:00:00 |
Chorwacja | Grzegorz Stjepan | Grzegorz Stjepan | Zasoby ludzkie | 12/26/2098 12:00:00 |
Czeski | 2. svátek vánoční | 2. svátek vánoční | CZ | 12/26/2098 12:00:00 |
Dostęp do danych
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).