Europejskie Centrum Zapobiegania Chorobom i Kontroli (ECDC) Przypadki COVID-19
Najnowsze dostępne publiczne dane dotyczące geograficznego rozkładu przypadków COVID-19 na całym świecie z Europejskiego Centrum Zapobiegania Chorobom i Kontroli (ECDC). Każdy wiersz/wpis zawiera liczbę nowych przypadków z podziałem na dzień i kraj lub region.
Uwaga
Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Zestawy danych
Zmodyfikowane wersje zestawu danych są dostępne w formatach CSV, JSON, JSON-Lines i Parquet (aktualizowane codziennie):
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Wszystkie zmodyfikowane wersje mają dodane kody iso_country_region i czasy ładowania oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.
Dane pierwotne: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Poprzednie wersje danych zmodyfikowanych i pierwotnych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Ilość danych
Na dzień 28 maja 2020 r. zawierały 19 876 wierszy (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).
Źródło danych
Dane pierwotne są pozyskiwane codziennie z pliku CSV ecDC. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym jego pochodzenia, zobacz stronę zbierania danych ECDC.
Jakość danych
Europejskie Centrum ds. Zapobiegania i Kontroli Chorób nie gwarantuje dokładności ani stosowności danych. Przeczytaj zastrzeżenie.
Przypisywanie praw do licencji i użytkowania
Te dane są udostępniane i mogą być używane zgodnie z zasadami dotyczącymi praw autorskich Europejskiego Centrum ds. Zapobiegania i Kontroli Chorób, które można znaleźć tutaj. W przypadku wszelkich dokumentów, do których prawa autorskie mają strony trzecie, zgodę na powielanie należy uzyskać od posiadacza praw autorskich.
Zawsze należy powiadomić Europejskie Centrum ds. Zapobiegania i Kontroli Chorób, jako oryginalne źródło tych danych. Takie potwierdzenie musi być zawarte w każdej kopii materiału.
Kontakt biznesowy
W razie jakichkolwiek pytań lub opinii dotyczących tego zestawu danych lub innych zestawów danych w usłudze COVID-19 Data Lake, skontaktuj się z askcovid19dl@microsoft.com.
Kolumny
Nazwisko | Typ danych | Unikatowe | Wartości (przykładowe) | opis |
---|---|---|---|---|
przypadki | smallint | 5,515 | 1 2 | Liczba zgłoszonych przypadków |
continent_exp | string | 6 | Europa Afryka | Nazwa kontynentu |
countries_and_territories | string | 214 | Kanada Belgia | Nazwa kraju lub terytorium |
country_territory_code | string | 213 | KOR ISL | Trzyliterowy kod kraju lub terytorium |
date_rep | data | 350 | 2020-12-11 2020-11-22 | Data raportu |
dzień | smallint | 31 | 14 13 | Dzień miesiąca |
Zgonów | smallint | 1049 | 1 2 | Liczba zgłoszonych zgonów |
geo_id | string | 214 | CA SE | Identyfikator geograficzny |
iso_country | string | 214 | SE US | Kod kraju lub regionu w standardzie ISO 3166 |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Data załadowania danych na platformę Azure |
miesiąca | smallint | 12 | 10 8 | Numer miesiąca |
rok | smallint | 2 | 2020 2019 | Year (Rok) |
Podgląd
date_rep | dzień | miesiąca | rok | przypadki | Zgonów | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
Dostęp do danych
Azure Notebooks
Ten notes zawiera adresy URL i przykładowy kod umożliwiający dostęp do europejskiego centrum zapobiegania chorobom i kontroli (ECDC) Covid-19 Cases adresów URL zestawów danych różnych formatów plików zestawu danych hostowanych w usłudze Azure Blob Storage:} CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Azure Synapse
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Przykłady
Zobacz przykłady użycia tego zestawu danych:
- Analizowanie danych COVID za pomocą bezserwerowego punktu końcowego usługi Synapse SQL
- Analiza regresji liniowej danych COVID przy użyciu punktu końcowego SQL w usłudze Azure Synapse Analytics
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).