Udostępnij za pośrednictwem


Europejskie Centrum Zapobiegania Chorobom i Kontroli (ECDC) Przypadki COVID-19

Najnowsze dostępne publiczne dane dotyczące geograficznego rozkładu przypadków COVID-19 na całym świecie z Europejskiego Centrum Zapobiegania Chorobom i Kontroli (ECDC). Każdy wiersz/wpis zawiera liczbę nowych przypadków z podziałem na dzień i kraj lub region.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Zestawy danych

Zmodyfikowane wersje zestawu danych są dostępne w formatach CSV, JSON, JSON-Lines i Parquet (aktualizowane codziennie):

Wszystkie zmodyfikowane wersje mają dodane kody iso_country_region i czasy ładowania oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.

Dane pierwotne: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Poprzednie wersje danych zmodyfikowanych i pierwotnych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Ilość danych

Na dzień 28 maja 2020 r. zawierały 19 876 wierszy (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).

Źródło danych

Dane pierwotne są pozyskiwane codziennie z pliku CSV ecDC. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym jego pochodzenia, zobacz stronę zbierania danych ECDC.

Jakość danych

Europejskie Centrum ds. Zapobiegania i Kontroli Chorób nie gwarantuje dokładności ani stosowności danych. Przeczytaj zastrzeżenie.

Przypisywanie praw do licencji i użytkowania

Te dane są udostępniane i mogą być używane zgodnie z zasadami dotyczącymi praw autorskich Europejskiego Centrum ds. Zapobiegania i Kontroli Chorób, które można znaleźć tutaj. W przypadku wszelkich dokumentów, do których prawa autorskie mają strony trzecie, zgodę na powielanie należy uzyskać od posiadacza praw autorskich.

Zawsze należy powiadomić Europejskie Centrum ds. Zapobiegania i Kontroli Chorób, jako oryginalne źródło tych danych. Takie potwierdzenie musi być zawarte w każdej kopii materiału.

Kontakt biznesowy

W razie jakichkolwiek pytań lub opinii dotyczących tego zestawu danych lub innych zestawów danych w usłudze COVID-19 Data Lake, skontaktuj się z askcovid19dl@microsoft.com.

Kolumny

Nazwisko Typ danych Unikatowe Wartości (przykładowe) opis
przypadki smallint 5,515 1 2 Liczba zgłoszonych przypadków
continent_exp string 6 Europa Afryka Nazwa kontynentu
countries_and_territories string 214 Kanada Belgia Nazwa kraju lub terytorium
country_territory_code string 213 KOR ISL Trzyliterowy kod kraju lub terytorium
date_rep data 350 2020-12-11 2020-11-22 Data raportu
dzień smallint 31 14 13 Dzień miesiąca
Zgonów smallint 1049 1 2 Liczba zgłoszonych zgonów
geo_id string 214 CA SE Identyfikator geograficzny
iso_country string 214 SE US Kod kraju lub regionu w standardzie ISO 3166
load_date timestamp 1 2021-04-26 00:06:22.123000 Data załadowania danych na platformę Azure
miesiąca smallint 12 10 8 Numer miesiąca
rok smallint 2 2020 2019 Year (Rok)

Podgląd

date_rep dzień miesiąca rok przypadki Zgonów countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-13 13 12 2020 298 9 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-12 12 12 2020 113 11 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-11 11 12 2020 63 10 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-10 10 12 2020 202 16 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-09 9 12 2020 135 13 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-08 8 12 2020 200 6 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-06 6 12 2020 234 10 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF
2020-12-05 5 12 2020 235 18 Afganistan AF AFG Azja 26.04.2021 12:06:22 AF

Dostęp do danych

Azure Notebooks

Ten notes zawiera adresy URL i przykładowy kod umożliwiający dostęp do europejskiego centrum zapobiegania chorobom i kontroli (ECDC) Covid-19 Cases adresów URL zestawów danych różnych formatów plików zestawu danych hostowanych w usłudze Azure Blob Storage:} CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Azure Synapse

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Przykłady

Zobacz przykłady użycia tego zestawu danych:

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).