歐洲疾病預防控制中心 (ECDC) COVID-19 案例
由歐洲疾病預防控制中心 (ECDC) 提供的全球新型冠狀病毒 (COVID-19) 病例地理分佈最新公開資料。 每個資料列/項目均包含各個國家或地區每日通報的新病例。
注意
Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。
此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。
資料集
已修改的資料集版本提供 CSV、JSON、JSON-Lines 與 Parquet 格式,並且每日更新:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
所有已修改的資料集皆新增了 iso_country_region 代碼和載入時間,並使用以底線分隔的小寫資料行名稱。
未經處理資料:https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
已修改及未經處理的舊版資料:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
資料量
截至 2020 年 5月 28 日為止,這些資料集包含了 19,876 個資料列 (CSV 1.5 MB、JSON 4.9 MB、JSONL 4.9 MB、Parquet 54.1 KB)。
資料來源
每日皆會從 ECDC csv 檔案擷取未經處理的資料。 如需此資料集的詳細資訊,包括其來源,請參閱 ECDC 資料收集頁面。
資料品質
ECDC 不保證該資料的正確性或時效性。 閱讀免責聲明。
授權和使用權限出處
此資料的提供與使用方式,均依循此處的 ECDC 著作權原則。 若文件的著作權屬於第三方,就必須獲得著作權人同意,才可進行重製。
ECDC 必須一律被公認為此資料的原始來源。 每份資料複本都必須包含這樣的認知。
連絡人
對於新型冠狀病毒 (COVID-19) Data Lake 中的這個資料集或其他資料集如有任何問題,請連絡 askcovid19dl@microsoft.com。
資料行
名稱 | 資料類型 | 唯一 | Values (sample) | 描述 |
---|---|---|---|---|
案例 | smallint | 5,515 | 1 2 | 通報的案例數 |
continent_exp | string | 6 | Europe Africa | 大陸名稱 |
countries_and_territories | string | 214 | Canada Belgium | 國家/地區名稱 |
country_territory_code | string | 213 | KOR ISL | 三個字母的國家/地區代碼 |
date_rep | date | 350 | 2020-12-11 2020-11-22 | 通報的日期 |
天 | smallint | 31 | 14 13 | 當月天數 |
deaths | smallint | 1,049 | 1 2 | 通報的死亡數 |
geo_id | string | 214 | CA SE | 地理位置識別碼 |
iso_country | string | 214 | SE US | ISO 3166 國碼或地區碼 |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | 資料載入 Azure 的日期 |
個月 | smallint | 12 | 10 8 | 月份數 |
year | SMALLINT | 2 | 2020 2019 | Year |
預覽
date_rep | 天 | 個月 | year | 案例 | deaths | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020 年 12 月 8 日 | 8 | 12 | 2020 | 200 | 6 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | 阿富汗 | AF | AFG | 亞洲 | 4/26/2021 12:06:22 AM | AF |
資料存取
Azure Notebooks
此筆記本會記載 URL 和範例程式碼,以存取不同資料集檔案格式的歐洲疾病預防控制中心 (ECDC) Covid-19 案例資料集 URL,其裝載於 Azure Blob 儲存體上:¶ CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
使用 Pandas 中從 HTTP URL 下載的內建功能,下載資料集檔案。 Pandas 具有各種檔案格式的讀取器:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
此平台/封裝組合沒有可用的樣本。
Azure Synapse
此平台/封裝組合沒有可用的樣本。
範例
請參閱如何使用此資料集的範例:
下一步
檢視開放資料集目錄中的其餘資料集。