共用方式為


Bing COVID-19

Bing 新型冠狀病毒 (COVID-19) 資料每日更新,提供來自所有區域的確診、死亡及治癒病例數。 Bing COVID-19 Tracker 可反映此資料。

Bing 會從多個受信任的可靠來源收集資料,包括:

注意

Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。

此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。

資料集

已修改的 Bing COVID-19 資料集提供 CSV、JSON、JSON-Lines 與 Parquet 格式:

所有已修改的資料集都會新增 ISO 3166 細分代碼和載入時間。 其使用小寫資料行名稱及底線分隔符號。

CSV 格式的未經處理資料

如需舊版的已修改和未經處理資料,請參閱此資源 (英文)。

資料量

所有資料集都會每日更新。 截至 2023 年 3 月 5 日為止,共包含 4,766,737 個資料列。 資料集提供下列檔案格式:

  • CSV (560.3 MB)
  • JSON (1515.6 MB)
  • JSONL (1506.2 MB)
  • Parquet (55.4 MB)

授權和使用權限出處

資料只能用於符合這些條款和條件的教育和學術用途。 有效用途包括:

  • 學術機構
  • 政府機構
  • 醫學研究

在出版物中使用或引用資料時,應提及資料來自 ‘Bing COVID-19 Tracker’,並提供前往 www.bing.com/covid 的連結。

連絡人

若對這個資料集或 COVID-19 資料湖中的其他資料集有任何疑問,請連絡 askcovid19dl@microsoft.com

資料行

名稱 資料類型 唯一 Values (sample) 描述
admin_region_1 字串 864 Texas Georgia country_region 中的地區
admin_region_2 字串 3,143 Washington County Jefferson County admin_region_1 中的地區
confirmed int 120,692 1 和 2 地區的確診人數
confirmed_change int 12,120 1 和 2 與前一天相比的確診人數變化
country_region 字串 237 United States India 國家/地區
deaths int 20,616 1 和 2 地區的死亡人數
deaths_change smallint 1,981 1 和 2 與前一天相比的死亡人數變化
id int 1,783,534 742546 69019298 唯一識別碼
iso_subdivision 字串 484 US-TX US-GA 由兩部分組成的 ISO 次級行政區代碼
iso2 字串 226 US IN 2 個字母的國碼 (地區碼) 識別碼
iso3 字串 226 USA IND 3 個字母的國碼 (地區碼) 識別碼
緯度 double 5,675 42.28708 19.59852 地區中心的緯度
load_time timestamp 1 2021-04-26 00:06:34.719000 從 GitHub 上 Bing 來源載入檔案的日期與時間
經度 double 5,693 -2.5396 -155.5186 地區中心的經度
已復原 int 73,287 1 和 2 地區的康復人數
recovered_change int 10,441 1 和 2 與前一天相比的康復人數變化
已更新 date 457 2021-04-23 2021-04-22 記錄的截止日期

預覽​​

id 已更新 confirmed deaths iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 null null 全球 null null null 4/26/2021 12:06:34 AM
338996 2020-01-22 313 0 null null 全球 null null null 4/26/2021 12:06:34 AM 51 0
338997 2020 年 1 月 23 日 578 0 null null 全球 null null null 4/26/2021 12:06:34 AM 265 0
338998 2020-01-24 8:41 0 null null 全球 null null null 4/26/2021 12:06:34 AM 263 0
338999 2020-01-25 1320 0 null null 全球 null null null 4/26/2021 12:06:34 AM 479 0
339000 2020-01-26 2014 0 null null 全球 null null null 4/26/2021 12:06:34 AM 694 0
339001 2020-01-27 2798 0 null null 全球 null null null 4/26/2021 12:06:34 AM 784 0
339002 2020 年 1 月 28 日 4593 0 null null 全球 null null null 4/26/2021 12:06:34 AM 1795 0
339003 2020-01-29 6,065 0 null null 全球 null null null 4/26/2021 12:06:34 AM 1472 0
339004 2020-01-30 7818 0 null null 全球 null null null 4/26/2021 12:06:34 AM 1753 0

資料存取 - Azure Notebooks

注意

此筆記本記錄 URL 和程式碼範例,可存取 Bing COVID-19 資料集

請使用下列 URL 取得裝載於 Azure Blob 儲存體的特定檔案格式:

使用從 HTTP URL 下載的 Pandas 內建功能,下載資料集檔案。 Pandas 具有各種檔案格式的讀取器:

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

若要確認更新的資料行具有日期時間格式,請檢查不同欄位的資料類型:

df.dtypes

檢閱全球資料。 若要將資料視覺化,請建立一些圖表:

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

資料存取 - Azure Databricks

此平台/套件組合沒有可用的範例。

資料存取 - Azure Synapse

此平台/套件組合沒有可用的範例。

下一步

檢視開放資料集目錄中的其餘資料集。