Bing COVID-19
Bing COVID-19 データには、すべてのリージョンからの確定、重症、回復した症例が含まれ、毎日更新されます。 Bing COVID-19 トラッカーには、このデータが反映されています。
Bing は、次のような信頼性の高い複数のソースからデータを収集します。
- BNO News
- アメリカ疾病予防管理センター (CDC)
- 国、地域、州の公衆衛生部門
- Wikipedia
- 世界保健機関 (WHO)
- 24/7 Wall St.
Note
Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。
このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。
データセット
編集された Bing COVID-19 データセットは、CSV、JSON、JSON-Lines、Parquet で提供されます。
すべての編集済みデータセットには、ISO 3166 下位コードと読み込み時間が追加されています。 小文字の列名とアンダースコアの区切り記号が使用されています。
以前のバージョンの編集済みデータおよび生データは、こちらのリソースで提供されています。
データ ボリューム
すべてのデータセットは毎日更新されます。 2023 年 3 月 5 日の時点で、4,766,737 行が含まれています。 データセットは、次のファイル形式で提供されています。
- CSV (560.3 MB)
- JSON (1515.6 MB)
- JSONL (1506.2 MB)
- Parquet (55.4 MB)
ライセンスと使用権の帰属
本データは、これらの使用条件に従い、教育および学術目的に限定して使用できます。 有効な目的は次のとおりです。
- 教育機関
- 政府機関
- 医療研究
出版物で使用または引用されているデータには、'Bing COVID-19 トラッカー' の帰属と www.bing.com/covid のリンクを含める必要があります。
お問い合わせ先
COVID-19 Data Lake のこのデータセットまたはその他のデータセットに関する質問またはフィードバックがある場合は、askcovid19dl@microsoft.com にご連絡ください。
列
Name | データ型 | 一意 | 値 (サンプル) | 説明 |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | country_region 内のリージョン |
admin_region_2 | string | 3,143 | Washington County Jefferson County | admin_region_1 内のリージョン |
confirmed | INT | 120,692 | 1 2 | リージョンの確定者数 |
confirmed_change | INT | 12,120 | 1 2 | 前日からの確定者数の変更 |
country_region | string | 237 | United States India | 国/リージョン |
deaths | INT | 20,616 | 1 2 | リージョンの死亡者数 |
deaths_change | smallint | 1,981 | 1 2 | 前日からの死亡者の変更 |
id | INT | 1,783,534 | 742546 69019298 | 一意識別子 |
iso_subdivision | string | 484 | US-TX US-GA | 2 つの部分から成る ISO 下位コード |
iso2 | string | 226 | US IN | 2 文字の国番号識別子 |
iso3 | string | 226 | USA IND | 3 文字の国番号識別子 |
緯度 (latitude) | double | 5,675 | 42.28708 19.59852 | リージョンの中心の緯度 |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | ファイルが GitHub 上の Bing ソースから読み込まれた日時 |
経度 (longitude) | double | 5,693 | -2.5396 -155.5186 | リージョンの中心の経度 |
recovered | INT | 73,287 | 1 2 | リージョンの回復者数 |
recovered_change | INT | 10,441 | 1 2 | 前日からの回復者数の変更 |
更新済み | date | 457 | 2021-04-23 2021-04-22 | レコードの現時点 |
プレビュー
id | 更新済み | confirmed | deaths | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | ||
338996 | 2020-01-22 | 313 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 1753 | 0 |
データ アクセス - Azure Notebooks
Note
このノートブックには、Bing COVID-19 データセットにアクセスするための URL とサンプル コードが記載されています。
Azure Blob Storage にホストされている特定のファイル形式を取得するには、次の URL を使用します。
Pandas の組み込みのダウンロード機能を使用して、データセット ファイルを HTTP URL からダウンロードします。 Pandas には、次のようなさまざまなファイル形式のリーダーがあります。
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
更新された列が datetime 形式であることを確認するには、さまざまなフィールドのデータ型を確認します。
df.dtypes
世界規模のデータを確認します。 データを視覚化するには、グラフを作成します。
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
データ アクセス - Azure Databricks
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
データ アクセス - Azure Synapse
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
次のステップ
Open Datasets カタログの残りのデータセットを表示します。