COVID Tracking Project
COVID Tracking Project データセットは、米国のすべての州と準州からの最新の検査数、感染者数、入院患者数、患者のアウトカムを提供しています。
このデータセットの詳細については、プロジェクトの GitHub リポジトリを参照してください。
Note
Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。
このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。
データセット
データセットの編集済みバージョンは、CSV、JSON、JSON-Lines、Parquet 形式で入手できます。
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
すべての編集済みバージョンには ISO 3166 下位コードと読み込み時間が追加されており、小文字の列名とアンダースコアの区切り文字が使用されています。
生データ: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json '
以前のバージョンの編集済み、および生データ: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
データ ボリューム
すべてのデータセットは毎日更新されます。 2020 年 5 月 13 日時点で、4,100 行 (CSV 574 KB, JSON 1.8 MB, JSONL 1.8 MB, Parquet 334 KB) が含まれています。
データ ソース
このデータの元の発行元は、Atlantic の COVID Tracking Project です。 生データは、COVID Tracking GitHub リポジトリから states_daily_4p_et.csv ファイルを使用して取り込まれています。 COVID Tracking Project API の配信元を含むこのデータセットの詳細については、プロジェクトの GitHub リポジトリを参照してください。
データ品質
COVID Tracking Project により、各州のデータ品質が評価され、データ品質の評価に関する追加情報が提供されています。 詳細については、COVID Tracking Project データ ページを参照してください。 GitHub リポジトリのデータは API よりも 1 時間遅れる可能性があり、最新のデータにアクセスするには API を使用する必要があります。
ライセンスと使用権の帰属
このデータは、Apache License 2.0 のご契約条件に従ってライセンスされています。
データを使用する場合は、すべての著作権、特許、商標、帰属の表示を保持する必要があります。
Contact
COVID-19 Data Lake のこのデータセットまたはその他のデータセットに関する質問またはフィードバックについては、askcovid19dl@microsoft.com にお問い合わせください。
[列]
Name | データ型 | 一意 | 値 (サンプル) | 説明 |
---|---|---|---|---|
date | date | 420 | 2020-11-10 2021-01-30 | 毎日の合計が収集された日付。 |
date_checked | string | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | 非推奨 |
death | smallint | 7,327 | 2 5 | これまでに COVID-19 が原因で死亡した人の合計数。 |
death_increase | smallint | 429 | 1 2 | 非推奨 |
fips | smallint | 56 | 26 55 | 州の国勢調査 FIPS コード。 |
fips_code | string | 60 | 53 25 | 州の国勢調査 FIPS コード。 |
hash | string | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | この記録のハッシュ |
hospitalized | INT | 7,641 | 89995 4 | 非推奨 |
hospitalized_cumulative | INT | 7,641 | 89995 4 | これまでに COVID-19 で入院した人の合計数。回復した、または死亡した人を含む。 |
hospitalized_currently | smallint | 3,886 | 8 13 | この日に COVID-19 のために入院した人の数。 |
hospitalized_increase | smallint | 615 | 1 2 | 非推奨 |
in_icu_cumulative | smallint | 2,295 | 990 220 | これまでに COVID-19 のために ICU に入った人の合計数。回復した、または死亡した人を含む。 |
in_icu_currently | smallint | 1,643 | 2 8 | この日に COVID-19 のために ICU にいる人の合計数。 |
iso_country | string | 1 | US | ISO 3166 国または地域コード |
iso_subdivision | string | 57 | US-UM US-WA | ISO 3166 下位コード |
last_update_et | timestamp | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | その日のデータが更新された最終時刻 |
load_time | timestamp | 1 | 2021-04-26 00:06:49.883000 | ソースから Azure にデータが読み込まれた日時 |
否定的 | INT | 10,864 | 305972 2140 | これまでに COVID-19 の検査で陰性と判定された人の合計数。 |
negative_increase | INT | 7,328 | 6 17 | 非推奨 |
on_ventilator_cumulative | smallint | 677 | 411 412 | これまでに COVID-19 のため人工呼吸器を使用した人の合計数。回復した、または死亡した人を含む。 |
on_ventilator_currently | smallint | 837 | 4 10 | この日に COVID-19 で人工呼吸器を使用している人の数。 |
pending | smallint | 944 | 2 17 | 結果がまだ判定されていない検査の数。 |
pos_neg | INT | 18,282 | 2140 2 | 非推奨 |
肯定的 | INT | 16,837 | 2 1 | これまでに COVID-19 の検査で陽性と判定された人の合計数。 |
positive_increase | smallint | 4,754 | 1 2 | 非推奨 |
recovered | INT | 8,286 | 29 19 | これまでに COVID-19 から回復した人の合計数。 |
state | string | 56 | MI PA | 州の 2 文字のコード |
total | INT | 18,283 | 2140 2 | 非推奨 |
total_test_results | INT | 18,648 | 2140 3 | 州が提供した検査結果の合計 |
total_test_results_increase | INT | 13,463 | 1 2 | 非推奨 |
プレビュー
date | state | 肯定的 | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | death | hospitalized | total | total_test_results | pos_neg | fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | 否定的 | in_icu_cumulative | on_ventilator_cumulative | recovered | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 3/5/2021 3:59:00 AM | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 3/5/2021 3:59:00 AM | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 4/26/2021 12:06:49 AM | US | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | null | 3/7/2021 11:00:00 AM | 997207b430824ea40b8eb8506c19a93e07bc972e | 3/7/2021 11:00:00 AM | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 4/26/2021 12:06:49 AM | US | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | null | 3/7/2021 12:00:00 AM | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 3/7/2021 12:00:00 AM | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 4/26/2021 12:06:49 AM | US | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 12/1/2020 12:00:00 AM | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 12/1/2020 12:00:00 AM | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 4/26/2021 12:06:49 AM | US | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | null | 3/7/2021 12:00:00 AM | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 3/7/2021 12:00:00 AM | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 4/26/2021 12:06:49 AM | US | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | null | 3/7/2021 2:59:00 AM | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 3/7/2021 2:59:00 AM | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 4/26/2021 12:06:49 AM | US | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | null | 3/7/2021 1:59:00 AM | 444746cda3a596f183f3fa3269c8cab68704e819 | 3/7/2021 1:59:00 AM | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 4/26/2021 12:06:49 AM | US | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | null | 3/4/2021 11:59:00 PM | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 3/4/2021 11:59:00 PM | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 4/26/2021 12:06:49 AM | US | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | null | 3/6/2021 12:00:00 AM | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 3/6/2021 12:00:00 AM | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 4/26/2021 12:06:49 AM | US | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | null | 3/6/2021 6:00:00 PM | 059d870e689d5cc19c35f5eb398214d7d9856373 | 3/6/2021 6:00:00 PM | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 4/26/2021 12:06:49 AM | US | 545070 | 13 |
データ アクセス
Azure Notebooks
Azure Blob Storage でホストされているさまざまなデータセット ファイル形式の URL:
Pandas の組み込みのダウンロード機能を使用して、データセット ファイルを http URL からダウンロードします。 Pandas には、次のようなさまざまなファイル形式のリーダーがあります。
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
Azure Synapse
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
次のステップ
Open Datasets カタログの残りのデータセットを表示します。