Sdílet prostřednictvím


Projekt COVID Tracking

Datová sada projektu COVID Tracking poskytuje nejnovější údaje ohledně testů, potvrzených případů, hospitalizací a výsledky léčby pacientů ze všech států a teritorií USA.

Další informace o této datové sadě najdete v úložišti GitHub projektu.

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Datové sady

Upravené verze této datové sady jsou k dispozici ve formátech CSV, JSON, JSON-Lines a Parquet.

Do všech upravených verzí byly přidány kódy území podle ISO 3166 a časy načtení. Pro názvy sloupců jsou použita malá písmena s podtržítky jako oddělovači.

Nezpracovaná data: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

Předchozí verze upravených a nezpracovaných dat: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Objem dat

Všechny datové sady se denně aktualizují. K 13. květnu 2020 obsahovaly 4 100 řádků (CSV 574 kB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).

Zdroj dat

Tato data byla původně publikována projektem COVID Tracking na webu The Atlantic. Nezpracovaná data se ingestují z úložiště COVID Tracking Na GitHubu pomocí souboru states_daily_4p_et.csv. Další informace o této datové sadě, včetně jejích původů z rozhraní API projektu COVID Tracking, najdete v úložišti projektu GitHub.

Kvalita dat

Projekt COVID Tracking vyhodnocí kvalitu dat pro každý stav a poskytuje další informace o jejich posouzení kvality dat. Další informace najdete na stránce s daty projektu COVID Tracking. Data v úložišti GitHub mohou být za rozhraním API o hodinu zpožděná. Abyste měli přístup k nejnovějším datům, je třeba používat rozhraní API.

Přisuzování práv k licencím a používání

Tato data jsou licencována za podmínek a ujednání apache License 2.0.

Jakékoli použití údajů musí uchovávat veškerá autorská práva, patent, ochrannou známku a připisovací oznámení.

Kontakt

Pokud máte jakékoli dotazy nebo zpětnou vazbu k této nebo jiné datové sadě v Data Lake COVID-19, obraťte askcovid19dl@microsoft.comse na .

Sloupce

Name Datový typ Jedinečný Values (sample) Popis
datum datum 420 2020-11-10 2021-01-30 Datum, ze kterého pochází shromážděné denní souhrny
date_checked string 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Zastaralé
smrt smallint 7,327 2 5 Celkový počet lidí, kteří zatím zemřeli v důsledku COVID-19
death_increase smallint 429 1 2 Zastaralé
Fips smallint 56 26 55 Kód FIPS sčítání lidu daného státu
fips_code string 60 53 25 Kód FIPS sčítání lidu daného státu
hash string 20,780 63df8cccd23a5476bab2d811b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Hodnota hash tohoto záznamu
hospitalizovaný int 7,641 89995 4 Zastaralé
hospitalized_cumulative int 7,641 89995 4 Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni, včetně těch, kteří se již uzdravili nebo kteří zemřeli
hospitalized_currently smallint 3,886 8 13 Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 hospitalizováni
hospitalized_increase smallint 615 1 2 Zastaralé
in_icu_cumulative smallint 2,295 990 220 Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni na jednotce intenzivní péče, včetně těch, kteří se již uzdravili nebo kteří zemřeli
in_icu_currently smallint 1,643 2 8 Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 na jednotce intenzivní péče
iso_country string 0 (USA) Kód ISO 3166 země nebo oblasti
iso_subdivision string 57 US-UM US-WA Kód ISO 3166 nižší územní jednotky
last_update_et časové razítko 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 Čas poslední aktualizace dat dne
load_time časové razítko 0 2021-04-26 00:06:49.883000 Datum a čas načtení dat ze zdroje do Azure
negativní int 10,864 305972 2140 Celkový počet lidí, kteří zatím mají negativní výsledek testu na COVID-19
negative_increase int 7,328 6 17 Zastaralé
on_ventilator_cumulative smallint 677 411 412 Celkový počet lidí, kteří zatím kvůli COVID-19 museli být napojeni na ventilátor, včetně těch, kteří se již uzdravili nebo kteří zemřeli
on_ventilator_currently smallint 837 4 10 Počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 napojeni na ventilátor
Čeká se na zadání smallint 944 2 17 Počet testů s ještě neurčeným výsledkem
pos_neg int 18,282 2140 2 Zastaralé
pozitivní int 16,837 2 1 Celkový počet lidí, kteří zatím mají pozitivní výsledek testu na COVID-19
positive_increase smallint 4,754 1 2 Zastaralé
uzdravený int 8,286 29 19 Celkový počet lidí, kteří se zatím uzdravili z COVID-19
state string 56 MI PA Dvoumístný kód státu
total int 18,283 2140 2 Zastaralé
total_test_results int 18,648 2140 3 Celkový počet státem poskytnutých výsledků testů
total_test_results_increase int 13,463 1 2 Zastaralé

Preview

datum state pozitivní hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked smrt hospitalizovaný total total_test_results pos_neg Fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negativní in_icu_cumulative on_ventilator_cumulative uzdravený in_icu_currently
2021-03-07 AK 56886 33 1293 2 null 5.3.2021 3:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 5.3.2021 3:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26.4.2021 12:06:49 (USA)
2021-03-07 AL 499819 494 45976 null 7.3.2021 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 7.3.2021 11:00:00 10148 45976 2431530 2323788 2431530 0 -1 0 2087 408 2347 0 US-AL 26.4.2021 12:06:49 (USA) 1931711 2676 1515 295690
2021-03-07 Pohledávky 324818 335 14926 65 null 7.3.2021 12:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 7.3.2021 12:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26.4.2021 12:06:49 (USA) 2480716 1533 315517 141
2021-03-07 AS 0 null 12.1.2020 12:00:00 96d23f88c995b9a7f3b4b864de6414f45c728ff 12.1.2020 12:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 26.4.2021 12:06:49 (USA) 2140
2021-03-07 AZ 826454 963 57907 143 null 7.3.2021 12:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 7.3.2021 12:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 26.4.2021 12:06:49 (USA) 3073010 273
2021-03-07 CA 3501394 4291 null 7.3.2021 2:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 7.3.2021 2:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 26.4.2021 12:06:49 (USA) 1159
2021-03-07 CO 436602 326 23904 null 7.3.2021 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 7.3.2021 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26.4.2021 12:06:49 (USA) 2199458
2021-03-07 CT 285330 428 12257 null 4.3.2021 11:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 4.3.2021 11:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26.4.2021 12:06:49 (USA)
2021-03-07 DC 41419 150 16 null 6.3.2021 12:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 6.3.2021 12:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26.4.2021 12:06:49 (USA) 29570 38
2021-03-07 DE 88354 104 null 6.3.2021 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 6.3.2021 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 26.4.2021 12:06:49 (USA) 545070 13

Přístup k datům

Azure Notebooks

Adresy URL různých formátů souborů datových sad hostovaných ve službě Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Stáhněte si soubor datové sady pomocí integrované funkce ke stažení z adresy URL http v Knihovně Pandas. Pandas má čtenáře pro různé formáty souborů:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.

Azure Synapse

Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.