Projekt COVID Tracking
Datová sada projektu COVID Tracking poskytuje nejnovější údaje ohledně testů, potvrzených případů, hospitalizací a výsledky léčby pacientů ze všech států a teritorií USA.
Další informace o této datové sadě najdete v úložišti GitHub projektu.
Poznámka:
Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.
Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.
Datové sady
Upravené verze této datové sady jsou k dispozici ve formátech CSV, JSON, JSON-Lines a Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Do všech upravených verzí byly přidány kódy území podle ISO 3166 a časy načtení. Pro názvy sloupců jsou použita malá písmena s podtržítky jako oddělovači.
Nezpracovaná data: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
Předchozí verze upravených a nezpracovaných dat: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Objem dat
Všechny datové sady se denně aktualizují. K 13. květnu 2020 obsahovaly 4 100 řádků (CSV 574 kB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).
Zdroj dat
Tato data byla původně publikována projektem COVID Tracking na webu The Atlantic. Nezpracovaná data se ingestují z úložiště COVID Tracking Na GitHubu pomocí souboru states_daily_4p_et.csv. Další informace o této datové sadě, včetně jejích původů z rozhraní API projektu COVID Tracking, najdete v úložišti projektu GitHub.
Kvalita dat
Projekt COVID Tracking vyhodnocí kvalitu dat pro každý stav a poskytuje další informace o jejich posouzení kvality dat. Další informace najdete na stránce s daty projektu COVID Tracking. Data v úložišti GitHub mohou být za rozhraním API o hodinu zpožděná. Abyste měli přístup k nejnovějším datům, je třeba používat rozhraní API.
Přisuzování práv k licencím a používání
Tato data jsou licencována za podmínek a ujednání apache License 2.0.
Jakékoli použití údajů musí uchovávat veškerá autorská práva, patent, ochrannou známku a připisovací oznámení.
Kontakt
Pokud máte jakékoli dotazy nebo zpětnou vazbu k této nebo jiné datové sadě v Data Lake COVID-19, obraťte askcovid19dl@microsoft.comse na .
Sloupce
Name | Datový typ | Jedinečný | Values (sample) | Popis |
---|---|---|---|---|
datum | datum | 420 | 2020-11-10 2021-01-30 | Datum, ze kterého pochází shromážděné denní souhrny |
date_checked | string | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Zastaralé |
smrt | smallint | 7,327 | 2 5 | Celkový počet lidí, kteří zatím zemřeli v důsledku COVID-19 |
death_increase | smallint | 429 | 1 2 | Zastaralé |
Fips | smallint | 56 | 26 55 | Kód FIPS sčítání lidu daného státu |
fips_code | string | 60 | 53 25 | Kód FIPS sčítání lidu daného státu |
hash | string | 20,780 | 63df8cccd23a5476bab2d811b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Hodnota hash tohoto záznamu |
hospitalizovaný | int | 7,641 | 89995 4 | Zastaralé |
hospitalized_cumulative | int | 7,641 | 89995 4 | Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni, včetně těch, kteří se již uzdravili nebo kteří zemřeli |
hospitalized_currently | smallint | 3,886 | 8 13 | Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 hospitalizováni |
hospitalized_increase | smallint | 615 | 1 2 | Zastaralé |
in_icu_cumulative | smallint | 2,295 | 990 220 | Celkový počet lidí, kteří zatím kvůli COVID-19 byli hospitalizováni na jednotce intenzivní péče, včetně těch, kteří se již uzdravili nebo kteří zemřeli |
in_icu_currently | smallint | 1,643 | 2 8 | Celkový počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 na jednotce intenzivní péče |
iso_country | string | 0 | (USA) | Kód ISO 3166 země nebo oblasti |
iso_subdivision | string | 57 | US-UM US-WA | Kód ISO 3166 nižší územní jednotky |
last_update_et | časové razítko | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | Čas poslední aktualizace dat dne |
load_time | časové razítko | 0 | 2021-04-26 00:06:49.883000 | Datum a čas načtení dat ze zdroje do Azure |
negativní | int | 10,864 | 305972 2140 | Celkový počet lidí, kteří zatím mají negativní výsledek testu na COVID-19 |
negative_increase | int | 7,328 | 6 17 | Zastaralé |
on_ventilator_cumulative | smallint | 677 | 411 412 | Celkový počet lidí, kteří zatím kvůli COVID-19 museli být napojeni na ventilátor, včetně těch, kteří se již uzdravili nebo kteří zemřeli |
on_ventilator_currently | smallint | 837 | 4 10 | Počet lidí, kteří jsou k dnešnímu dni kvůli COVID-19 napojeni na ventilátor |
Čeká se na zadání | smallint | 944 | 2 17 | Počet testů s ještě neurčeným výsledkem |
pos_neg | int | 18,282 | 2140 2 | Zastaralé |
pozitivní | int | 16,837 | 2 1 | Celkový počet lidí, kteří zatím mají pozitivní výsledek testu na COVID-19 |
positive_increase | smallint | 4,754 | 1 2 | Zastaralé |
uzdravený | int | 8,286 | 29 19 | Celkový počet lidí, kteří se zatím uzdravili z COVID-19 |
state | string | 56 | MI PA | Dvoumístný kód státu |
total | int | 18,283 | 2140 2 | Zastaralé |
total_test_results | int | 18,648 | 2140 3 | Celkový počet státem poskytnutých výsledků testů |
total_test_results_increase | int | 13,463 | 1 2 | Zastaralé |
Preview
datum | state | pozitivní | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | smrt | hospitalizovaný | total | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negativní | in_icu_cumulative | on_ventilator_cumulative | uzdravený | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 5.3.2021 3:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 5.3.2021 3:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26.4.2021 12:06:49 | (USA) | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | null | 7.3.2021 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 7.3.2021 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 0 | -1 | 0 | 2087 | 408 | 2347 | 0 | US-AL | 26.4.2021 12:06:49 | (USA) | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | Pohledávky | 324818 | 335 | 14926 | 65 | null | 7.3.2021 12:00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 7.3.2021 12:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26.4.2021 12:06:49 | (USA) | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 12.1.2020 12:00:00 | 96d23f88c995b9a7f3b4b864de6414f45c728ff | 12.1.2020 12:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 26.4.2021 12:06:49 | (USA) | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | null | 7.3.2021 12:00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 7.3.2021 12:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 26.4.2021 12:06:49 | (USA) | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | null | 7.3.2021 2:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 7.3.2021 2:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 26.4.2021 12:06:49 | (USA) | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | null | 7.3.2021 1:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 7.3.2021 1:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26.4.2021 12:06:49 | (USA) | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | null | 4.3.2021 11:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 4.3.2021 11:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26.4.2021 12:06:49 | (USA) | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | null | 6.3.2021 12:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 6.3.2021 12:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26.4.2021 12:06:49 | (USA) | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | null | 6.3.2021 18:00:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 6.3.2021 18:00:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 26.4.2021 12:06:49 | (USA) | 545070 | 13 |
Přístup k datům
Azure Notebooks
Adresy URL různých formátů souborů datových sad hostovaných ve službě Azure Blob Storage:
Stáhněte si soubor datové sady pomocí integrované funkce ke stažení z adresy URL http v Knihovně Pandas. Pandas má čtenáře pro různé formáty souborů:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.
Azure Synapse
Ukázka není k dispozici pro tuto kombinaci platformy nebo balíčku.
Další kroky
Prohlédněte si zbývající datové sady v katalogu Open Datasets.