Dela via


COVID-spårningsprojekt

Datamängden COVID Tracking Project innehåller den senaste statistiken om tester, bekräftade fall, sjukhusinläggningar och patientresultat från varje delstat och territorium i USA.

Mer information om den här datamängden finns i projektets GitHub-lagringsplats.

Kommentar

Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.

Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.

Datauppsättningar

Modifierade versioner av datamängden finns i formaten CSV, JSON, JSON-Lines och Parquet.

För alla modifierade versioner har ISO 3166-delkoder och inläsningstider lagts till, och kolumnnamnen visas i gemener med understreck som avgränsare.

Rådata: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

Tidigare versioner av modifierade data och rådata: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Datavolym

Alla datauppsättningar uppdateras dagligen. Den 13 maj 2020 innehöll de 4 100 rader (574 KB som CSV, 1,8 MB som JSON, 1,8 MB som JSONL och 334 KB som Parquet).

Data source

Dessa data publicerades ursprungligen av COVID Tracking Project från tidskriften The Atlantic. Rådata matas in från COVID Tracking GitHub-lagringsplatsen med hjälp av states_daily_4p_et.csv-filen. Mer information om den här datamängden, inklusive dess ursprung från COVID Tracking Project API, finns i projektets GitHub-lagringsplats.

Datakvalitet

COVID Tracking Project bedömer datakvaliteten för varje tillstånd och ger ytterligare information om deras bedömning av datakvaliteten. Mer information finns på sidan COVID Tracking Project-data. De data som finns i GitHub-lagringsplatsen kan vara en timme efter data i API:et. Du bör därför använda data från API:et för att få tillgång till de senaste data.

Tilldelning av licens- och användningsrättigheter

Dessa data licensieras enligt villkoren i Apache License 2.0.

All användning av data måste behålla alla meddelanden om upphovsrätt, patent, varumärken och tillskrivning.

Kontakt

Om du vill ha frågor eller feedback om den här eller andra datamängder i COVID-19 Data Lake kontaktar du askcovid19dl@microsoft.com.

Kolumner

Name Datatyp Unik Värden (exempel) beskrivning
datum datum 420 2020-11-10 2021-01-30 Datum då data om totalt belopp för dagen samlades in.
date_checked sträng 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Inaktuell
död smallint 7,327 2 5 Totalt antal personer som har avlidit på grund av COVID-19 hittills.
death_increase smallint 429 1 2 Inaktuell
Fips smallint 56 26 55 Census FIPS-kod för delstaten.
fips_code sträng 60 53 25 Census FIPS-kod för delstaten.
hasch sträng 20,780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493dd Hash för denna post
Sjukhus heltal 7,641 89995 4 Inaktuell
hospitalized_cumulative heltal 7,641 89995 4 Totalt antal personer som varit inlagda på sjukhus med COVID-19 hittills, inklusive de som har tillfrisknat eller avlidit.
hospitalized_currently smallint 3,886 8 13 Totalt antal personer som är inlagda på sjukhus med COVID-19 den här dagen.
hospitalized_increase smallint 615 1 2 Inaktuell
in_icu_cumulative smallint 2,295 990 220 Totalt antal inlagda patienter på IVA på grund av COVID-19 hittills, inklusive de som har tillfrisknat eller avlidit.
in_icu_currently smallint 1,643 2 8 Totalt antal personer inlagda på IVA med COVID-19 den här dagen.
iso_country sträng 1 USA Lands- eller regionkod (ISO 3166)
iso_subdivision sträng 57 US-UM US-WA Landskod (ISO 3166)
last_update_et timestamp 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 Senaste gången dagens data uppdaterades
load_time timestamp 1 2021-04-26 00:06:49.883000 Datum och tid då data lästes in i Azure från källan
negativt heltal 10,864 305972 2140 Totalt antal personer som har testats negativt för COVID-19 hittills.
negative_increase heltal 7,328 6 17 Inaktuell
on_ventilator_cumulative smallint 677 411 412 Totalt antal personer som vårdats med respirator på grund av COVID-19 hittills, inklusive de som har tillfrisknat eller avlidit.
on_ventilator_currently smallint 837 4 10 Antal personer som vårdas med respirator på grund av COVID-19 den här dagen.
väntande smallint 944 2 17 Antal utförda tester som inte har analyserats ännu.
pos_neg heltal 18,282 2140 2 Inaktuell
positivt heltal 16,837 2 1 Totalt antal personer som har testats positivt för COVID-19 hittills.
positive_increase smallint 4,754 1 2 Inaktuell
Återskapade heltal 8,286 29 19 Totalt antal personer som har friskförklarats från COVID-19 hittills.
tillstånd string 56 MI PA Kod för regionen (två bokstäver).
summa heltal 18,283 2140 2 Inaktuell
total_test_results heltal 18,648 2140 3 Totalt antal testresultat som tillhandahållits av delstaten
total_test_results_increase heltal 13,463 1 2 Inaktuell

Förhandsversion

datum tillstånd positivt hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hasch date_checked död Sjukhus summa total_test_results pos_neg Fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negativt in_icu_cumulative on_ventilator_cumulative Återskapade in_icu_currently
2021-03-07 AK 56886 33 1293 2 NULL 2021-03-05 03:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 2021-03-05 03:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 2021-04-26 12:06:49 USA
2021-03-07 AL 499819 494 45976 NULL 2021-03-07 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 2021-03-07 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 2021-04-26 12:06:49 USA 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 NULL 2021-03-07 12:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 2021-03-07 12:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 2021-04-26 12:06:49 USA 2480716 1533 315517 141
2021-03-07 AS 0 null 12/1/2020 12:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 12/1/2020 12:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 2021-04-26 12:06:49 USA 2140
2021-03-07 AZ 826454 963 57907 143 NULL 2021-03-07 12:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 2021-03-07 12:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 2021-04-26 12:06:49 USA 3073010 273
2021-03-07 CA 3501394 4291 NULL 2021-03-07 02:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 2021-03-07 02:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 2021-04-26 12:06:49 USA 1159
2021-03-07 CO 436602 326 23904 NULL 2021-03-07 01:59:00 444746cda3a596f183f3fa3269c8cab68704e819 2021-03-07 01:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 2021-04-26 12:06:49 USA 2199458
2021-03-07 CT 285330 428 12257 NULL 2021-03-04 23:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 2021-03-04 23:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 2021-04-26 12:06:49 USA
2021-03-07 DC 41419 150 16 NULL 2021-03-06 12:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 2021-03-06 12:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 2021-04-26 12:06:49 USA 29570 38
2021-03-07 DE 88354 104 NULL 2021-03-06 18:00 059d870e689d5cc19c35f5eb398214d7d9856373 2021-03-06 18:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 2021-04-26 12:06:49 USA 545070 13

Dataåtkomst

Azure Notebooks

URL:er för olika datauppsättningsfilformat som finns i Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Ladda ned datamängdsfilen med hjälp av den inbyggda funktionsnedladdningen från en http-URL i Pandas. Pandas har läsare för olika filformat:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Exempel är inte tillgängligt för den här kombinationen av plattform/paket.

Azure Synapse

Exempel är inte tillgängligt för den här kombinationen av plattform/paket.

Nästa steg

Visa resten av datauppsättningarna i katalogen Öppna datamängder.