COVID-spårningsprojekt
Datamängden COVID Tracking Project innehåller den senaste statistiken om tester, bekräftade fall, sjukhusinläggningar och patientresultat från varje delstat och territorium i USA.
Mer information om den här datamängden finns i projektets GitHub-lagringsplats.
Kommentar
Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.
Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.
Datauppsättningar
Modifierade versioner av datamängden finns i formaten CSV, JSON, JSON-Lines och Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
För alla modifierade versioner har ISO 3166-delkoder och inläsningstider lagts till, och kolumnnamnen visas i gemener med understreck som avgränsare.
Rådata: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
Tidigare versioner av modifierade data och rådata: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Datavolym
Alla datauppsättningar uppdateras dagligen. Den 13 maj 2020 innehöll de 4 100 rader (574 KB som CSV, 1,8 MB som JSON, 1,8 MB som JSONL och 334 KB som Parquet).
Data source
Dessa data publicerades ursprungligen av COVID Tracking Project från tidskriften The Atlantic. Rådata matas in från COVID Tracking GitHub-lagringsplatsen med hjälp av states_daily_4p_et.csv-filen. Mer information om den här datamängden, inklusive dess ursprung från COVID Tracking Project API, finns i projektets GitHub-lagringsplats.
Datakvalitet
COVID Tracking Project bedömer datakvaliteten för varje tillstånd och ger ytterligare information om deras bedömning av datakvaliteten. Mer information finns på sidan COVID Tracking Project-data. De data som finns i GitHub-lagringsplatsen kan vara en timme efter data i API:et. Du bör därför använda data från API:et för att få tillgång till de senaste data.
Tilldelning av licens- och användningsrättigheter
Dessa data licensieras enligt villkoren i Apache License 2.0.
All användning av data måste behålla alla meddelanden om upphovsrätt, patent, varumärken och tillskrivning.
Kontakt
Om du vill ha frågor eller feedback om den här eller andra datamängder i COVID-19 Data Lake kontaktar du askcovid19dl@microsoft.com.
Kolumner
Name | Datatyp | Unik | Värden (exempel) | beskrivning |
---|---|---|---|---|
datum | datum | 420 | 2020-11-10 2021-01-30 | Datum då data om totalt belopp för dagen samlades in. |
date_checked | sträng | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Inaktuell |
död | smallint | 7,327 | 2 5 | Totalt antal personer som har avlidit på grund av COVID-19 hittills. |
death_increase | smallint | 429 | 1 2 | Inaktuell |
Fips | smallint | 56 | 26 55 | Census FIPS-kod för delstaten. |
fips_code | sträng | 60 | 53 25 | Census FIPS-kod för delstaten. |
hasch | sträng | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493dd | Hash för denna post |
Sjukhus | heltal | 7,641 | 89995 4 | Inaktuell |
hospitalized_cumulative | heltal | 7,641 | 89995 4 | Totalt antal personer som varit inlagda på sjukhus med COVID-19 hittills, inklusive de som har tillfrisknat eller avlidit. |
hospitalized_currently | smallint | 3,886 | 8 13 | Totalt antal personer som är inlagda på sjukhus med COVID-19 den här dagen. |
hospitalized_increase | smallint | 615 | 1 2 | Inaktuell |
in_icu_cumulative | smallint | 2,295 | 990 220 | Totalt antal inlagda patienter på IVA på grund av COVID-19 hittills, inklusive de som har tillfrisknat eller avlidit. |
in_icu_currently | smallint | 1,643 | 2 8 | Totalt antal personer inlagda på IVA med COVID-19 den här dagen. |
iso_country | sträng | 1 | USA | Lands- eller regionkod (ISO 3166) |
iso_subdivision | sträng | 57 | US-UM US-WA | Landskod (ISO 3166) |
last_update_et | timestamp | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | Senaste gången dagens data uppdaterades |
load_time | timestamp | 1 | 2021-04-26 00:06:49.883000 | Datum och tid då data lästes in i Azure från källan |
negativt | heltal | 10,864 | 305972 2140 | Totalt antal personer som har testats negativt för COVID-19 hittills. |
negative_increase | heltal | 7,328 | 6 17 | Inaktuell |
on_ventilator_cumulative | smallint | 677 | 411 412 | Totalt antal personer som vårdats med respirator på grund av COVID-19 hittills, inklusive de som har tillfrisknat eller avlidit. |
on_ventilator_currently | smallint | 837 | 4 10 | Antal personer som vårdas med respirator på grund av COVID-19 den här dagen. |
väntande | smallint | 944 | 2 17 | Antal utförda tester som inte har analyserats ännu. |
pos_neg | heltal | 18,282 | 2140 2 | Inaktuell |
positivt | heltal | 16,837 | 2 1 | Totalt antal personer som har testats positivt för COVID-19 hittills. |
positive_increase | smallint | 4,754 | 1 2 | Inaktuell |
Återskapade | heltal | 8,286 | 29 19 | Totalt antal personer som har friskförklarats från COVID-19 hittills. |
tillstånd | string | 56 | MI PA | Kod för regionen (två bokstäver). |
summa | heltal | 18,283 | 2140 2 | Inaktuell |
total_test_results | heltal | 18,648 | 2140 3 | Totalt antal testresultat som tillhandahållits av delstaten |
total_test_results_increase | heltal | 13,463 | 1 2 | Inaktuell |
Förhandsversion
datum | tillstånd | positivt | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hasch | date_checked | död | Sjukhus | summa | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negativt | in_icu_cumulative | on_ventilator_cumulative | Återskapade | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | NULL | 2021-03-05 03:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 2021-03-05 03:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 2021-04-26 12:06:49 | USA | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | NULL | 2021-03-07 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 2021-03-07 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 2021-04-26 12:06:49 | USA | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | NULL | 2021-03-07 12:00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 2021-03-07 12:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 2021-04-26 12:06:49 | USA | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 12/1/2020 12:00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 12/1/2020 12:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 2021-04-26 12:06:49 | USA | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | NULL | 2021-03-07 12:00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 2021-03-07 12:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 2021-04-26 12:06:49 | USA | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | NULL | 2021-03-07 02:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 2021-03-07 02:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 2021-04-26 12:06:49 | USA | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | NULL | 2021-03-07 01:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 2021-03-07 01:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 2021-04-26 12:06:49 | USA | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | NULL | 2021-03-04 23:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 2021-03-04 23:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 2021-04-26 12:06:49 | USA | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | NULL | 2021-03-06 12:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 2021-03-06 12:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 2021-04-26 12:06:49 | USA | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | NULL | 2021-03-06 18:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 2021-03-06 18:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 2021-04-26 12:06:49 | USA | 545070 | 13 |
Dataåtkomst
Azure Notebooks
URL:er för olika datauppsättningsfilformat som finns i Azure Blob Storage:
Ladda ned datamängdsfilen med hjälp av den inbyggda funktionsnedladdningen från en http-URL i Pandas. Pandas har läsare för olika filformat:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Azure Synapse
Exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Nästa steg
Visa resten av datauppsättningarna i katalogen Öppna datamängder.