Udostępnij za pośrednictwem


Projekt śledzenia covid

Zestaw danych organizacji COVID Tracking Project udostępnia najnowszą liczbę wykonanych testów, potwierdzonych przypadków, hospitalizacji i wyników pacjentów z każdego stanu i terytorium USA.

Aby uzyskać więcej informacji na temat tego zestawu danych, zobacz repozytorium GitHub projektu.

Uwaga

Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.

Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.

Zestawy danych

Zmodyfikowane wersje zestawu danych są dostępne w formatach CSV, JSON, JSON-Lines i Parquet.

Wszystkie zmodyfikowane wersje mają dodane czasy ładowania i kody poddziałów standardu ISO 3166 oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.

Nieprzetworzone dane: "https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json"

Poprzednie wersje danych zmodyfikowanych i pierwotnych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Ilość danych

Wszystkie zestawy danych są codziennie aktualizowane. Na dzień 13 maja 2020 r. zawierały 4100 wierszy (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).

Źródło danych

Te dane zostały oryginalnie opublikowane przez organizację COVID Tracking Project w witrynie Atlantic. Nieprzetworzone dane są pozyskiwane z repozytorium GitHub COVID Tracking przy użyciu pliku states_daily_4p_et.csv. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym jego źródła z interfejsu API projektu śledzenia COVID, zobacz repozytorium GitHub projektu.

Jakość danych

Aplikacja COVID Tracking Project ocenia jakość danych dla każdego stanu i zawiera dodatkowe informacje o ich ocenie jakości danych. Aby uzyskać więcej informacji, zobacz stronę Dane projektu śledzenia COVID. Dane w repozytorium GitHub mogą być opóźnione o godzinę w stosunku do interfejsu API. Użycie interfejsu API jest niezbędne, aby uzyskać dostęp do najnowszych danych.

Przypisywanie praw do licencji i użytkowania

Te dane są licencjonowane zgodnie z warunkami i postanowieniami licencji Apache License 2.0.

Wszelkie zastosowania danych muszą zachować wszystkie uwagi dotyczące praw autorskich, patentów, znaków towarowych i autorstwa.

Kontakt biznesowy

W przypadku pytań lub opinii dotyczących tego lub innych zestawów danych w usłudze COVID-19 Data Lake skontaktuj się z .askcovid19dl@microsoft.com

Kolumny

Nazwisko Typ danych Unikatowe Wartości (przykładowe) opis
data data 420 2020-11-10 2021-01-30 Data, dla której zebrano dzienne sumy.
date_checked string 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Przestarzałe
śmierć smallint 7,327 2 5 Łączna liczba osób, które zmarły z powodu COVID-19.
death_increase smallint 429 1 2 Przestarzałe
Fips smallint 56 26 55 Kod FIPS stanu ze spisu powszechnego.
fips_code string 60 53 25 Kod FIPS stanu ze spisu powszechnego.
hash string 20,780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Skrót dla tego rekordu
Hospitalizowany int 7,641 89995 4 Przestarzałe
hospitalized_cumulative int 7,641 89995 4 Łączna liczba osób leczonych dotychczas w szpitalach z powodu COVID-19, z uwzględnieniem osób, które wyzdrowiały lub zmarły.
hospitalized_currently smallint 3,886 8 13 Liczba osób przebywających w tym dniu w szpitalach z powodu COVID-19.
hospitalized_increase smallint 615 1 2 Przestarzałe
in_icu_cumulative smallint 2,295 990 220 Łączna liczba osób leczonych dotychczas w oddziałach intensywnej opieki medycznej z powodu COVID-19, z uwzględnieniem osób, które wyzdrowiały lub zmarły.
in_icu_currently smallint 1,643 2 8 Łączna liczba osób przebywających w tym dniu w oddziałach intensywnej opieki medycznej z powodu COVID-19.
iso_country string 1 — USA Kod kraju lub regionu w standardzie ISO 3166
iso_subdivision string 57 US-UM US-WA Kod poddziału w standardzie ISO 3166
last_update_et timestamp 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 Czas ostatniej aktualizacji danych dnia
load_time timestamp 1 2021-04-26 00:06:49.883000 Data i godzina załadowania danych ze źródła na platformę Azure
negative int 10,864 305972 2140 Łączna liczba osób, które uzyskały ujemny wynik testu w kierunku COVID-19.
negative_increase int 7,328 6 17 Przestarzałe
on_ventilator_cumulative smallint 677 411 412 Łączna liczba osób używających dotąd respiratora z powodu COVID-19, z uwzględnieniem osób, które wyzdrowiały lub zmarły.
on_ventilator_currently smallint 837 4 10 Liczba osób korzystających w tym dniu z respiratora z powodu COVID-19.
Oczekiwanie smallint 944 2 17 Liczba testów, których wyników jeszcze nie poznano.
pos_neg int 18,282 2140 2 Przestarzałe
positive int 16,837 2 1 Łączna liczba osób, które dotychczas uzyskały dodatni wynik testu w kierunku COVID-19.
positive_increase smallint 4,754 1 2 Przestarzałe
Odzyskane int 8,286 29 19 Łączna liczba osób, które dotychczas wyzdrowiały po przejściu COVID-19.
stan string 56 MI PA Dwuliterowy kod stanu.
total int 18,283 2140 2 Przestarzałe
total_test_results int 18,648 2140 3 Łączna liczba wyników testów przeprowadzonych przez władze państwowe
total_test_results_increase int 13,463 1 2 Przestarzałe

Podgląd

data stan positive hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked śmierć Hospitalizowany total total_test_results pos_neg Fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negative in_icu_cumulative on_ventilator_cumulative Odzyskane in_icu_currently
2021-03-07 AK 56886 33 1293 2 null 3/5/2021 3:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 3/5/2021 3:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26.04.2021 12:06:49 — USA
2021-03-07 AL 499819 494 45976 null 3/7/2021 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 3/7/2021 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 26.04.2021 12:06:49 — USA 1931711 2676 1515 295690
2021-03-07 rozrachunki z odbiorcami 324818 335 14926 65 null 3/7/2021 12:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 3/7/2021 12:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26.04.2021 12:06:49 — USA 2480716 1533 315517 141
2021-03-07 AS 0 null 12.1.2020 12:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 12.1.2020 12:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 STANY ZJEDNOCZONE —AS 26.04.2021 12:06:49 — USA 2140
2021-03-07 AZ 826454 963 57907 143 null 3/7/2021 12:00:00 0437a7a96f447166f775e63e86923eb5cbd8cdf 3/7/2021 12:00:00 16328 57907 3899464 7908105 3899464 100 5 44 13678 1335 45110 100 US-AZ 26.04.2021 12:06:49 — USA 3073010 273
2021-03-07 CA 3501394 4291 null 3/7/2021 2:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 3/7/2021 2:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 Us-CA 26.04.2021 12:06:49 — USA 1159
2021-03-07 CO 436602 326 23904 null 3/7/2021 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 3/7/2021 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26.04.2021 12:06:49 — USA 2199458
2021-03-07 CT 285330 428 12257 null 13.04.2021 11:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 13.04.2021 11:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26.04.2021 12:06:49 — USA
2021-03-07 Kontroler domeny 41419 150 16 null 3/6/2021 12:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 3/6/2021 12:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26.04.2021 12:06:49 — USA 29570 38
2021-03-07 DE 88354 104 null 3/6/2021 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 3/6/2021 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 STANY ZJEDNOCZONE-DE 26.04.2021 12:06:49 — USA 545070 13

Dostęp do danych

Azure Notebooks

Adresy URL różnych formatów plików zestawu danych hostowane w usłudze Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Azure Synapse

Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.

Następne kroki

Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).