Projekt śledzenia covid
Zestaw danych organizacji COVID Tracking Project udostępnia najnowszą liczbę wykonanych testów, potwierdzonych przypadków, hospitalizacji i wyników pacjentów z każdego stanu i terytorium USA.
Aby uzyskać więcej informacji na temat tego zestawu danych, zobacz repozytorium GitHub projektu.
Uwaga
Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Zestawy danych
Zmodyfikowane wersje zestawu danych są dostępne w formatach CSV, JSON, JSON-Lines i Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Wszystkie zmodyfikowane wersje mają dodane czasy ładowania i kody poddziałów standardu ISO 3166 oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.
Nieprzetworzone dane: "https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json"
Poprzednie wersje danych zmodyfikowanych i pierwotnych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Ilość danych
Wszystkie zestawy danych są codziennie aktualizowane. Na dzień 13 maja 2020 r. zawierały 4100 wierszy (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).
Źródło danych
Te dane zostały oryginalnie opublikowane przez organizację COVID Tracking Project w witrynie Atlantic. Nieprzetworzone dane są pozyskiwane z repozytorium GitHub COVID Tracking przy użyciu pliku states_daily_4p_et.csv. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym jego źródła z interfejsu API projektu śledzenia COVID, zobacz repozytorium GitHub projektu.
Jakość danych
Aplikacja COVID Tracking Project ocenia jakość danych dla każdego stanu i zawiera dodatkowe informacje o ich ocenie jakości danych. Aby uzyskać więcej informacji, zobacz stronę Dane projektu śledzenia COVID. Dane w repozytorium GitHub mogą być opóźnione o godzinę w stosunku do interfejsu API. Użycie interfejsu API jest niezbędne, aby uzyskać dostęp do najnowszych danych.
Przypisywanie praw do licencji i użytkowania
Te dane są licencjonowane zgodnie z warunkami i postanowieniami licencji Apache License 2.0.
Wszelkie zastosowania danych muszą zachować wszystkie uwagi dotyczące praw autorskich, patentów, znaków towarowych i autorstwa.
Kontakt biznesowy
W przypadku pytań lub opinii dotyczących tego lub innych zestawów danych w usłudze COVID-19 Data Lake skontaktuj się z .askcovid19dl@microsoft.com
Kolumny
Nazwisko | Typ danych | Unikatowe | Wartości (przykładowe) | opis |
---|---|---|---|---|
data | data | 420 | 2020-11-10 2021-01-30 | Data, dla której zebrano dzienne sumy. |
date_checked | string | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Przestarzałe |
śmierć | smallint | 7,327 | 2 5 | Łączna liczba osób, które zmarły z powodu COVID-19. |
death_increase | smallint | 429 | 1 2 | Przestarzałe |
Fips | smallint | 56 | 26 55 | Kod FIPS stanu ze spisu powszechnego. |
fips_code | string | 60 | 53 25 | Kod FIPS stanu ze spisu powszechnego. |
hash | string | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Skrót dla tego rekordu |
Hospitalizowany | int | 7,641 | 89995 4 | Przestarzałe |
hospitalized_cumulative | int | 7,641 | 89995 4 | Łączna liczba osób leczonych dotychczas w szpitalach z powodu COVID-19, z uwzględnieniem osób, które wyzdrowiały lub zmarły. |
hospitalized_currently | smallint | 3,886 | 8 13 | Liczba osób przebywających w tym dniu w szpitalach z powodu COVID-19. |
hospitalized_increase | smallint | 615 | 1 2 | Przestarzałe |
in_icu_cumulative | smallint | 2,295 | 990 220 | Łączna liczba osób leczonych dotychczas w oddziałach intensywnej opieki medycznej z powodu COVID-19, z uwzględnieniem osób, które wyzdrowiały lub zmarły. |
in_icu_currently | smallint | 1,643 | 2 8 | Łączna liczba osób przebywających w tym dniu w oddziałach intensywnej opieki medycznej z powodu COVID-19. |
iso_country | string | 1 | — USA | Kod kraju lub regionu w standardzie ISO 3166 |
iso_subdivision | string | 57 | US-UM US-WA | Kod poddziału w standardzie ISO 3166 |
last_update_et | timestamp | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | Czas ostatniej aktualizacji danych dnia |
load_time | timestamp | 1 | 2021-04-26 00:06:49.883000 | Data i godzina załadowania danych ze źródła na platformę Azure |
negative | int | 10,864 | 305972 2140 | Łączna liczba osób, które uzyskały ujemny wynik testu w kierunku COVID-19. |
negative_increase | int | 7,328 | 6 17 | Przestarzałe |
on_ventilator_cumulative | smallint | 677 | 411 412 | Łączna liczba osób używających dotąd respiratora z powodu COVID-19, z uwzględnieniem osób, które wyzdrowiały lub zmarły. |
on_ventilator_currently | smallint | 837 | 4 10 | Liczba osób korzystających w tym dniu z respiratora z powodu COVID-19. |
Oczekiwanie | smallint | 944 | 2 17 | Liczba testów, których wyników jeszcze nie poznano. |
pos_neg | int | 18,282 | 2140 2 | Przestarzałe |
positive | int | 16,837 | 2 1 | Łączna liczba osób, które dotychczas uzyskały dodatni wynik testu w kierunku COVID-19. |
positive_increase | smallint | 4,754 | 1 2 | Przestarzałe |
Odzyskane | int | 8,286 | 29 19 | Łączna liczba osób, które dotychczas wyzdrowiały po przejściu COVID-19. |
stan | string | 56 | MI PA | Dwuliterowy kod stanu. |
total | int | 18,283 | 2140 2 | Przestarzałe |
total_test_results | int | 18,648 | 2140 3 | Łączna liczba wyników testów przeprowadzonych przez władze państwowe |
total_test_results_increase | int | 13,463 | 1 2 | Przestarzałe |
Podgląd
data | stan | positive | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | śmierć | Hospitalizowany | total | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negative | in_icu_cumulative | on_ventilator_cumulative | Odzyskane | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 3/5/2021 3:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 3/5/2021 3:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26.04.2021 12:06:49 | — USA | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | null | 3/7/2021 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 3/7/2021 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 26.04.2021 12:06:49 | — USA | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | rozrachunki z odbiorcami | 324818 | 335 | 14926 | 65 | null | 3/7/2021 12:00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 3/7/2021 12:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26.04.2021 12:06:49 | — USA | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 12.1.2020 12:00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 12.1.2020 12:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | STANY ZJEDNOCZONE —AS | 26.04.2021 12:06:49 | — USA | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | null | 3/7/2021 12:00:00 | 0437a7a96f447166f775e63e86923eb5cbd8cdf | 3/7/2021 12:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 100 | 5 | 44 | 13678 | 1335 | 45110 | 100 | US-AZ | 26.04.2021 12:06:49 | — USA | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | null | 3/7/2021 2:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 3/7/2021 2:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | Us-CA | 26.04.2021 12:06:49 | — USA | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | null | 3/7/2021 1:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 3/7/2021 1:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26.04.2021 12:06:49 | — USA | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | null | 13.04.2021 11:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 13.04.2021 11:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26.04.2021 12:06:49 | — USA | ||||||
2021-03-07 | Kontroler domeny | 41419 | 150 | 16 | null | 3/6/2021 12:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 3/6/2021 12:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26.04.2021 12:06:49 | — USA | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | null | 3/6/2021 18:00:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 3/6/2021 18:00:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | STANY ZJEDNOCZONE-DE | 26.04.2021 12:06:49 | — USA | 545070 | 13 |
Dostęp do danych
Azure Notebooks
Adresy URL różnych formatów plików zestawu danych hostowane w usłudze Azure Blob Storage:
Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Azure Synapse
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).