COVID Tracking Project
O conjunto de dados do COVID Tracking Project fornece os números mais recentes sobre testes, casos confirmados, hospitalizações e resultados de pacientes de cada estado e território dos EUA.
Para obter mais informações sobre esses conjuntos de dados, consulte o projeto repositório GitHub.
Observação
A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.
Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.
Conjunto de dados
As versões alteradas do conjunto de dados estão disponíveis em CSV, JSON, JSON-Lines e Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Todas as versões alteradas têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados e usam nomes de coluna em minúsculas com sublinhados como separadores.
Dados brutos: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json '
Versões anteriores de dados brutos e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Volume de dados
Todos os conjuntos de dados são atualizados diariamente. Em 13 de maio de 2020, eles continham 4.100 linhas (com 574 KB em CSV, com 1,8 MB em JSON, com 1,8 MB em JSONL e com 334 KB em Parquet).
Fonte de dados
Esses dados foram publicados originalmente pelo COVID Tracking Project do Atlantic. Os dados brutos são ingeridos do repositório COVID Tracking GitHub usando o arquivo states_daily_4p_et.csv. Para obter mais informações sobre esses conjuntos de dados, incluindo suas origens da API do COVID Tracking Project, consulte o projeto repositório GitHub.
Qualidade dos dados
O COVID Tracking Project classifica a qualidade dos dados de cada estado e fornece mais informações sobre essa classificação. Para obter mais informações, consulte a página de dados do COVID Tracking Project. Os dados no repositório GitHub podem ter um atraso de uma hora em relação à API; o uso da API é necessário para acessar os dados mais recentes.
Atribuição de licença e direitos de uso
Esses dados são licenciados de acordo com os termos e condições do Apache License 2.0.
Qualquer uso dos dados precisa reter todas as notificações de direitos autorais, de marca, de patente e de atribuição.
Contact
Para dúvidas ou comentários sobre este ou outros conjuntos de dados no Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.
Colunas
Nome | Tipo de dados | Exclusivo | Valores (exemplo) | Descrição |
---|---|---|---|---|
date | date | 420 | 2020-11-10 2021-01-30 | Data para a qual os totais diários foram coletados. |
date_checked | string | 9\.487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Preterido |
morte | SMALLINT | 7\.327 | 2 5 | Número total de pessoas que faleceram por COVID-19 até o momento. |
death_increase | SMALLINT | 429 | 1 2 | Preterido |
fips | SMALLINT | 56 | 26 55 | Código FIPS do estado para o censo. |
fips_code | string | 60 | 53 25 | Código FIPS do estado para o censo. |
hash | string | 20.780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Um hash para este registro |
hospitalizado | INT | 7\.641 | 89995 4 | Preterido |
hospitalized_cumulative | INT | 7\.641 | 89995 4 | Número total de pessoas que foram hospitalizadas por COVID-19 até o momento, incluindo aquelas que se recuperaram ou faleceram desde então. |
hospitalized_currently | SMALLINT | 3\.886 | 8 13 | Número de pessoas hospitalizadas por COVID-19 nesse dia. |
hospitalized_increase | SMALLINT | 615 | 1 2 | Preterido |
in_icu_cumulative | SMALLINT | 2\.295 | 990 220 | Número total de pessoas que foram internadas na UTI por COVID-19 até o momento, incluindo aquelas que se recuperaram ou faleceram desde então. |
in_icu_currently | SMALLINT | 1\.643 | 2 8 | Número total de pessoas na UTI por COVID-19 nesse dia. |
iso_country | string | 1 | EUA | Código do país ou da região ISO 3166 |
iso_subdivision | string | 57 | US-UM US-WA | Código de subdivisão ISO 3166 |
last_update_et | timestamp | 9\.487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | Última vez que os dados do dia foram atualizados |
load_time | timestamp | 1 | 2021-04-26 00:06:49.883000 | Data e hora em que os dados foram carregados no Azure por meio da fonte |
negativo | INT | 10.864 | 305972 2140 | Número total de pessoas que testaram negativo para a COVID-19 até o momento. |
negative_increase | INT | 7\.328 | 6 17 | Preterido |
on_ventilator_cumulative | SMALLINT | 677 | 411 412 | Número total de pessoas que usaram um ventilador para tratamento da COVID-19 até o momento, incluindo aquelas que se recuperaram ou faleceram desde então. |
on_ventilator_currently | SMALLINT | 837 | 4 10 | Número de pessoas que estão usando um ventilador pulmonar para tratamento da COVID-19 nesse dia. |
pending | SMALLINT | 944 | 2 17 | Número de testes cujos resultados ainda não foram determinados. |
pos_neg | INT | 18.282 | 2140 2 | Preterido |
positivo | INT | 16.837 | 2 1 | Número total de pessoas que testaram positivo para a COVID-19 até o momento. |
positive_increase | SMALLINT | 4\.754 | 1 2 | Preterido |
recuperados | INT | 8\.286 | 29 19 | Número total de pessoas que se recuperaram da COVID-19 até o momento. |
state | string | 56 | PA MI | Código de duas letras do estado. |
total | INT | 18.283 | 2140 2 | Preterido |
total_test_results | INT | 18.648 | 2140 3 | Total de resultados de teste fornecidos pelo Estado |
total_test_results_increase | INT | 13.463 | 1 2 | Preterido |
Versão Prévia
date | state | positivo | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | morte | hospitalizado | total | total_test_results | pos_neg | fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negativo | in_icu_cumulative | on_ventilator_cumulative | recuperados | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 05/03/2021 03:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 05/03/2021 03:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26/04/2021 00:06:49 | EUA | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | nulo | 07/03/2021 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 07/03/2021 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 26/04/2021 00:06:49 | EUA | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | nulo | 07/03/2021 00:00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 07/03/2021 00:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26/04/2021 00:06:49 | EUA | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | nulo | 01/12/2020 00:00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 01/12/2020 00:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 26/04/2021 00:06:49 | EUA | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | nulo | 07/03/2021 00:00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 07/03/2021 00:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 26/04/2021 00:06:49 | EUA | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | nulo | 07/03/2021 02:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 07/03/2021 02:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 26/04/2021 00:06:49 | EUA | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | nulo | 07/03/2021 01:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 07/03/2021 01:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26/04/2021 00:06:49 | EUA | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | nulo | 04/03/2021 23:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 04/03/2021 23:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26/04/2021 00:06:49 | EUA | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | nulo | 06/03/2021 00:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 06/03/2021 00:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26/04/2021 00:06:49 | EUA | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | nulo | 06/03/2021 18:00:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 06/03/2021 18:00:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 26/04/2021 00:06:49 | EUA | 545070 | 13 |
Acesso de dados
Azure Notebooks
URLs de diferentes formatos de arquivo de conjuntos de dados hospedados no Armazenamento de Blobs do Azure:
Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL http no Pandas. O Pandas tem leitores para vários formatos de arquivo:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Exemplo não disponível para essa combinação de plataforma/pacote.
Azure Synapse
Exemplo não disponível para essa combinação de plataforma/pacote.
Próximas etapas
Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.