Partager via


Projet de suivi COVID

Le jeu de données du projet COVID Tracking fournit les derniers chiffres sur les tests, les cas confirmés, les hospitalisations et l’état des patients pour chaque État américain et l’ensemble du territoire.

Pour plus d’informations sur ce dataset, consultez le référentiel GitHub de projet.

Notes

Microsoft fournit Azure Open Datasets « en l’état ». Microsoft n’offre aucune garantie, expresse ou implicite, ni de conditions relatives à votre utilisation des jeux de données. Dans la mesure autorisée par votre droit local, Microsoft décline toute responsabilité pour les dommages ou pertes, y compris directs, consécutifs, spéciaux, indirects ou punitifs, résultant de votre utilisation des jeux de données.

Ce jeu de données est fourni selon les conditions initiales par lesquelles Microsoft a reçu les données sources. Le jeu de données peut inclure des données provenant de Microsoft.

Groupes de données

Des versions modifiées du jeu de données sont disponibles aux formats CSV, JSON, JSON-Lines et Parquet.

Toutes les versions modifiées du jeu de données se sont vu ajouter des codes de subdivision ISO 3166 et des temps de chargement, et utilisent des noms de colonnes en minuscules avec des séparateurs de soulignement.

Données brutes : « https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json  »

Versions précédentes des données modifiées et brutes : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Volume de données

Tous les jeux de données sont mis à jour quotidiennement. Au 13 mai 2020, ils contenaient 4 100 lignes (CSV 574 Ko, JSON 1,8 Mo, JSONL 1,8 Mo, Parquet 334 Ko).

Paramètres

Ces données sont à l’origine publiées par le COVID Tracking Project at the Atlantic. Les données brutes sont ingérées à partir du référentiel GitHub du COVID à l’aide du states_daily_4p_et.csv file. Pour plus d’informations sur ce jeu de données, y compris son origine à partir de l’API de suivi COVID, consultez le référentiel GitHub du projet.

Qualité des données

Le projet COVID Tracking note la qualité des données pour chaque État et fournit d’autres informations sur l’évaluation de la qualité des données. Pour plus d’informations, consultez la page de projet des données de suivi de COVID. Les données du dépôt GitHub peuvent avoir une heure de retard sur l’API ; l’utilisation de l’API est nécessaire pour accéder aux données les plus récentes.

Attribution des licences et des droits d’utilisation

Ces données sont concédées sous licence selon les termes et conditions de la licence Apache 2.0.

Toute utilisation des données doit conserver tous les avis de droit d’auteur, de brevet, de marque et d’attribution.

Contact

Pour toute question ou tout commentaire sur ce jeu de données ou sur d’autres jeux de données dans le lac de données COVID-19, contactez askcovid19dl@microsoft.com.

Colonnes

Nom Type de données Unique Valeurs (exemple) Description
Date Date 420 2020-11-10 2021-01-30 Date pour laquelle les totaux quotidiens ont été recueillis.
date_checked string 9 487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Déprécié
death SMALLINT 7 327 2 5 Nombre total de personnes décédées des suites de la COVID-19 à ce jour.
death_increase SMALLINT 429 1 2 Déprécié
fips SMALLINT 56 26 55 Code FIPS de recensement de l'État.
fips_code string 60 53 25 Code FIPS de recensement de l'État.
Hachage string 20 780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Code de hachage de cet enregistrement
hospitalized int 7 641 89995 4 Déprécié
hospitalized_cumulative int 7 641 89995 4 Nombre total de personnes hospitalisées pour COVID-19 à ce jour (personnes guéries et décédées comprises).
hospitalized_currently SMALLINT 3 886 8 13 Nombre de malades de la COVID-19 hospitalisés ce jour-là.
hospitalized_increase SMALLINT 615 1 2 Déprécié
in_icu_cumulative SMALLINT 2 295 990 220 Nombre total de malades de la COVID-19 qui ont été hospitalisées en réanimation à ce jour (personnes guéries et décédées comprises).
in_icu_currently SMALLINT 1 643 2 8 Nombre total de malades de la COVID-19 hospitalisés en réanimation ce jour-là.
iso_country string 1 US Code pays ou région ISO 3166
iso_subdivision string 57 US-UM US-WA Code de sous-division ISO 3166
last_update_et timestamp 9 487 2020-12-01 00:00:00 2020-09-01 00:00:00 Dernière mise à jour des données du jour
load_time timestamp 1 2021-04-26 00:06:49.883000 Date et heure auxquelles les données ont été chargées dans Azure à partir de la source
négatif int 10 864 305972 2140 Nombre total de personnes ayant été testées négatives à la COVID-19 à ce jour.
negative_increase int 7 328 6 17 Déprécié
on_ventilator_cumulative SMALLINT 677 411 412 Nombre total de malades de la COVID-19 qui ont été placés sous respirateur à ce jour (personnes guéries et décédées comprises).
on_ventilator_currently SMALLINT 837 4 10 Nombre de malades de la COVID-19 placés sous respirateur ce jour-là.
en attente SMALLINT 944 2 17 Nombre de tests dont les résultats restent à déterminer.
pos_neg int 18 282 2140 2 Déprécié
positif int 16 837 2 1 Nombre total de personnes ayant été testées positives à la COVID-19 à ce jour.
positive_increase SMALLINT 4 754 1 2 Déprécié
recovered int 8 286 29 19 Nombre total de personnes qui se sont remises de la COVID-19 à ce jour.
state string 56 MI PA Code à deux lettres de l'État.
total int 18 283 2140 2 Déprécié
total_test_results int 18 648 2140 3 Nombre total de résultats de test par État
total_test_results_increase int 13 463 1 2 Déprécié

Préversion

Date state positif hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked death hospitalized total total_test_results pos_neg fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country négatif in_icu_cumulative on_ventilator_cumulative recovered in_icu_currently
2021-03-07 AK 56886 33 1293 2 null 05/03/2021 3:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 05/03/2021 3:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26/04/2021 00:06:49 US
2021-03-07 AL 499819 494 45976 null 07/03/2021 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 07/03/2021 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 26/04/2021 00:06:49 US 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 null 07/03/2021 00:00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 07/03/2021 00:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26/04/2021 00:06:49 US 2480716 1533 315517 141
2021-03-07 AS 0 null 01/12/2020 00:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 01/12/2020 00:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 26/04/2021 00:06:49 US 2140
2021-03-07 AZ 826454 963 57907 143 null 07/03/2021 00:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 07/03/2021 00:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 26/04/2021 00:06:49 US 3073010 273
2021-03-07 CA 3501394 4291 null 03/07/2021 2:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 03/07/2021 2:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 26/04/2021 00:06:49 US 1159
2021-03-07 CO 436602 326 23904 null 07/03/2021 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 07/03/2021 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26/04/2021 00:06:49 US 2199458
2021-03-07 CT 285330 428 12257 null 04/03/2021 23:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 04/03/2021 23:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26/04/2021 00:06:49 US
2021-03-07 DC 41419 150 16 null 06/03/2021 00:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 06/03/2021 00:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26/04/2021 00:06:49 US 29570 38
2021-03-07 DE 88354 104 null 06/03/2021 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 06/03/2021 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 26/04/2021 00:06:49 US 545070 13

Accès aux données

Azure Notebooks

URL de différents formats de fichiers de jeux de données hébergés sur Stockage Blob Azure :

CSV : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet : https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Téléchargez le fichier de jeu de données à l’aide de la capacité intégrée permettant de télécharger à partir d’une URL HTTP dans Pandas. Pandas comprend des visionneuses pour différents formats de fichiers :

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Exemple non disponible pour cette combinaison de plateforme et de package.

Azure Synapse

Exemple non disponible pour cette combinaison de plateforme et de package.

Étapes suivantes

Consultez les autres jeux de données du catalogue Open Datasets.