Delen via


European Centre for Disease Prevention and Control (ECDC) COVID-19 Cases

De meest recente openbare gegevens over geografische distributie van COVID-19-gevallen wereldwijd vanuit het European Center for Disease Prevention and Control (ECDC). Elke rij/vermelding bevat het aantal nieuwe gemelde gevallen per dag en per land of regio.

Notitie

Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.

Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.

Gegevenssets

Gewijzigde versies van de gegevensset zijn beschikbaar als CSV, JSON, JSON-Lines en Parquet en worden dagelijks bijgewerkt:

Aan alle gewijzigde versies zijn iso_country_region-codes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.

Onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Gegevensvolume

Vanaf 28 mei 2020 bevatten de gegevenssets 19876 rijen (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 kB).

Gegevensbron

Onbewerkte gegevens worden dagelijks opgenomen uit het CSV-bestand van ECDC. Zie de pagina ECDC-gegevensverzameling voor meer informatie over deze gegevensset, inclusief de oorsprong ervan.

Gegevenskwaliteit

Het Europees Centrum voor ziektepreventie en -bestrijding biedt geen garantie voor de nauwkeurigheid of tijdigheid van de gegevens. Lees de disclaimer.

Licentie- en gebruiksrechten toewijzen

Deze gegevens worden beschikbaar gesteld en kunnen worden gebruikt zoals toegestaan ​​onder het auteursrecht van het ECDC dat hier wordt beschreven. Voor alle documenten waarvoor het auteursrecht bij een derde partij ligt, moet toestemming worden verkregen van de auteursrechthebbende.

ECDC moet altijd worden erkend als de oorspronkelijke bron van deze gegevens. Deze bevestiging moet worden opgenomen in elk exemplaar van het materiaal.

Contactpersoon

Neem contact op met askcovid19dl@microsoft.com voor vragen of feedback over deze of andere gegevenssets in de COVID-19 Data Lake.

Kolommen

Naam Gegevenstype Uniek Waarden (voorbeeld) Beschrijving
cases smallint 5,515 1 2 Aantal gerapporteerde gevallen
continent_exp tekenreeks 6 Europa Afrika Naam continent
countries_and_territories tekenreeks 214 Canada België Naam van land/regio of gebied
country_territory_code tekenreeks 213 KOR ISL De code van drie letters voor land/regio of gebied
date_rep datum 350 2020-12-11 2020-11-22 De datum van het rapport
dagen smallint 31 14 13 Dag van de maand
Sterfgevallen smallint 1049 1 2 Aantal gerapporteerde sterfgevallen
geo_id tekenreeks 214 CA SE Id van geografisch gebied
iso_country tekenreeks 214 SE US ISO 3166-land- of regiocode
load_date timestamp 1 2021-04-26 00:06:22.123000 Datum waarop gegevens in Azure zijn geladen
maand smallint 12 10 8 Maandnummer
jaar smallint 2 2020 2019 Year

Preview uitvoeren

date_rep dagen maand jaar cases Sterfgevallen countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-13 13 12 2020 298 9 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-12 12 12 2020 113 11 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-11 11 12 2020 63 10 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-10 10 12 2020 202 16 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-09 9 12 2020 135 13 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-08 8 12 2020 200 6 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-07 7 12 2020 210 26 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-06 6 12 2020 234 10 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF
2020-12-05 5 12 2020 235 18 Afghanistan AF AFG Azië 26-4-2021 12:06:22 uur AF

Toegang tot gegevens

Azure Notebooks

Dit notebook documenteert de URL's en voorbeeldcode voor toegang tot het European Centre for Disease Prevention and Control (ECDC) Covid-19 Cases gegevensset-URL's van verschillende gegevenssetbestandsindelingen die worden gehost in Azure Blob Storage:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid downloaden van een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.

Azure Synapse

Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.

Voorbeelden

Bekijk voorbeelden van hoe deze gegevensset kan worden gebruikt:

Volgende stappen

Bekijk de rest van de gegevenssets in de catalogus Open Datasets.