European Centre for Disease Prevention and Control (ECDC) COVID-19 Cases
De meest recente openbare gegevens over geografische distributie van COVID-19-gevallen wereldwijd vanuit het European Center for Disease Prevention and Control (ECDC). Elke rij/vermelding bevat het aantal nieuwe gemelde gevallen per dag en per land of regio.
Notitie
Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevenssets
Gewijzigde versies van de gegevensset zijn beschikbaar als CSV, JSON, JSON-Lines en Parquet en worden dagelijks bijgewerkt:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Aan alle gewijzigde versies zijn iso_country_region-codes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.
Onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Gegevensvolume
Vanaf 28 mei 2020 bevatten de gegevenssets 19876 rijen (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 kB).
Gegevensbron
Onbewerkte gegevens worden dagelijks opgenomen uit het CSV-bestand van ECDC. Zie de pagina ECDC-gegevensverzameling voor meer informatie over deze gegevensset, inclusief de oorsprong ervan.
Gegevenskwaliteit
Het Europees Centrum voor ziektepreventie en -bestrijding biedt geen garantie voor de nauwkeurigheid of tijdigheid van de gegevens. Lees de disclaimer.
Licentie- en gebruiksrechten toewijzen
Deze gegevens worden beschikbaar gesteld en kunnen worden gebruikt zoals toegestaan onder het auteursrecht van het ECDC dat hier wordt beschreven. Voor alle documenten waarvoor het auteursrecht bij een derde partij ligt, moet toestemming worden verkregen van de auteursrechthebbende.
ECDC moet altijd worden erkend als de oorspronkelijke bron van deze gegevens. Deze bevestiging moet worden opgenomen in elk exemplaar van het materiaal.
Contactpersoon
Neem contact op met askcovid19dl@microsoft.com voor vragen of feedback over deze of andere gegevenssets in de COVID-19 Data Lake.
Kolommen
Naam | Gegevenstype | Uniek | Waarden (voorbeeld) | Beschrijving |
---|---|---|---|---|
cases | smallint | 5,515 | 1 2 | Aantal gerapporteerde gevallen |
continent_exp | tekenreeks | 6 | Europa Afrika | Naam continent |
countries_and_territories | tekenreeks | 214 | Canada België | Naam van land/regio of gebied |
country_territory_code | tekenreeks | 213 | KOR ISL | De code van drie letters voor land/regio of gebied |
date_rep | datum | 350 | 2020-12-11 2020-11-22 | De datum van het rapport |
dagen | smallint | 31 | 14 13 | Dag van de maand |
Sterfgevallen | smallint | 1049 | 1 2 | Aantal gerapporteerde sterfgevallen |
geo_id | tekenreeks | 214 | CA SE | Id van geografisch gebied |
iso_country | tekenreeks | 214 | SE US | ISO 3166-land- of regiocode |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | Datum waarop gegevens in Azure zijn geladen |
maand | smallint | 12 | 10 8 | Maandnummer |
jaar | smallint | 2 | 2020 2019 | Year |
Preview uitvoeren
date_rep | dagen | maand | jaar | cases | Sterfgevallen | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afghanistan | AF | AFG | Azië | 26-4-2021 12:06:22 uur | AF |
Toegang tot gegevens
Azure Notebooks
Dit notebook documenteert de URL's en voorbeeldcode voor toegang tot het European Centre for Disease Prevention and Control (ECDC) Covid-19 Cases gegevensset-URL's van verschillende gegevenssetbestandsindelingen die worden gehost in Azure Blob Storage:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid downloaden van een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.
Azure Synapse
Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.
Voorbeelden
Bekijk voorbeelden van hoe deze gegevensset kan worden gebruikt:
- COVID-gegevens analyseren met serverloos Synapse SQL-eindpunt
- Lineaire regressieanalyse op COVID-gegevens met behulp van SQL-eindpunt in Azure Synapse Analytics
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.