Bing Daten zu COVID-19
Diese Bing-Daten zu COVID-19 enthalten bestätigte Fälle, Fälle mit tödlichem Verlauf und genesene Patienten aus allen Regionen. Sie werden täglich aktualisiert. Der Bing COVID-19 Tracker gibt diese Daten wieder.
Bing sammelt Daten aus mehreren vertrauenswürdigen und zuverlässigen Quellen, einschließlich:
- BNO News
- Center for Disease Control and Prevention (CDC)
- Nationale/regionale und staatliche Gesundheitsämter
- Wikipedia
- Weltgesundheitsorganisation (WHO)
- 24/7 Wall St.
Hinweis
Microsoft stellt Datasets der Plattform Azure Open Datasets auf einer „As is“-Basis (d. h. ohne Mängelgewähr) zur Verfügung. Microsoft übernimmt weder ausdrücklich noch stillschweigend die Gewährleistung für Ihre Nutzung der Datasets und sichert keinerlei Garantien oder Bedingungen zu. Soweit nach örtlich anwendbarem Recht zulässig, lehnt Microsoft jegliche Haftung für Schäden oder Verluste ab. Dies schließt direkte, indirekte, besondere oder zufällige Schäden oder Verluste sowie Folge- und Strafschäden und damit verbundene Verluste ein, die sich aus Ihrer Nutzung der Datasets ergeben.
Für die Bereitstellung dieses Datasets gelten die ursprünglichen Nutzungsbedingungen, unter denen Microsoft die Quelldaten bezogen hat. Das Dataset kann Daten von Microsoft enthalten.
Datasets
Die geänderten Bing-Datasets zu COVID-19 sind im CSV-, JSON-, JSON-Lines und Parquet-Format verfügbar:
Alle geänderten Datasets wurden mit ISO-3166-Unterteilungscodes und Ladezeiten versehen. Sie verwenden Spaltennamen in Kleinbuchstaben mit Trennzeichen in Form von Unterstrichen.
Frühere Versionen von geänderten und Rohdaten sind in dieser Ressource verfügbar.
Datenmenge
Alle Datasets erhalten tägliche Updates. Seit dem 5. März 2023 enthalten sie 4.766.737 Zeilen. Das Dataset ist in den folgenden Dateiformaten verfügbar:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Anerkennung der Lizenzbedingungen und Nutzungsrechte
Die Daten sind ausschließlich für akademische und Bildungszwecke unter diesen Geschäftsbedingungen verfügbar. Zu den erlaubten Zwecken gehören:
- Akademische Einrichtungen
- Behörden
- Medizinische Forschung
In Publikationen verwendete oder zitierte Daten müssen mit einem Zuordnungsverweis zum Bing COVID-19 Tracker und einem Link zu www.bing.com/covid gekennzeichnet werden.
Contact
Wenn Sie Fragen oder Feedback zu diesem oder anderen Datasets im COVID-19-Data Lake haben, wenden Sie sich an askcovid19dl@microsoft.com.
Spalten
Name | Datentyp | Eindeutig | Beispielwerte | BESCHREIBUNG |
---|---|---|---|---|
admin_region_1 | Zeichenfolge | 864 | Texas Georgia | Region in country_region |
admin_region_2 | Zeichenfolge | 3.143 | Washington County Jefferson County | Region in admin_region_1 |
bestätigt | INT | 120,692 | 1 2 | Bestätigte Todesfälle in der Region |
confirmed_change | INT | 12,120 | 1 2 | Änderungen an der Anzahl der bestätigten Fälle im Vergleich zum Vortag |
country_region | Zeichenfolge | 237 | Vereinigte Staaten – Indien | Land/Region |
Todesfälle | INT | 20,616 | 1 2 | Anzahl der Todesfälle in der Region |
deaths_change | SMALLINT | 1,981 | 1 2 | Änderungen an der Anzahl der Todesfälle im Vergleich zum Vortag |
id | INT | 1,783,534 | 742546 69019298 | Eindeutiger Bezeichner |
iso_subdivision | Zeichenfolge | 484 | US-TX US-GA | Zweiteiliger ISO-Teilgebietscode |
iso2 | Zeichenfolge | 226 | US IN | Ländercode (zwei Buchstaben) |
iso3 | Zeichenfolge | 226 | USA IND | Ländercode (drei Buchstaben) |
latitude | double | 5,675 | 42.28708 19.59852 | Breitengrad des Schwerpunkts der Region |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | Datum und Uhrzeit des Dateiuploads von der Bing-Quelle auf GitHub |
longitude | double | 5,693 | -2.5396 -155.5186 | Längengrad des Schwerpunkts der Region |
genesen | INT | 73,287 | 1 2 | Anzahl genesener Patienten in der Region |
recovered_change | INT | 10,441 | 1 2 | Änderungen an der Anzahl genesener Patienten im Vergleich zum Vortag |
aktualisiert | date | 457 | 2021-04-23 2021-04-22 | Datumsangabe für aktuellen Stand des Datensatzes |
Vorschau
id | aktualisiert | bestätigt | Todesfälle | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | ||
338996 | 2020-01-22 | 313 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 51 | 0 |
338997 | 23.01.2020 | 578 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 1472 | 0 |
339004 | 30.01.2020 | 7818 | 0 | NULL | NULL | Weltweit | NULL | NULL | NULL | 4/26/2021 00:06:34 Uhr | 1753 | 0 |
Datenzugriff - Azure Notebooks
Hinweis
In diesem Notebook werden die URLs und der Beispielcode für den Zugriff auf das Bing COVID-19-Dataset dokumentiert.
Verwenden Sie die diese URLs, um bestimmte Dateiformate zu erhalten, die auf Azure Blob Storage gehostet sind:
Laden Sie die Dataset-Datei mithilfe des integrierten Pandas-Downloads mit der HTTP-URL herunter. Pandas verfügt über Reader für verschiedene Dateiformate:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Um zu überprüfen, ob die aktualisierte Spalte das datetime-Format aufweist, prüfen Sie die Datentypen der verschiedenen Felder:
df.dtypes
Überprüfen Sie die weltweiten Daten. Um die Daten zu visualisieren, erstellen Sie einige Diagramme:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Datenzugriff – Azure Databricks
Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.
Datenzugriff – Azure Synapse
Für diese Kombination aus Plattform und Paket ist kein Beispiel verfügbar.
Nächste Schritte
Machen Sie sich mit den restlichen Datasets im Open Datasets-Katalog vertraut.