Bing COVID-19
Bing COVID-19-data omfattar information om antal bekräftade fall, dödsfall och friskförklarade personer från alla regioner och uppdateras dagligen. Bing COVID-19 Tracker återspeglar dessa data.
Bing samlar in data från flera betrodda och tillförlitliga källor, inklusive:
- BNO-nyheter
- Centers for Disease Control and Prevention (CDC)
- Nationella/regionala och statliga folkhälsomyndigheter
- Wikipedia
- Världshälsoorganisationen (WHO)
- 24/7 Vägg St.
Kommentar
Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.
Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.
Datauppsättningar
Ändrade COVID-19-datauppsättningar i Bing är tillgängliga i CSV, JSON, JSON-Lines och Parquet:
Alla ändrade datauppsättningar har ISO 3166-indelningskoder och inläsningstider tillagda. De använder gemener med understrecksavgränsare.
Tidigare versioner av ändrade data och rådata är tillgängliga på den här resursen.
Datavolym
Alla datauppsättningar får dagliga uppdateringar. Den 5 mars 2023 innehöll de 4 766 737 rader. Datauppsättningen är tillgänglig i följande filformat:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Tilldelning av licens- och användningsrättigheter
Uppgifterna är endast tillgängliga för utbildnings- och akademiska ändamål enligt dessa villkor. Giltiga syften är:
- akademiska institutioner
- Myndigheter
- medicinsk forskning
Data som används eller citeras i publikationer bör innehålla en tillskrivning till "Bing COVID-19 Tracker", med en länk till www.bing.com/covid.
Kontakt
Om du har frågor eller feedback om den här eller andra datamängder i COVID-19 Data Lake kontaktar du askcovid19dl@microsoft.com.
Kolumner
Name | Datatyp | Unik | Värden (exempel) | beskrivning |
---|---|---|---|---|
admin_region_1 | sträng | 864 | Texas Georgia | Region i country_region |
admin_region_2 | sträng | 3143 | Washington County Jefferson County | Region i admin_region_1 |
bekräftad | heltal | 120,692 | 1 2 | Bekräftat antal fall i regionen |
confirmed_change | heltal | 12,120 | 1 2 | Förändring i bekräftat antal fall från föregående dag |
country_region | sträng | 237 | USA Indien | Land/region |
dödsfall | heltal | 20,616 | 1 2 | Antal dödsfall i regionen |
deaths_change | smallint | 1,981 | 1 2 | Förändring i antal dödsfall från föregående dag |
id | heltal | 1,783,534 | 742546 69019298 | Unik identifierare |
iso_subdivision | sträng | 484 | US-TX US-GA | ISO-delkod i två delar |
iso2 | sträng | 226 | US IN | Identifierare i form av landskod med 2 bokstäver |
iso3 | sträng | 226 | USA IND | Identifierare i form av landskod med 3 bokstäver |
latitude | dubbel | 5,675 | 42.28708 19.59852 | Latitud för regionens centrum |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | Datumet och tiden då filen lästes in från Bing-källan på GitHub |
longitud | dubbel | 5,693 | -2.5396 -155.5186 | Longitud för regionens centrum |
Återskapade | heltal | 73,287 | 1 2 | Antal friskförklarade i regionen |
recovered_change | heltal | 10,441 | 1 2 | Förändring i antal friskförklarade från föregående dag |
uppdatering | datum | 457 | 2021-04-23 2021-04-22 | Senaste datum för posten |
Förhandsversion
id | uppdatering | bekräftad | dödsfall | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | Världsomfattande | null | null | null | 2021-04-26 12:06:34 | 1753 | 0 |
Dataåtkomst – Azure Notebooks
Kommentar
Den här notebook-filen dokumenterar URL:er och exempelkod för åtkomst till Bing COVID-19-datauppsättningen.
Använd dessa URL:er för att hämta specifika filformat som finns i Azure Blob Storage:
Ladda ned datamängdsfilen med hjälp av den inbyggda funktionen i Pandas för att ladda ned från en HTTP-URL. Pandas har läsare för olika filformat:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Kontrollera att den uppdaterade kolumnen har ett datetime-format genom att kontrollera datatyperna för de olika fälten:
df.dtypes
Granska globala data. Skapa några diagram för att visualisera data:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Dataåtkomst – Azure Databricks
Ett exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Dataåtkomst – Azure Synapse
Ett exempel är inte tillgängligt för den här kombinationen av plattform/paket.
Nästa steg
Visa resten av datauppsättningarna i katalogen Öppna datamängder.