Bing COVID-19
Dane Bing COVID-19 obejmują przypadki potwierdzone, śmiertelne i wyleczone ze wszystkich regionów, aktualizowane codziennie. Monitor Bing COVID-19 odzwierciedla te dane.
Usługa Bing zbiera dane z wielu zaufanych, niezawodnych źródeł, w tym:
- Wiadomości BNO
- Centra kontroli chorób i zapobiegania (CDC)
- Krajowe/regionalne i państwowe departamenty zdrowia publicznego
- Wikipedia
- Światowa Organizacja Zdrowia (WHO)
- 24/7 Ściana St.
Uwaga
Firma Microsoft udostępnia zestawy danych Platformy Azure open na zasadzie "tak, jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym zgodnie z prawem lokalnym firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wtórne, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Zestawy danych
Zmodyfikowane zestawy danych Bing COVID-19 są dostępne w plikach CSV, JSON, JSON-Lines i Parquet:
Wszystkie zmodyfikowane zestawy danych mają dodane kody poddziałów ISO 3166 i czasy ładowania. Używają nazw kolumn małych liter z separatorami podkreślenia.
Nieprzetworzone dane w formacie CSV
Starsze wersje zmodyfikowanych i pierwotnych danych są dostępne w tym zasobie.
Ilość danych
Wszystkie zestawy danych otrzymują codzienne aktualizacje. Od 5 marca 2023 r. zawierały 4766 737 wierszy. Zestaw danych jest dostępny w następujących formatach plików:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Przypisywanie praw do licencji i użytkowania
Dane są dostępne wyłącznie dla celów edukacyjnych i akademickich zgodnie z tymi warunkami i postanowieniami. Prawidłowe cele obejmują:
- instytucje akademickie
- agencje rządowe
- badania medyczne
Dane używane lub cytowane w publikacjach powinny zawierać przypisanie do "Monitora COVID-19 Bing" z linkiem do www.bing.com/covid.
Kontakt biznesowy
W przypadku pytań lub opinii dotyczących tego lub innych zestawów danych w kontaktie z askcovid19dl@microsoft.comusługą COVID-19 Data Lake.
Kolumny
Nazwisko | Typ danych | Unikatowe | Wartości (przykładowe) | opis |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Region w obrębie country_region |
admin_region_2 | string | 3143 | Hrabstwo Washington Jefferson | Region w obrębie admin_region_1 |
Potwierdzone | int | 120,692 | 1 2 | Liczba potwierdzonych przypadków dla regionu |
confirmed_change | int | 12,120 | 1 2 | Zmiana liczby potwierdzonych przypadków z poprzedniego dnia |
country_region | string | 237 | Stany Zjednoczone Indiach | Kraj/region |
Zgonów | int | 20,616 | 1 2 | Liczba przypadków śmiertelnych dla regionu |
deaths_change | smallint | 1,981 | 1 2 | Zmiana liczby przypadków śmiertelnych z poprzedniego dnia |
identyfikator | int | 1,783,534 | 742546 69019298 | Unikatowy identyfikator |
iso_subdivision | string | 484 | US-TX US-GA | Dwuczęściowy kod poddziału standardu ISO |
iso2 | string | 226 | STANY ZJEDNOCZONE | 2-literowy identyfikator kodu kraju |
iso3 | string | 226 | USA IND | 3-literowy identyfikator kodu kraju |
latitude | double | 5,675 | 42.28708 19.59852 | Szerokość geograficzna centroidy regionu |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | Data i godzina załadowania pliku ze źródła usługi Bing w witrynie GitHub |
długość geograficzna | double | 5,693 | -2.5396 -155.5186 | Długość geograficzna centroidy regionu |
Odzyskane | int | 73,287 | 1 2 | Liczba przypadków wyzdrowień dla regionu |
recovered_change | int | 10,441 | 1 2 | Zmiana liczby przypadków wyzdrowień z poprzedniego dnia |
aktualizacja: | data | 457 | 2021-04-23 2021-04-22 | Na dzień dla rekordu |
Podgląd
identyfikator | aktualizacja: | Potwierdzone | Zgonów | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | Cały świat | null | null | null | 26.04.2021 12:06:34 | 1753 | 0 |
Dostęp do danych — Azure Notebooks
Uwaga
Ten notes zawiera dokumenty dotyczące adresów URL i przykładowego kodu w celu uzyskania dostępu do zestawu danych Bing COVID-19.
Użyj tych adresów URL, aby uzyskać określone formaty plików hostowane w usłudze Azure Blob Storage:
Pobierz plik zestawu danych przy użyciu wbudowanej funkcji biblioteki Pandas do pobrania z adresu URL HTTP. Biblioteka Pandas ma czytniki dla różnych formatów plików:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Aby sprawdzić, czy zaktualizowana kolumna ma format daty/godziny, sprawdź typy danych różnych pól:
df.dtypes
Przejrzyj dane na całym świecie. Aby zwizualizować dane, utwórz kilka wykresów:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Dostęp do danych — Azure Databricks
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Dostęp do danych — Azure Synapse
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Następne kroki
Wyświetl pozostałe zestawy danych w katalogu Open Datasets (Otwieranie zestawów danych).