你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
旧金山安全数据
旧金山市消防部门呼叫服务和 311 事件。
注意
Microsoft 按“原样”提供 Azure 开放数据集。 Microsoft 对数据集的使用不提供任何担保(明示或暗示)、保证或条件。 在当地法律允许的范围内,Microsoft 对使用数据集而导致的任何损害或损失不承担任何责任,包括直接、必然、特殊、间接、偶发或惩罚性损害或损失。
此数据集是根据 Microsoft 接收源数据的原始条款提供的。 数据集可能包含来自 Microsoft 的数据。
消防呼叫服务包括所有消防单位对呼叫的响应。 每个记录都包括呼叫号码、事件编号、地址、消防单位标识符、呼叫类型和处理情况。 其中还包括所有相关的时间间隔。 因为此数据集基于响应,并且由于大多数呼叫涉及多个单位,所以每个呼叫号码都有多个记录。 地址与街区号、交叉点或电话亭关联,而不与特定地址关联。
311 案例包括与某个地点或景物(例如,公园、街道或建筑物)相关的案例,于 2008 年 7 月 1 日之后创建。 不包括用户记录的与其自身需求相关的案例。 例如,财产或商业税务问题、停车许可请求等。 有关详细信息,请参阅计划链接。
数量和保留期
此数据集以 Parquet 格式存储。 每天更新一次,截至 2019 年约有 600 万行 (400 MB)。
此数据集包含从 2015 年至今累积的历史记录。 可使用我们的 SDK 中的参数设置来提取特定时间范围内的数据。
存储位置
此数据集存储在美国东部 Azure 区域。 建议将计算资源分配到美国东部地区,以实现相关性。
相关数据集
列
名称 | 数据类型 | 唯一 | 值(示例) | 说明 |
---|---|---|---|---|
address | string | 280,652 | Not associated with a specific address 0 Block of 6TH ST | 事件地址(注意:为保护呼叫者的隐私,地址和位置泛化为街道的中间街区、交叉点或最近的电话亭位置)。 |
category | string | 108 | Street and Sidewalk Cleaning Potentially Life-Threatening | 311 服务请求类型或 911 火灾报警呼叫类型组的人类可读名称。 |
dataSubtype | 字符串 | 2 | 911_Fire 311_All | “911_Fire”或“311_All”。 |
dataType | 字符串 | 1 | 安全 | “安全” |
dateTime | timestamp | 6,496,563 | 2020-10-19 12:28:08 2020-07-28 06:40:26 | 发出服务请求或收到火灾报警的日期和时间。 |
latitude | Double | 1,615,369 | 37.777624238929 37.786117211838 | 位置纬度,采用 WGS84 投影。 |
longitude | Double | 1,554,612 | -122.39998111124 -122.419854245692 | 位置经度,采用 WGS84 投影。 |
source | 字符串 | 9 | Phone Mobile/Open311 | 服务请求接收机制或路径;通常是“手机”、“短信/SMS”、“网站”、“移动应用”、“X”等,但术语可能因系统而异。 |
状态 | 字符串 | 3 | Closed Open | 服务请求当前状态的单字指示符。 (注意:GeoReport V2 仅允许“待处理”和“已结案”) |
子类别 | string | 1,270 | Medical Incident Bulky Items | 311 事件的服务请求子类型或 911 火灾报警的呼叫类型的人类可读名称。 |
预览
dataType | dataSubtype | dateTime | category | 子类别 | 状态 | address | latitude | longitude | source | extendedProperties |
---|---|---|---|---|---|---|---|---|---|---|
安全 | 911_Fire | 4/26/2021 2:56:13 AM | 不会造成人身伤害 | 医疗事故 | Null | 700 Block of GEARY ST | 37.7863607914647 | -122.415616900246 | null | |
安全 | 911_Fire | 4/26/2021 2:56:13 AM | 不会造成人身伤害 | 医疗事故 | Null | 700 Block of GEARY ST | 37.7863607914647 | -122.415616900246 | null | |
安全 | 911_Fire | 4/26/2021 2:54:03 AM | 不会造成人身伤害 | 医疗事故 | Null | 0 Block of ESSEX ST | 37.7860048266229 | -122.395077258809 | null | |
安全 | 911_Fire | 4/26/2021 2:54:03 AM | 不会造成人身伤害 | 医疗事故 | Null | 0 Block of ESSEX ST | 37.7860048266229 | -122.395077258809 | null | |
安全 | 911_Fire | 4/26/2021 2:52:17 AM | 不会造成人身伤害 | 医疗事故 | Null | 700 Block of 29TH AVE | 37.7751770865322 | -122.488604397217 | null | |
安全 | 911_Fire | 4/26/2021 2:50:28 AM | 可能会造成人身伤害 | 医疗事故 | Null | 1000 Block of GEARY ST | 37.7857350982044 | -122.420555240691 | null | |
安全 | 911_Fire | 4/26/2021 2:50:28 AM | 可能会造成人身伤害 | 医疗事故 | Null | 1000 Block of GEARY ST | 37.7857350982044 | -122.420555240691 | null | |
安全 | 911_Fire | 4/26/2021 2:33:52 AM | 不会造成人身伤害 | 医疗事故 | Null | 100 Block of BELVEDERE ST | 37.767791696654 | -122.449332294394 | null | |
安全 | 911_Fire | 4/26/2021 2:33:52 AM | 不会造成人身伤害 | 医疗事故 | Null | 100 Block of BELVEDERE ST | 37.767791696654 | -122.449332294394 | null | |
安全 | 911_Fire | 4/26/2021 2:33:51 AM | 可能会造成人身伤害 | 医疗事故 | Null | 100 Block of 6TH ST | 37.7807920802756 | -122.408385745499 | null |
数据访问
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import NycSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import NycSafety
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))
示例
- 请参阅 GitHub 上的城市安全分析示例。
后续步骤
查看开放数据集目录中的其余数据集。