Eventhouse 概述
Eventhouse 提供了一种用于处理和分析大量数据(特别是在需要实时分析和探索的场景中)的解决方案。 它们旨在高效处理实时数据流,使组织能够近乎实时地引入、处理和分析数据。 这些方面使得 Eventhouses 适用于注重及时洞察的场景。 Eventhouses 提供可缩放的基础结构,使组织能够处理不断增长的数据量,从而确保最佳性能和资源使用。 Eventhouse 是半结构化和自由文本分析的首选引擎。 Eventhouse 是一个数据库工作区,可以在某个项目中共享。 它让你可以同时管理多个数据库,共享容量和资源以优化性能和成本。 Eventhouse 跨所有数据库和每个数据库提供统一的监控和管理。
Eventhouse 专门针对具有结构化、半结构化和非结构化数据的基于时间的流式处理事件。 可以从多个来源、多个管道(例如,Eventstream、SDK、Kafka、Logstash、数据流等),以多种数据格式获取数据。 系统将根据引入时间自动对这些数据创建索引和分区。
何时创建 Eventhouse?
对于包括基于事件的数据(例如遥测和日志数据、时序和 IoT 数据、安全性和合规性日志或财务记录)的任何场景,请使用 Eventhouse。
可以在 Eventhouse 中创建 KQL 数据库。 KQL 数据库可以是标准数据库,也可以是数据库快捷方式。 为每个 KQL 数据库创建了探索性的查询环境,可用于浏览和数据管理。 可以在数据库或表级别启用 OneLake 中的数据可用性。
我会在 Eventhouse 中看到哪些信息?
Eventhouse 的系统概述页显示以下信息:
- Eventhouse 详细信息
- Eventhouse 的运行状态
- OneLake 存储使用情况
- 按数据库显示的 OneLake 存储使用情况
- 计算使用情况
- 按用户显示的计算使用情况
- 大多数活动数据库
- 最近的事件
有关详细信息,请参阅查看 Eventhouse 的系统概述详细信息。
Eventhouse 的数据库页以列表或磁贴视图显示数据库信息。 有关每个数据库的以下信息显示在磁贴视图中:
- 数据库名称
- 过去一周运行的查询图
- 数据大小
- 缓存策略
- 保留策略
- 上次引入日期
最低消耗
Eventhouse 可在不使用时暂停服务,从而优化成本。 重新激活服务时,可能会遇到几秒钟的延迟。 如果你的系统对时间高度敏感,无法容忍这种延迟,请使用“最低消耗”。 此设置使服务始终可用,但限定于所选的最低级别。 你需要为所选的最低计算级别付费,或者在计算级别高于最低设置时按实际消耗付费。 指定的计算可用于 Eventhouse 中的所有数据库。 服务中包含有限的高级存储,并且对应于下表中所示的最低消耗水平:
名称 | 最小 CU | SSD 可用存储容量 (GB) |
---|---|---|
特小 | 4.25 | 20 |
超小 | 8.5 | 200 |
小型 | 13 | 800 |
中 | 18 | 3500-4000 |
大型 | 26 | 5250-6000 |
特大型 | 34 | 7000-8000 |
特大 | 50 | 10500-12000 |
有关如何启用最低消耗的说明,请参阅启用最低消耗。