Eventhouse 概述

Eventhouse 提供了一种用于处理和分析大量数据(特别是在需要实时分析和探索的场景中)的解决方案。 它们旨在高效处理实时数据流,使组织能够近乎实时地引入、处理和分析数据。 这些方面使得 Eventhouses 适用于注重及时洞察的场景。 Eventhouses 提供可缩放的基础结构,使组织能够处理不断增长的数据量,从而确保最佳性能和资源使用。 Eventhouse 是半结构化和自由文本分析的首选引擎。 Eventhouse 是一个数据库工作区,可以在某个项目中共享。 它让你可以同时管理多个数据库,共享容量和资源以优化性能和成本。 Eventhouse 跨所有数据库和每个数据库提供统一的监控和管理。

Eventhouse 专门针对具有结构化、半结构化和非结构化数据的基于时间的流式处理事件。 可以从多个来源、多个管道(例如,Eventstream、SDK、Kafka、Logstash、数据流等),以多种数据格式获取数据。 系统将根据引入时间自动对这些数据创建索引和分区。

何时创建 Eventhouse?

对于包括基于事件的数据(例如遥测和日志数据、时序和 IoT 数据、安全性和合规性日志或财务记录)的任何场景,请使用 Eventhouse。

可以在 Eventhouse 中创建 KQL 数据库。 KQL 数据库可以是标准数据库,也可以是数据库快捷方式。 为每个 KQL 数据库创建了探索性的查询环境,可用于浏览和数据管理。 可以在数据库或表级别启用 OneLake 中的数据可用性

我会在 Eventhouse 中看到哪些信息?

Eventhouse 的系统概述页显示以下信息:

  • Eventhouse 详细信息
  • Eventhouse 的运行状态
  • OneLake 存储使用情况
  • 按数据库显示的 OneLake 存储使用情况
  • 计算使用情况
  • 按用户显示的计算使用情况
  • 大多数活动数据库
  • 最近的事件

有关详细信息,请参阅查看 Eventhouse 的系统概述详细信息

Eventhouse 的数据库页以列表或磁贴视图显示数据库信息。 有关每个数据库的以下信息显示在磁贴视图中:

  • 数据库名称
  • 过去一周运行的查询图
  • 数据大小
  • 缓存策略
  • 保留策略
  • 上次引入日期

最低消耗

Eventhouse 可在不使用时暂停服务,从而优化成本。 重新激活服务时,可能会遇到几秒钟的延迟。 如果你的系统对时间高度敏感,无法容忍这种延迟,请使用“最低消耗”。 此设置使服务始终可用,但限定于所选的最低级别。 你需要为所选的最低计算级别付费,或者在计算级别高于最低设置时按实际消耗付费。 指定的计算可用于 Eventhouse 中的所有数据库。 服务中包含有限的高级存储,并且对应于下表中所示的最低消耗水平:

名称 最小 CU SSD 可用存储容量 (GB)
特小 4.25 20
超小 8.5 200
小型 13 800
18 3500-4000
大型 26 5250-6000
特大型 34 7000-8000
特大 50 10500-12000

有关如何启用最低消耗的说明,请参阅启用最低消耗

下一步