你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

选择目标 Azure 平台来托管导出的历史数据

在迁移过程中做出的重要决策之一是存储历史数据的位置。 若要做出此决定,需要了解并能够比较各种目标平台。

本文比较了目标平台的性能、成本、可用性和管理开销。

注意

此表中的注意事项仅适用于历史日志迁移,不适用于其他方案,例如长期保留。

基本日志/存档 Azure 数据资源管理器 (ADX) Azure Blob 存储 ADX + Azure Blob 存储
功能 • 以较低的成本使用大多数现有 Azure Monitor 日志体验。
• 基本日志保留 8 天,然后(根据原始保留期)自动传输到存档。
• 使用搜索作业跨 PB 的数据搜索并查找特定事件。
• 若要对特定时间范围进行深入调查,请从存档还原数据。 然后,数据在热缓存中可用,以便进一步分析。
• ADX 和 Microsoft Sentinel 都使用 Kusto 查询语言 (KQL),使你能够查询、聚合或关联两个平台中的数据。 例如,可以从 Microsoft Sentinel 运行 KQL 查询,将 ADX 中存储的数据与 Log Analytics 中存储的数据联接在一起
• 使用 ADX,可以大幅控制群集大小和配置。 例如,可以创建更大的群集以实现更高的引入吞吐量,或创建较小的群集来控制成本。
• Blob 存储最适合存储巨量的非结构化数据。
• 提供竞争性成本。
• 适用于组织不优先考虑辅助功能或性能的方案,例如,当组织必须符合合规性或审核要求时。
• 数据存储在 Blob 存储中,成本较低。
• 使用 ADX 查询 KQL 中的数据,使你能够轻松访问数据。 了解如何使用 ADX 查询 Azure Monitor 数据
可用性 非常好

存档和搜索选项易于使用,可从 Microsoft Sentinel 门户访问。 但是,数据不能立即用于查询。 你需要执行搜索来检索数据,这可能需要一些时间,具体取决于要扫描和返回的数据量。


在 Microsoft Sentinel 的上下文中相当容易使用。 例如,可以使用 Azure 工作簿可视化跨 Microsoft Sentinel 和 ADX 分布的数据。 还可以使用 ADX 代理从 Microsoft Sentinel 门户查询 ADX 数据。


使用历史数据迁移,可能需要处理数百万个文件,探索数据会成为挑战。
一般

虽然使用 externaldata 运算符需要应用大量 blob,但是使用外部 ADX 表可以消除此问题。 外部表定义了解 Blob 存储文件夹结构,并允许以透明方式查询许多不同 Blob 和文件夹中包含的数据。
管理开销 完全托管

搜索和存档选项完全托管,不会增加管理开销。


ADX 是 Microsoft Sentinel 的外部,需要监视和维护。


虽然此平台需要很少的维护,但选择此平台会添加监视和配置任务,例如设置生命周期管理。
中等

使用此选项,可以维护和监视 ADX 和 Azure Blob 存储,这两个组件都是 Microsoft Sentinel 的外部组件。 虽然 ADX 有时可以关闭,但请考虑使用此选项的额外管理开销。
性能 中等

通常,使用搜索作业与存档中的基本日志进行交互,这些日志适合在维护对数据的访问权限时使用,但不需要立即访问数据。
高到低

• ADX 群集的查询性能取决于群集中的节点数、群集虚拟机 SKU、数据分区等。
• 将节点添加到群集时,性能会提高,并增加成本。
• 如果使用 ADX,建议配置群集大小来平衡性能和成本。 此配置取决于组织的需求,包括完成迁移需要多快、访问数据的频率以及预期的响应时间。


提供两个性能层:高级版或标准层。 尽管这两个层都是长期存储的选项,但标准层更具成本效益。 了解性能和可伸缩性限制


由于数据驻留在 Blob 存储中,因此性能受该平台的限制。
成本

成本由两个组件组成:
引入成本。 引入到基本日志中的每个 GB 数据都受 Microsoft Sentinel 和 Azure Monitor 日志引入成本的约束,成本高达大约 1 美元/GB。 查看定价详细信息
存档成本。 存档层中数据的成本高达每月大约 0.02 美元/GB。 查看定价详细信息
除了这两个成本组件之外,如果需要频繁访问数据,则通过搜索作业访问数据时会产生额外的成本。
高到低

• 由于 ADX 是虚拟机群集,因此根据计算、存储和网络使用情况以及 ADX 标记收费,查看定价详细信息。 因此,添加到群集的节点越多,存储的数据越多,成本就越高。
• ADX 还提供自动缩放功能,以适应按需工作负荷。 ADX 还可以受益于预留实例定价。 可以在 Azure 定价计算器中运行自己的成本计算。


采用最佳设置后,Azure Blob 存储成本最低。 为了提高效率和成本节省,Microsoft Azure 存储生命周期管理可用于将旧 Blob 自动放入更便宜的存储层。


在这种情况下,ADX 仅充当代理,因此群集可能很小。 此外,当不需要访问数据时,群集可以关闭,并且仅在需要数据访问时启动它。
如何访问数据 搜索作业 直接 KQL 查询 externaldata 修改后的 KQL 查询
应用场景 偶尔访问

在不需要运行大量分析或触发分析规则的情况下相关,并且只需偶尔访问数据。
频繁访问

在需要频繁访问数据且需要控制群集大小和配置方式的情况下相关。
合规性/审核

• 最适合存储大量非结构化数据。
• 在不需要快速访问数据或高性能(例如出于合规性或审核目的)的情况下相关。
偶尔访问

在想要从低成本 Azure Blob 存储中受益并保持对数据的相对快速访问的情况相关。
复杂性 极低 中等
就绪情况 GA GA GA GA

一般注意事项

现在,你已了解有关可用目标平台的详细信息,请查看以下主要因素以最终确定决定。

使用引入的日志

定义组织如何使用引入的日志来指导你选择引入平台。

请考虑以下三种常规方案:

  • 组织需要仅出于合规性或审核目的保留日志。 在这种情况下,组织很少访问数据。 即使组织访问数据,高性能或易用性也不是优先考虑的问题。
  • 组织需要保留日志,以便团队能够轻松且快速地访问日志。
  • 组织需要保留日志,以便团队能够偶尔访问日志。 性能和易用性是次要的。

请参阅平台比较,了解哪些平台适合其中每个方案。

迁移速度

在某些情况下,可能需要满足严格的截止时间,例如,由于许可证过期事件,组织可能需要紧急地从以前的 SIEM 转移。

查看确定迁移速度的组件和因素。

数据源

数据源通常是本地文件系统或云存储,例如 S3。 服务器的存储性能取决于多种因素,例如磁盘技术 (SSD 与 HDD)、IO 请求的性质以及每个请求的大小。

例如,Azure 虚拟机性能从较小的 VM SKU 上的 30 MB/s,到使用 NVW Express (NVMe) 磁盘的一些存储优化 SKU 的 20 GB/s。 了解如何设计 Azure VM 以提高存储性能。 还可以将大多数概念应用于本地服务器。

计算能力

在某些情况下,即使磁盘能够快速复制数据,计算能力也是复制过程中的瓶颈。 在这些情况下,可以选择以下缩放选项之一:

  • 垂直缩放。 可以通过添加更多 CPU 或提高 CPU 速度来增加单个服务器的电源。
  • 横向缩放。 添加更多服务器,这会增加复制进程的并行度。

目标平台

本部分讨论的每个目标平台都有不同的性能配置文件。

  • Azure Monitor 基本日志。 默认情况下,基本日志可以按大约每分钟 1 GB 的速度推送到 Azure Monitor。 此速率允许每天引入大约 1.5 TB 或每月 43 TB。
  • Azure 数据资源管理器。 引入性能因预配的群集大小和应用的批处理设置而异。 了解引入最佳做法,包括性能和监视。
  • Azure Blob 存储。 Azure Blob 存储帐户的性能可能会因文件数量和大小、作业大小、并发数等而异。 了解如何优化 AzCopy 和 Microsoft Azure 存储的性能

数据量

数据量是影响迁移过程持续时间的主要因素。 因此,应考虑如何根据数据集设置环境。

若要确定迁移的最小持续时间以及瓶颈的位置,请考虑目标平台的数据量和引入速度。 例如,选择可以每秒引入 1 GB 的目标平台,并且必须迁移 100 TB。 在这种情况下,迁移至少需要 100,000 GB,乘以每秒 1 GB 的速度。 将结果除以 3600,计算结果为 27 小时。 如果管道中的其余组件(例如本地磁盘、网络和虚拟机)每秒可以执行 1 GB,则此计算是正确的。

后续步骤

在本文中,你已了解如何将迁移规则从 QRadar 映射到 Microsoft Sentinel。