何时使用 HDInsight

已完成

在许多方案中,你都可使用 HDInsight 来处理大数据(使用历史数据或实时数据);但是否应该这样做? HDInsight 的最大优势在于其所提供的多种配置。 在此单元中,我们将考虑 HDInsight 是否适合你的组织。 我们将分析以下条件以帮助你确定:

  • 工作负载范围
  • 可伸缩性
  • 容错
  • 安全

决策条件

若要确定 HDInsight 能否满足组织的大数据需求,请使用下表中所述的条件:

条件 分析
工作负载范围 如果需要支持多种工作负载,则需要一个可支持这些要求的平台。
伸缩性 你的组织是否需要扩展,以适应数据量和数据速度的增长? 必须选择可自动缩放并独立支持计算和存储缩放的平台。
容错 如果必须在组件发生故障时继续进行数据分析,则需要选择一个容错平台。
安全性 大多数组织希望它们使用的数据在静态和传输过程中都是安全的。 此外,几乎所有组织都必须满足政府合规性标准。

应用条件

考虑你的组织希望如何处理大数据。 现在,应用决策条件来确定 HDInsight 是否是一个适当的选择:

  • 工作负载范围:HDInsight 使你能够支持多种工作负载。 这些工作负载可能包括对数据进行批处理、使用流式处理数据,或者管理数据仓库和/或数据科学工作负载。 此功能使 HDInsight 极具吸引力,尤其是当业务流程包含多个工作负载时。

  • 可伸缩性:HDInsight 支持可独立缩放的计算和存储。 此外,工作器节点还可以根据工作负载或计划自动缩放。

    提示

    通过分离计算和存储,以及自动缩放群集,可显著优化成本。

  • 容错:HDInsight 的头节点能够从故障中复原,并由容错 VM 提供支持。 这使其成为具有 99.9% 的 SLA 的高可用性服务。

  • 安全性:Microsoft Entra 集成提供企业安全身份验证和授权。 除了加密和虚拟网络支持之外,这些功能还能够精细控制谁可以访问数据。

概括而言,请在需要执行以下操作时考虑使用 HDInsight:

  • 大规模收集大量数据,以及:

    • 获取实时见解。
    • 以优化的成本、最少的工作量和强大的安全性来处理数据。
  • 迁移:

    • 从本地开源软件、供应商打包的 Hadoop 分发迁移到云,并尽可能降低成本和工作量。
    • 将开源软件、大数据服务从竞争对手云产品/服务迁移到 Azure。