何时使用 HDInsight
在许多方案中,你都可使用 HDInsight 来处理大数据(使用历史数据或实时数据);但是否应该这样做? HDInsight 的最大优势在于其所提供的多种配置。 在此单元中,我们将考虑 HDInsight 是否适合你的组织。 我们将分析以下条件以帮助你确定:
- 工作负载范围
- 可伸缩性
- 容错
- 安全
决策条件
若要确定 HDInsight 能否满足组织的大数据需求,请使用下表中所述的条件:
条件 | 分析 |
---|---|
工作负载范围 | 如果需要支持多种工作负载,则需要一个可支持这些要求的平台。 |
伸缩性 | 你的组织是否需要扩展,以适应数据量和数据速度的增长? 必须选择可自动缩放并独立支持计算和存储缩放的平台。 |
容错 | 如果必须在组件发生故障时继续进行数据分析,则需要选择一个容错平台。 |
安全性 | 大多数组织希望它们使用的数据在静态和传输过程中都是安全的。 此外,几乎所有组织都必须满足政府合规性标准。 |
应用条件
考虑你的组织希望如何处理大数据。 现在,应用决策条件来确定 HDInsight 是否是一个适当的选择:
工作负载范围:HDInsight 使你能够支持多种工作负载。 这些工作负载可能包括对数据进行批处理、使用流式处理数据,或者管理数据仓库和/或数据科学工作负载。 此功能使 HDInsight 极具吸引力,尤其是当业务流程包含多个工作负载时。
可伸缩性:HDInsight 支持可独立缩放的计算和存储。 此外,工作器节点还可以根据工作负载或计划自动缩放。
提示
通过分离计算和存储,以及自动缩放群集,可显著优化成本。
容错:HDInsight 的头节点能够从故障中复原,并由容错 VM 提供支持。 这使其成为具有 99.9% 的 SLA 的高可用性服务。
安全性:Microsoft Entra 集成提供企业安全身份验证和授权。 除了加密和虚拟网络支持之外,这些功能还能够精细控制谁可以访问数据。
概括而言,请在需要执行以下操作时考虑使用 HDInsight:
大规模收集大量数据,以及:
- 获取实时见解。
- 以优化的成本、最少的工作量和强大的安全性来处理数据。
迁移:
- 从本地开源软件、供应商打包的 Hadoop 分发迁移到云,并尽可能降低成本和工作量。
- 将开源软件、大数据服务从竞争对手云产品/服务迁移到 Azure。