你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

数据和 AI

本文将核心 Azure 数据和 AI 服务与相应的 Amazon Web Services (AWS) 服务进行比较。

有关其他 AWS 和 Azure 服务的比较,请参阅 《AWS 专业人员的 Azure 指南》

数据管理、管理和平台

Microsoft Purview 和下表中所述 AWS 服务的组合旨在提供全面的数据治理解决方案。 这些解决方案使组织能够有效地管理、发现、分类和提供数据资产的安全性。

Microsoft 服务 AWS 服务 说明
Microsoft Purview AWS Glue 数据目录AWS Lake FormationAmazon MacieAWS Identity and Access Management (IAM)AWS 配置 这两个选项都提供可靠的数据管理、编录和合规性功能。 Microsoft Purview 是一种统一的数据治理解决方案,允许组织跨本地、多云和 SaaS 环境发现、分类和管理数据。 它还提供数据世系和符合性功能。 AWS 为多个服务提供了类似的功能:AWS Glue 数据目录用于元数据管理、用于数据湖创建和管理的 AWS Lake Formation、用于数据分类和保护的 Amazon Macie用于访问控制的 AWS IAM 以及用于配置管理和合规性跟踪的 AWS 配置

一次性平台与 AWS 服务

Microsoft Fabric 提供了一个一体的平台,用于统一新式分析解决方案所需的数据和 AI 服务。 它简化了在服务之间移动数据的过程,提供统一的治理和安全性,并简化了定价模型。 这种统一的方法与 AWS 方法形成鲜明对比,在这种方法中,服务通常单独使用,并且需要更多精力进行集成。 Fabric 提供跨这些函数的无缝集成,可帮助组织加速 Azure 生态系统中的数据驱动计划。

AWS 和 Fabric 都为数据集成、处理、分析、机器学习和商业智能提供服务。

AWS 服务 Fabric 说明
AWS GlueAWS 数据管道 数据与Azure 数据工厂集成 AWS 提供了一套单独的服务,可以组合这些服务来构建数据和分析解决方案。 此方法提供灵活性,但需要更多精力将服务集成到端到端解决方案中。 Fabric 在单个统一平台中提供这些功能,以简化工作流、协作和管理。

AWS 服务与 Fabric 组件的详细比较

AWS 服务 Fabric
AWS GlueAWS 数据管道 数据与数据工厂集成
Amazon EMRAWS Glue 交互式会话 使用 Spark 进行数据工程
Amazon Redshift 使用 Synapse 数据仓库的数据仓库
Amazon SageMaker 数据科学(Azure 机器学习集成)
Amazon KinesisAmazon Managed Service for Apache Flink 实时分析 (KQL 数据库)
Amazon QuickSight Power BI 商业智能
Amazon S3 OneLake 统一 Data Lake 存储
AWS Lake 形成AWS Glue 数据目录Amazon Macie 数据管理(Microsoft Purview 集成)
Amazon BedrockAmazon SageMaker JumpStart 生成 AI (Azure OpenAI 服务集成)

数据集成和 ETL 工具

数据集成和提取、转换、加载(ETL)工具可帮助你提取、转换、将数据从多个源加载到统一系统进行分析。

AWS 服务 Azure 服务 分析
AWS Glue 数据工厂 AWS Glue 和 Azure 数据工厂 是完全托管的 ETL 服务,可促进跨各种源的数据集成。
适用于 Apache Airflow 的 Amazon 托管工作流(MWAA) 使用 Azure Synapse Analytics 管道的数据工厂 Apache Airflow 为复杂的数据管道提供托管工作流业务流程。 Azure Synapse Analytics 管道将 Apache Airflow 与 Azure 数据工厂 集成,以便获得更集成的体验。 AWSMWAA 是一种托管的 Airflow 解决方案。
AWS 数据管道 数据工厂 AWS 数据管道和Azure 数据工厂支持跨服务和位置移动和处理数据。
AWS 数据库迁移服务 (DMS) Azure 数据库迁移服务 这些服务可帮助你将数据库迁移到云,且停机时间最短。 主要区别在于,Azure 服务针对无缝迁移到 Azure 数据库进行了优化,提供评估和建议工具,而 AWS DMS 侧重于 AWS 环境中的迁移。 AWS DMS 为混合体系结构提供正在进行的复制功能。
Amazon AppFlow Azure 逻辑应用 这些服务支持云应用程序和服务之间的自动化数据流,而无需代码。 逻辑应用通过各种连接器和视觉设计器提供广泛的集成功能。 AppFlow 侧重于特定 SaaS 应用程序和 AWS 服务之间的安全数据传输,并提供内置的数据转换功能。
AWS 步骤函数 使用逻辑应用的数据工厂 这些服务提供用于协调分布式应用程序和微服务的工作流业务流程。 步骤函数旨在协调无服务器应用程序中的 AWS 服务和微服务。 逻辑应用用于数据集成和企业工作流自动化。

数据仓库

这些解决方案旨在存储和管理大量结构化数据,这些结构化数据已针对查询和报告进行优化。

AWS 服务 Azure 服务 分析
Amazon Redshift Azure Synapse Analytics Amazon Redshift 和 Azure Synapse Analytics 是完全托管的 PB 级数据仓库服务,专为大规模数据分析和报告而设计。 主要区别在于,Azure Synapse Analytics 提供了一个统一的分析平台,该平台结合了数据仓库和大数据处理,而 Redshift 主要侧重于数据仓库。
Amazon Redshift Spectrum Azure Synapse Analytics 与 Data Lake 集成 借助这些服务,无需移动数据,即可跨数据仓库和数据湖查询数据。 Azure Synapse Analytics 提供集成的 SQL 和 Spark 引擎。 Redshift Spectrum 将 Redshift 的 SQL 查询扩展到 Amazon S3 中的数据。
AWS Lake 形成 将 Azure Synapse Analytics 与 Azure Data Lake Storage 配合使用 这些服务可帮助你创建安全的数据湖进行分析。 Azure 结合了 Azure Synapse Analytics 中的数据湖和数据仓库功能。 AWS 为数据湖和 Redshift 提供 Lake Formation 作为单独的数据仓库服务。
使用 Redshift 联合查询的 Amazon RDS Azure SQL 数据库 这些服务支持跨操作数据库和数据仓库进行查询。 Azure Synapse Analytics 提供统一的内置分析体验。 AWS 要求将 RDS 和 Redshift 合并为类似的跨服务查询功能。
Amazon Aurora 与 Redshift 集成 Azure Synapse Link for Azure Cosmos DB 这些服务针对操作数据提供高性能分析。 AWS 要求在 Aurora 和 Redshift 之间设置数据管道。 使用 Azure Synapse Link,无需移动数据。

Data Lake 解决方案

这些平台以本机格式存储大量原始非结构化数据和结构化数据,以供将来处理。

AWS 服务 Azure 服务 分析
Amazon S3 Azure Data Lake 存储 Amazon S3 和 Azure Data Lake Storage 是可缩放的存储解决方案,用于构建数据湖以存储和分析大量数据。 Data Lake Storage 提供分层命名空间。 Amazon S3 使用平面结构。
AWS Lake 形成 Azure Synapse Analytics AWS Lake 形成和 Azure Synapse Analytics 可帮助设置、管理和保护数据湖进行分析。 主要区别在于,Azure Synapse Analytics 提供一个一体式分析服务,该服务结合了数据湖、数据仓库和大数据分析,而 Lake Formation 侧重于简化 Data Lake 创建和管理,并提供可靠的安全性和治理功能。
Amazon Athena Azure Synapse Analytics 无服务器 SQL 池 借助这些服务,无需设置基础结构,即可使用 SQL 查询存储在数据湖中的数据。 Amazon Athena 是一种与其他 AWS 服务集成的独立解决方案。 无服务器 SQL 池是 Azure Synapse Analytics 平台的一部分。
AWS Glue 数据目录 Microsoft Purview 这些服务提供集中式元数据存储库,用于存储和管理数据湖的数据架构和元数据。 AWS Glue 提供了 Purview 功能Microsoft子集。 Microsoft Purview 支持数据编录、世系跟踪和敏感数据分类,无论数据位于本地、云中还是 SaaS 应用程序中。

大数据分析

这些服务处理和分析大型复杂数据集,以发现模式、见解和趋势。 下表提供单个大数据服务的直接比较。 Microsoft Fabric 是一项用于大数据和分析的一项全能服务。 它提供以下服务等。

AWS 服务 Azure 服务 分析
Amazon EMR Azure HDInsight 这两种服务都提供托管的大数据框架,用于处理存储在数据湖中的数据。 EMR 提供托管 Hadoop 和 Spark 框架。 HDInsight 是一种完全托管的企业解决方案,支持 Hadoop、Spark、Kafka 和其他开放源代码分析。
Amazon EMR Azure Databricks 这些服务在托管环境中通过 Apache Spark 实现大数据处理。 EMR 使你能够运行具有灵活配置和缩放选项的 Apache Spark 群集。 Azure Databricks 提供优化的 Apache Spark 平台,其中包含协作笔记本和集成工作流。
Amazon Kinesis Azure 事件中心Azure 流分析 这些服务提供实时数据流和分析,用于处理和分析大容量数据流。
AWS Glue Studio 的 AWS Glue 将 Azure Synapse Analytics 与 Apache Spark 池配合使用 这两种服务都提供具有集成数据转换和分析的大数据处理功能。

商业智能和报告

这些服务提供数据可视化、报告和仪表板,以帮助企业做出明智的决策。

AWS 服务 Azure 服务 分析
Amazon QuickSight Power BI QuickSight 和 Power BI 提供用于数据可视化和交互式仪表板的业务分析工具。
Amazon Managed Grafana Microsoft 托管 Grafana 这些服务提供托管 Grafana,使你能够跨多个数据源可视化指标、日志和跟踪。
AWS 数据交换 Azure Data Share 这些服务有助于组织之间安全地共享和交换数据。 Data Exchange 提供市场模型。 Data Share 侧重于跨租户数据共享。
Amazon OpenSearch Service with Kibana 包含仪表板的 Azure 数据资源管理器 这些服务针对大量数据提供实时数据浏览和交互式分析。 OpenSearch 使用 Kibana 进行搜索和可视化。 Azure 数据资源管理器使用 Kusto,它针对快速数据引入和查询进行优化。

实时数据处理

这些系统在生成数据时引入和分析数据,以提供即时见解和响应。

AWS 服务 Azure 服务 分析
Amazon Kinesis Azure 事件中心Azure 流分析 这些服务提供实时数据流和分析,用于处理和分析大容量数据流。 Kinesis 提供了一个集成套件,用于 AWS 中的数据流和分析。 Azure 将引入(事件中心)和处理(流分析)分开。
Amazon Managed Streaming for Apache Kafka (MSK) 将 Azure HDInsight 与 Apache Kafka 配合使用 这些服务提供托管的 Apache Kafka 群集,用于创建实时流式处理数据管道和应用程序。
AWS Lambda Azure Functions 这些无服务器计算平台运行代码以响应事件并自动管理基础计算资源。
Amazon DynamoDB 流 Azure Cosmos DB 更改源 这些服务通过捕获和提供数据流来启用实时数据处理。
Amazon ElastiCache 与 Redis 流 使用 Redis 流的 Azure Redis 缓存 这些服务提供托管的 Redis 实例,支持 Redis 流进行实时数据引入和处理。
Amazon IoT Analytics 使用 Azure 流分析Azure IoT 中心 这些服务使你能够实时处理和分析来自 IoT 设备的数据。 AWS IoT Analytics 提供内置的数据存储和分析功能。 Azure 提供模块化服务:IoT 中心处理引入,流分析处理数据。

机器学习服务

这些工具和平台支持机器学习模型的开发、训练和部署。

AWS 服务 Azure 服务 分析
Amazon SageMaker Azure 机器学习 通过这些全面的平台,可以生成、训练和部署机器学习模型。
AWS 深度学习 AIS Azure Data Science Virtual Machine 这些服务提供针对机器学习和数据科学工作负载进行优化的预配置虚拟机。
Amazon SageMaker Autopilot 自动化机器学习(AutoML) 这些服务提供用于生成和训练模型的自动化机器学习。
Amazon SageMaker Studio Azure 机器学习工作室 这些服务为机器学习提供集成开发环境。 SageMaker Studio 为所有机器学习开发步骤(包括调试和分析工具)提供统一接口。

AI 服务

AI 服务为应用程序提供预生成、可自定义的 AI 功能,包括视觉、语音、语言和决策。

AWS 服务 Azure 服务 分析
Amazon Rekognition 使用 OCR 和 AI 实现 Azure AI 视觉 这些服务提供图像和视频分析功能,包括对象识别和 con帐篷模式ration。
Amazon Polly Azure AI 语音(文本转语音) 可以使用这些服务将文本转换为逼真的语音,使应用程序能够与用户与自然语音交互。
Amazon Transcribe Azure AI 语音 这些服务将口语转换为文本,使应用程序能够转录音频流。
Amazon Translate Azure AI 翻译器 这些服务提供机器翻译功能,用于将文本从一种语言翻译到另一种语言。
Amazon Comprehend Azure AI 语言 这些服务分析文本以提取情绪、关键短语、实体和语言检测等见解。
Amazon Lex Azure AI 机器人服务 可以使用这些服务创建使用自然语言理解的对话界面和聊天机器人。 Azure 为机器人开发框架和语言理解提供单独的服务,提供模块化方法。 Amazon Lex 提供集成解决方案,用于在 AWS 中生成对话接口。
Amazon Textract Azure AI 文档智能 这两种服务都使用机器学习从扫描的文档和表单中自动提取文本和数据。 Azure 为特定文档类型提供可自定义的模型,这些模型可实现定制的数据提取。 Textract 提供复杂数据结构的现用提取。
Amazon OpenSearch 服务 Azure AI 搜索(生成搜索) OpenSearch 和 AI 搜索提供强大的搜索和分析功能。 可以将它们用于常见的 AI 模式,例如检索扩充生成(RAG)。

生成式 AI 服务

这些 AI 服务创建类似于人工生成的输出(如文本、图像或音频)的新内容或数据。

AWS 服务 Azure 服务 分析
Amazon Bedrock Azure OpenAI 服务Azure AI Foundry Amazon Bedrock、Azure AI Foundry 和 Azure OpenAI 服务提供了用于创建和部署生成 AI 应用程序的基础模型。

作者

本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。

主要作者:

其他参与者:

要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。

后续步骤