Compartilhar via


Dados e IA

Este artigo compara os principais serviços de dados e IA do Azure com os serviços correspondentes da Amazon Web Services (AWS).

Para comparação de outros serviços do AWS e do Azure, consulte Azure para profissionais do AWS.

Governança, gerenciamento e plataformas de dados

Tanto o Microsoft Purview quanto a combinação de serviços da AWS descritos na tabela a seguir visam fornecer soluções abrangentes de governança de dados. Essas soluções permitem que as organizações gerenciem, descubram, classifiquem e forneçam segurança com eficiência para seus ativos de dados.

Serviço da Microsoft Serviços da AWS Descrição
Microsoft Purview Catálogo de dados do AWS Glue, AWS Lake Formation, Amazon Macie, AWS Identity and Access Management (IAM), AWS Config Ambas as opções fornecem recursos robustos de governança de dados, catalogação e conformidade. O Microsoft Purview é uma solução unificada de governança de dados que permite que as organizações descubram, classifiquem e gerenciem dados em ambientes locais, multinuvem e SaaS. Ele também fornece recursos de conformidade e linhagem de dados. A AWS fornece funcionalidades semelhantes com vários serviços: AWS Glue Data Catalog para gerenciamento de metadados, AWS Lake Formation para criação e governança de data lake, Amazon Macie para classificação e proteção de dados, AWS IAM para controle de acesso e AWS Config para gerenciamento de configuração e rastreamento de conformidade.

Plataforma completa vs. serviços da AWS

O Microsoft Fabric fornece uma plataforma completa que unifica os dados e os serviços de IA necessários para soluções de análise modernas. Ele agiliza o processo de movimentação de dados entre serviços, fornece governança e segurança unificadas e simplifica os modelos de preços. Essa abordagem unificada contrasta com a abordagem da AWS, na qual os serviços geralmente são usados separadamente e exigem mais esforço para serem integrados. O Fabric fornece integração perfeita entre essas funções que podem ajudar sua organização a acelerar suas iniciativas controladas por dados no ecossistema do Azure.

Tanto a AWS quanto o Fabric fornecem serviços para integração de dados, processamento, análise, machine learning e inteligência de negócios.

Serviços da AWS Fabric Descrição
AWS Glue, pipeline de dados da AWS Integração de dados com o Azure Data Factory A AWS fornece um conjunto de serviços individuais que podem ser combinados para criar soluções de dados e análises. Essa abordagem fornece flexibilidade, mas requer mais esforço para integrar os serviços em uma solução de ponta a ponta. O Fabric fornece esses recursos em uma única plataforma unificada para simplificar fluxos de trabalho, colaboração e gerenciamento.

Comparação detalhada dos serviços da AWS com os componentes do Fabric

Serviços da AWS Fabric
AWS Glue, pipeline de dados da AWS Integração de dados com o Data Factory
Sessões interativas do Amazon EMR e do AWS Glue Engenharia de dados com o Spark
Amazon Redshift Armazenamento de dados com o Data Warehouse do Synapse
Amazon SageMaker Ciência de dados (integração do Azure Machine Learning)
Amazon Kinesis, serviço gerenciado da Amazon para Apache Flink Análise em tempo real (banco de dados KQL)
Amazon QuickSight Power BI para business intelligence
Amazon S3 Armazenamento unificado de data lake do OneLake
AWS Lake Formation, catálogo de dados do AWS Glue, Amazon Macie Governança de dados (integração com o Microsoft Purview)
Amazon Bedrock, Amazon SageMaker JumpStart IA generativa (integração do Serviço OpenAI do Azure)

Integração de dados e ferramentas ETL

As ferramentas de integração de dados e extração, transformação e carregamento (ETL) ajudam você a extrair, transformar e carregar dados de várias fontes em um sistema unificado para análise.

Serviço AWS Serviço do Azure Análise
Cola da AWS Data Factory O AWS Glue e o Azure Data Factory são serviços ETL totalmente gerenciados que facilitam a integração de dados em várias fontes.
Fluxos de trabalho gerenciados pela Amazon para Apache Airflow (MWAA) Data Factory com pipelines do Azure Synapse Analytics O Apache Airflow fornece orquestração de fluxo de trabalho gerenciado para pipelines de dados complexos. Os pipelines do Azure Synapse Analytics integram o Apache Airflow ao Azure Data Factory para uma experiência mais integrada. O AWS WWAA é uma solução gerenciada do Airflow.
Pipeline de dados da AWS Data Factory O AWS Data Pipeline e o Azure Data Factory permitem a movimentação e o processamento de dados entre serviços e locais.
Serviço de migração de banco de dados (DMS) da AWS Serviço de Migração de Banco de Dados do Azure Esses serviços podem ajudá-lo a migrar bancos de dados para a nuvem com o mínimo de tempo de inatividade. A principal diferença é que o serviço do Azure é otimizado para migração perfeita para bancos de dados do Azure, fornecendo ferramentas de avaliação e recomendação, enquanto o AWS DMS se concentra em migrações dentro do ambiente AWS. O AWS DMS fornece recursos de replicação contínua para arquiteturas híbridas.
Amazon AppFlow Aplicativos Lógicos do Azure Esses serviços permitem fluxos de dados automatizados entre aplicativos e serviços em nuvem sem a necessidade de código. Os Aplicativos Lógicos fornecem recursos de integração abrangentes com uma ampla variedade de conectores e um designer visual. O AppFlow se concentra na transferência segura de dados entre aplicativos SaaS específicos e serviços da AWS e fornece recursos integrados de transformação de dados.
Funções de etapa da AWS Data Factory com Aplicativos Lógicos Esses serviços fornecem orquestração de fluxo de trabalho para coordenar aplicativos e microsserviços distribuídos. O Step Functions foi projetado para orquestrar serviços e microsserviços da AWS em aplicativos sem servidor. Os Aplicativos Lógicos são usados para integração de dados e automação de fluxo de trabalho corporativo.

Data warehousing

Essas soluções são projetadas para armazenar e gerenciar grandes volumes de dados estruturados otimizados para consultas e relatórios.

Serviço AWS Serviço do Azure Análise
Amazon Redshift Azure Synapse Analytics O Amazon Redshift e o Azure Synapse Analytics são serviços de data warehouse em escala de petabytes totalmente gerenciados projetados para análise e geração de relatórios de dados em grande escala. A principal diferença é que o Azure Synapse Analytics fornece uma plataforma de análise unificada que combina data warehouse e processamento de Big Data, enquanto o Redshift se concentra principalmente em data warehouse.
Espectro do Amazon Redshift Integração do Azure Synapse Analytics com Data Lake Esses serviços permitem que você consulte dados em data warehouses e data lakes sem mover dados. O Azure Synapse Analytics fornece mecanismos integrados do SQL e do Spark. O Redshift Spectrum estende a consulta SQL do Redshift para dados no Amazon S3.
Formação do AWS Lake Azure Synapse Analytics com o Azure Data Lake Storage Esses serviços podem ajudá-lo a criar data lakes seguros para análise. O Azure combina funcionalidades de data lake e data warehouse no Azure Synapse Analytics. A AWS fornece o Lake Formation para data lakes e o Redshift como um serviço de data warehouse separado.
Amazon RDS com consulta federada do Redshift Banco de Dados SQL do Azure Esses serviços dão suporte à consulta em bancos de dados operacionais e data warehouses. O Azure Synapse Analytics fornece uma experiência de análise unificada e interna. A AWS exige que você combine o RDS e o Redshift para obter recursos semelhantes de consulta entre serviços.
Integração do Amazon Aurora com o Redshift Link do Azure Synapse para Azure Cosmos DB Esses serviços fornecem análises de alto desempenho sobre dados operacionais. A AWS exige que você configure pipelines de dados entre o Aurora e o Redshift. Com o Link do Azure Synapse, você não precisa mover dados.

Soluções de data lake

Essas plataformas armazenam grandes quantidades de dados brutos não estruturados e estruturados em seu formato nativo para processamento futuro.

Serviço AWS Serviço do Azure Análise
Amazon S3 Armazenamento do Azure Data Lake O Amazon S3 e o Azure Data Lake Storage são soluções de armazenamento escaláveis para a criação de data lakes para armazenar e analisar grandes volumes de dados. O Data Lake Storage fornece um namespace hierárquico. O Amazon S3 usa uma estrutura plana.
Formação do AWS Lake Azure Synapse Analytics O AWS Lake Formation e o Azure Synapse Analytics podem ajudá-lo a configurar, gerenciar e proteger data lakes para análise. A principal diferença é que o Azure Synapse Analytics fornece um serviço de análise completo que combina data lake, data warehouse e análise de Big Data, enquanto o Lake Formation se concentra em simplificar a criação e o gerenciamento de data lake com recursos robustos de segurança e governança.
Amazon Athena Pools de SQL sem servidor do Azure Synapse Analytics Esses serviços permitem que você consulte dados armazenados em data lakes usando SQL, sem configurar a infraestrutura. O Amazon Athena é uma solução autônoma que se integra a outros serviços da AWS. Os pools de SQL sem servidor fazem parte da plataforma Azure Synapse Analytics.
Catálogo de dados do AWS Glue Microsoft Purview Esses serviços fornecem um repositório de metadados centralizado para armazenar e gerenciar esquemas de dados e metadados para data lakes. O AWS Glue fornece um subconjunto dos recursos do Microsoft Purview. O Microsoft Purview dá suporte à catalogação de dados, ao rastreamento de linhagem e à classificação de dados confidenciais, independentemente de os dados residirem localmente, em uma nuvem ou em um aplicativo SaaS.

Análise de Big Data

Esses serviços processam e analisam conjuntos de dados grandes e complexos para descobrir padrões, insights e tendências. A tabela a seguir fornece comparações diretas de serviços de Big Data individuais. O Microsoft Fabric é um serviço completo para big data e análise. Ele fornece os seguintes serviços e muito mais.

Serviço AWS Serviço do Azure Análise
Amazon EMR Azure HDInsight Ambos os serviços fornecem estruturas de Big Data gerenciadas para processar dados armazenados em data lakes. O EMR fornece estruturas gerenciadas do Hadoop e do Spark. O HDInsight é uma solução empresarial totalmente gerenciada que dá suporte ao Hadoop, Spark, Kafka e outras análises de software livre.
Amazon EMR Azure Databricks Esses serviços permitem o processamento de Big Data por meio do Apache Spark em um ambiente gerenciado. O EMR permite que você execute clusters do Apache Spark com opções flexíveis de configuração e escalabilidade. O Azure Databricks fornece uma plataforma Apache Spark otimizada com notebooks colaborativos e fluxos de trabalho integrados.
Amazon Kinesis Hubs de Eventos do Azure e Azure Stream Analytics Esses serviços fornecem streaming e análise de dados em tempo real para processar e analisar fluxos de dados de alto volume.
AWS Glue com o AWS Glue Studio Azure Synapse Analytics com pools do Apache Spark Ambos os serviços fornecem recursos de processamento de big data com transformação e análise de dados integradas.

Business intelligence e geração de relatórios

Esses serviços fornecem visualização de dados, relatórios e painéis para ajudar as empresas a tomar decisões informadas.

Serviço AWS Serviço do Azure Análise
Amazon QuickSight Power BI O QuickSight e o Power BI fornecem ferramentas de análise de negócios para visualização de dados e painéis interativos.
Amazon Managed Grafana Espaço Gerenciado do Azure para Grafana Esses serviços fornecem o Grafana gerenciado, que permite visualizar métricas, logs e rastreamentos em várias fontes de dados.
Troca de dados da AWS Azure Data Share Esses serviços facilitam o compartilhamento seguro e a troca de dados entre as organizações. O Data Exchange fornece um modelo de mercado. O Data Share se concentra no compartilhamento de dados entre locatários.
Amazon OpenSearch Service com Kibana Azure Data Explorer com painéis Esses serviços fornecem exploração de dados em tempo real e análise interativa em grandes volumes de dados. O OpenSearch usa o Kibana para pesquisa e visualização. O Azure Data Explorer usa o Kusto, que é otimizado para ingestão e consulta rápidas de dados.

Processamento de dados em tempo real

Esses sistemas ingerem e analisam dados à medida que são gerados para fornecer insights e respostas imediatas.

Serviço AWS Serviço do Azure Análise
Amazon Kinesis Hubs de Eventos do Azure e Azure Stream Analytics Esses serviços fornecem streaming e análise de dados em tempo real para processar e analisar fluxos de dados de alto volume. O Kinesis fornece um pacote integrado para streaming e análise de dados na AWS. O Azure separa a ingestão (Hubs de Eventos) e o processamento (Stream Analytics).
Amazon Managed Streaming for Apache Kafka (MSK) Azure HDInsight com Apache Kafka Esses serviços fornecem clusters gerenciados do Apache Kafka para criar pipelines e aplicativos de dados de streaming em tempo real.
AWS Lambda Azure Functions Essas plataformas de computação sem servidor executam código em resposta a eventos e gerenciam automaticamente os recursos de computação subjacentes.
Amazon DynamoDB Streams Feed de alterações do Azure Cosmos DB Esses serviços permitem o processamento de dados em tempo real, capturando e fornecendo um fluxo de modificações de dados.
Amazon ElastiCache com streams do Redis Cache do Azure para Redis com fluxos do Redis Esses serviços fornecem instâncias gerenciadas do Redis que oferecem suporte a streams do Redis para ingestão e processamento de dados em tempo real.
Análise do Amazon IoT Hub IoT do Azure com o Azure Stream Analytics Esses serviços permitem processar e analisar dados de dispositivos IoT em tempo real. O AWS IoT Analytics fornece recursos integrados de armazenamento e análise de dados. O Azure fornece serviços modulares: o Hub IoT lida com a ingestão e o Stream Analytics processa os dados.

Serviços de aprendizado de máquina

Essas ferramentas e plataformas permitem o desenvolvimento, o treinamento e a implantação de modelos de aprendizado de máquina.

Serviço AWS Serviço do Azure Análise
Amazon SageMaker Azure Machine Learning Essas plataformas abrangentes permitem que você crie, treine e implante modelos de aprendizado de máquina.
AWS Deep Learning AMIs Máquina Virtual de Ciência de Dados do Azure Esses serviços fornecem máquinas virtuais pré-configuradas otimizadas para cargas de trabalho de aprendizado de máquina e ciência de dados.
Piloto automático do Amazon SageMaker Aprendizado de máquina automatizado (AutoML) Esses serviços fornecem aprendizado de máquina automatizado para criar e treinar modelos.
Estúdio do Amazon SageMaker Azure Machine Learning Studio Esses serviços fornecem ambientes de desenvolvimento integrados para aprendizado de máquina. O SageMaker Studio fornece uma interface unificada para todas as etapas de desenvolvimento de machine learning, incluindo ferramentas de depuração e criação de perfil.

Serviços de inteligência artificial

Os serviços de IA fornecem recursos de IA pré-criados e personalizáveis para aplicativos, incluindo visão, fala, linguagem e tomada de decisão.

Serviço AWS Serviço do Azure Análise
Amazon Rekognition Visão de IA do Azure com OCR e IA Esses serviços fornecem recursos de análise de imagem e vídeo, incluindo reconhecimento de objetos e moderação de conteúdo.
Amazon Polly Fala de IA do Azure (conversão de texto em fala) Você pode usar esses serviços para converter texto em fala realista para permitir que os aplicativos interajam com usuários com vozes que soam naturais.
Amazon Transcribe Fala de IA do Azure Esses serviços convertem a linguagem falada em texto, o que permite que os aplicativos transcrevam fluxos de áudio.
Amazon Tradutor Tradutor de IA do Azure Esses serviços fornecem recursos de tradução automática para traduzir texto de um idioma para outro.
Amazon Compreender Linguagem de IA do Azure Esses serviços analisam o texto para extrair insights como sentimento, frases-chave, entidades e detecção de idioma.
Amazon Lex Serviço de Bot da IA do Azure Você pode usar esses serviços para criar interfaces de conversação e chatbots que usam compreensão de linguagem natural. O Azure fornece uma abordagem modular com serviços separados para a estrutura de desenvolvimento de bot e reconhecimento vocal. O Amazon Lex fornece uma solução integrada para a criação de interfaces de conversação na AWS.
Amazon Textract IA do Azure para Informação de Documentos Ambos os serviços extraem automaticamente texto e dados de documentos e formulários digitalizados usando aprendizado de máquina. O Azure fornece modelos personalizáveis para tipos de documentos específicos, o que permite a extração de dados personalizada. O Textract fornece extração pronta para uso de estruturas de dados complexas.
Serviço Amazon OpenSearch Azure AI Search (pesquisa generativa) O OpenSearch e o AI Search fornecem recursos avançados de pesquisa e análise. Você pode usá-los para padrões comuns de IA, como geração aumentada por recuperação (RAG).

Serviços de IA generativa

Esses serviços de IA criam novos conteúdos ou dados que se assemelham à saída gerada por humanos, como texto, imagens ou áudio.

Serviço AWS Serviços do Azure Análise
Rocha Amazônica do Serviço Azure OpenAI, do Azure AI Foundry O Amazon Bedrock, o Azure AI Foundry e o Azure OpenAI Service fornecem modelos básicos para criar e implantar aplicativos de IA generativos.

Colaboradores

Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.

Autor principal:

Outro colaborador:

  • Adam Cerini - Brasil | Diretor, Estrategista de Tecnologia de Parceiros

Para ver perfis não públicos do LinkedIn, entre no LinkedIn.

Próximas etapas