Поделиться через


Данные и искусственный интеллект

В этой статье сравниваются основные службы данных Azure и ИИ с соответствующими службами Amazon Web Services (AWS).

Сравнение других служб AWS и Azure см. в Azure для специалистов по AWS.

Управление данными, управление и платформы

Microsoft Purview и сочетание служб AWS, описанных в следующей таблице, предназначены для предоставления комплексных решений по управлению данными. Эти решения позволяют организациям эффективно управлять, обнаруживать, классифицировать и обеспечивать безопасность для своих ресурсов данных.

Служба Майкрософт Службы AWS Description
Microsoft Purview AWS Glue Каталог данных, AWS Lake Formation, Amazon Macie, AWS Identity and Access Management (IAM), AWS Config Оба варианта обеспечивают надежное управление данными, каталогизацию и функции соответствия требованиям. Microsoft Purview — это единое решение для управления данными, которое позволяет организациям обнаруживать, классифицировать и управлять данными в локальных, многооблачных и saaS-средах. Он также предоставляет возможности происхождения данных и соответствия требованиям. AWS предоставляет аналогичные функциональные возможности с несколькими службами: AWS Glue Каталог данных для управления метаданными, AWS Lake Formation для создания озера данных и управления, Amazon Macie для классификации и защиты данных, AWS IAM для контроля доступа и AWS Config для управления конфигурацией и отслеживания соответствия требованиям.

Все одноплатформенные службы и службы AWS

Microsoft Fabric предоставляет встроенную платформу, которая объединяет службы данных и ИИ, необходимые для современных решений аналитики. Это упрощает процесс перемещения данных между службами, обеспечивает унифицированное управление и безопасность, а также упрощает модели ценообразования. Этот унифицированный подход контрастирует с подходом AWS, в котором службы часто используются отдельно и требуют больше усилий для интеграции. Fabric обеспечивает простую интеграцию с этими функциями, которые помогут вашей организации ускорить инициативы на основе данных в экосистеме Azure.

AWS и Fabric предоставляют службы для интеграции данных, обработки, аналитики, машинного обучения и бизнес-аналитики.

Службы AWS Fabric Description
AWS Glue, AWS Data Pipeline Интеграция данных с Фабрика данных Azure AWS предоставляет набор отдельных служб, которые можно объединить для создания решений для обработки данных и аналитики. Этот подход обеспечивает гибкость, но требует больше усилий для интеграции служб в комплексное решение. Fabric предоставляет эти возможности в рамках единой платформы для упрощения рабочих процессов, совместной работы и управления.

Подробное сравнение служб AWS с компонентами Fabric

Службы AWS Fabric
AWS Glue, AWS Data Pipeline Интеграция данных с Фабрикой данных
Интерактивные сеансы Amazon EMR, AWS Glue Проектирование данных с помощью Spark
Amazon Redshift Хранение данных с помощью хранилища данных Synapse
Amazon SageMaker Обработка и анализ данных (интеграция Машинное обучение Azure)
Amazon Kinesis, Amazon Managed Service для Apache Flink Аналитика в режиме реального времени (база данных KQL)
Amazon QuickSight Power BI для бизнес-аналитики
Amazon S3 Единое хранилище озера данных OneLake
AWS Lake Formation, AWS Glue Каталог данных, Amazon Macie Управление данными (интеграция Microsoft Purview)
Amazon Bedrock, Amazon SageMaker JumpStart Создание искусственного интеллекта (интеграция Azure OpenAI Service)

Средства интеграции данных и ETL

Средства интеграции данных и извлечения, преобразования, загрузки (ETL) помогают извлекать, преобразовывать, загружать данные из нескольких источников в единую систему для анализа.

Служба AWS Служба Azure Анализ
AWS Glue Фабрика данных AWS Glue и Фабрика данных Azure являются полностью управляемыми службами ETL, которые упрощают интеграцию данных между различными источниками.
Управляемые рабочие процессы Amazon для Apache Airflow (MWAA) Фабрика данных с конвейерами Azure Synapse Analytics Apache Airflow обеспечивает оркестрацию управляемых рабочих процессов для сложных конвейеров данных. Конвейеры Azure Synapse Analytics интегрируют Apache Airflow с Фабрика данных Azure для более интегрированного интерфейса. AWS MWAA — это управляемое решение Airflow.
Конвейер данных AWS Фабрика данных Конвейер данных AWS и Фабрика данных Azure включить перемещение и обработку данных между службами и расположениями.
AWS Database Migration Service (DMS) Миграция баз данных Azure Эти службы помогают перенести базы данных в облако с минимальным временем простоя. Основное различие заключается в том, что служба Azure оптимизирована для простой миграции в базы данных Azure, предоставляя средства оценки и рекомендаций, в то время как AWS DMS фокусируется на миграции в среде AWS. AWS DMS предоставляет текущие функции репликации для гибридных архитектур.
Amazon AppFlow Приложения логики Azure Эти службы позволяют автоматизированным потокам данных между облачными приложениями и службами, не требуя кода. Logic Apps предоставляет широкие возможности интеграции с широким спектром соединителей и визуальным конструктором. AppFlow фокусируется на безопасном передаче данных между конкретными приложениями SaaS и службами AWS и предоставляет встроенные функции преобразования данных.
Функции шага AWS Фабрика данных с помощью Logic Apps Эти службы обеспечивают оркестрацию рабочих процессов для координации распределенных приложений и микрослужб. Функции шага предназначены для оркестрации служб AWS и микрослужб в бессерверных приложениях. Logic Apps используется как для интеграции данных, так и для автоматизации корпоративных рабочих процессов.

Хранение данных

Эти решения предназначены для хранения больших объемов структурированных данных, оптимизированных для запросов и отчетов.

Служба AWS Служба Azure Анализ
Amazon Redshift Azure Synapse Analytics Amazon Redshift и Azure Synapse Analytics являются полностью управляемыми, петабайтово-масштабируемыми службами хранения данных, предназначенными для крупномасштабной аналитики и отчетности. Основное различие заключается в том, что Azure Synapse Analytics предоставляет единую платформу аналитики, которая объединяет хранение данных и обработку больших данных, в то время как Redshift фокусируется в основном на хранилище данных.
Amazon Redshift Spectrum Azure Synapse Analytics с интеграцией Data Lake Эти службы позволяют запрашивать данные между хранилищами данных и озерами данных без перемещения данных. Azure Synapse Analytics предоставляет интегрированные подсистемы SQL и Spark. Redshift Spectrum расширяет SQL-запрос Redshift к данным в Amazon S3.
Формирование AWS Lake Azure Synapse Analytics с Azure Data Lake Storage Эти службы помогут вам создать безопасные озера данных для аналитики. Azure объединяет функции озера данных и хранилища данных в Azure Synapse Analytics. AWS предоставляет создание озера для озер данных и Redshift в качестве отдельной службы хранилища данных.
Amazon RDS с федеративными запросами Redshift База данных SQL Azure Эти службы поддерживают запросы между операционными базами данных и хранилищами данных. Azure Synapse Analytics предоставляет единый встроенный интерфейс аналитики. AWS требует объединения RDS и Redshift для аналогичных возможностей запросов между службами.
Amazon Aurora с интеграцией Redshift Сведения об Azure Synapse Link для Azure Cosmos DB Эти службы обеспечивают высокопроизводительную аналитику по операционным данным. ДЛЯ AWS требуется настроить конвейеры данных между Авророй и Redshift. При использовании Azure Synapse Link вам не нужно перемещать данные.

Решения озера данных

Эти платформы хранят огромные объемы необработанных неструктурированных и структурированных данных в собственном формате для последующей обработки.

Служба AWS Служба Azure Анализ
Amazon S3 Хранилище озера данных Azure Amazon S3 и Azure Data Lake Storage — это масштабируемые решения для создания озер данных для хранения и анализа больших объемов данных. Data Lake Storage предоставляет иерархическое пространство имен. Amazon S3 использует плоскую структуру.
Формирование AWS Lake Azure Synapse Analytics AWS Lake Formation и Azure Synapse Analytics помогут вам настроить, управлять и защищать озера данных для аналитики. Основное отличие заключается в том, что Azure Synapse Analytics предоставляет службу аналитики с одним интерфейсом, которая объединяет озеро данных, хранилище данных и аналитику больших данных, в то время как Создание озера данных ориентировано на упрощение создания озера данных и управления с помощью надежных функций безопасности и управления.
Amazon Athena Бессерверные пулы SQL Azure Synapse Analytics Эти службы позволяют запрашивать данные, хранящиеся в озерах данных с помощью SQL, без настройки инфраструктуры. Amazon Athena — это автономное решение, которое интегрируется с другими службами AWS. Бессерверные пулы SQL являются частью платформы Azure Synapse Analytics.
AWS Glue Каталог данных Microsoft Purview Эти службы предоставляют централизованный репозиторий метаданных для хранения схем данных и управления ими для озер данных. AWS Glue предоставляет подмножество функций Microsoft Purview. Microsoft Purview поддерживает каталогизацию данных, отслеживание происхождения и классификацию конфиденциальных данных, расположение данных в локальной среде, в облаке или в приложении SaaS.

Аналитика больших данных

Эти службы обрабатывают и анализируют большие и сложные наборы данных для выявления шаблонов, аналитических сведений и тенденций. В следующей таблице приведены прямые сравнения отдельных служб больших данных. Microsoft Fabric — это единая служба для больших данных и аналитики. Он предоставляет следующие службы и многое другое.

Служба AWS Служба Azure Анализ
Amazon EMR Azure HDInsight Обе службы предоставляют управляемые платформы больших данных для обработки данных, хранящихся в озерах данных. EMR предоставляет управляемые платформы Hadoop и Spark. HDInsight — это полностью управляемое корпоративное решение, которое поддерживает Hadoop, Spark, Kafka и другие открытый код аналитики.
Amazon EMR Azure Databricks Эти службы позволяют обрабатывать большие данные с помощью Apache Spark в управляемой среде. EMR позволяет запускать кластеры Apache Spark с гибкими параметрами конфигурации и масштабирования. Azure Databricks предоставляет оптимизированную платформу Apache Spark с совместными записными книжками и интегрированными рабочими процессами.
Amazon Kinesis Центры событий Azure и Azure Stream Analytics Эти службы предоставляют потоковую передачу и аналитику данных в режиме реального времени для обработки и анализа потоков данных с большим объемом.
AWS Glue с AWS Glue Studio Azure Synapse Analytics с пулами Apache Spark Обе службы предоставляют возможности обработки больших данных с интегрированным преобразованием данных и аналитикой.

Бизнес-аналитика и отчетность

Эти службы предоставляют визуализацию данных, отчеты и панели мониторинга, помогающие предприятиям принимать обоснованные решения.

Служба AWS Служба Azure Анализ
Amazon QuickSight Power BI QuickSight и Power BI предоставляют средства бизнес-аналитики для визуализации данных и интерактивных панелей мониторинга.
Amazon Managed Grafana Управляемая Grafana Azure Эти службы предоставляют управляемый Grafana, который позволяет визуализировать метрики, журналы и трассировки в нескольких источниках данных.
Обмен данными AWS Azure Data Share Эти службы упрощают безопасный общий доступ и обмен данными между организациями. Обмен данными предоставляет модель Marketplace. Общий доступ к данным ориентирован на общий доступ к данным между клиентами.
Amazon OpenSearch Service с Kibana Azure Data Explorer с панелями мониторинга Эти службы предоставляют анализ данных в режиме реального времени и интерактивную аналитику по большим объемам данных. OpenSearch использует Kibana для поиска и визуализации. Azure Data Explorer использует Kusto, оптимизированный для быстрого приема и запроса данных.

Обработка данных в режиме реального времени

Эти системы прием и анализ данных по мере его создания обеспечивают немедленную аналитику и ответы.

Служба AWS Служба Azure Анализ
Amazon Kinesis Центры событий Azure и Azure Stream Analytics Эти службы предоставляют потоковую передачу и аналитику данных в режиме реального времени для обработки и анализа потоков данных с большим объемом. Kinesis предоставляет интегрированный набор для потоковой передачи данных и аналитики в AWS. Azure разделяет прием (центры событий) и обработку (Stream Analytics).
Amazon Managed Streaming for Apache Kafka (MSK) Azure HDInsight с Apache Kafka Эти службы предоставляют управляемые кластеры Apache Kafka для создания конвейеров и приложений потоковой передачи в режиме реального времени.
AWS Лямбда Функции Azure Эти бессерверные вычислительные платформы выполняют код в ответ на события и автоматически управляют базовыми вычислительными ресурсами.
Amazon DynamoDB Streams Канал изменений Azure Cosmos DB Эти службы обеспечивают обработку данных в режиме реального времени путем записи и предоставления потока изменений данных.
Amazon ElastiCache с потоками Redis Кэш Azure для Redis с потоками Redis Эти службы предоставляют управляемые экземпляры Redis, поддерживающие потоки Redis для приема и обработки данных в режиме реального времени.
Аналитика Amazon IoT Центр Интернета вещей Azure с Помощью Azure Stream Analytics Эти службы позволяют обрабатывать и анализировать данные с устройств Интернета вещей в режиме реального времени. AWS IoT Analytics предоставляет встроенные возможности хранения и анализа данных. Azure предоставляет модульные службы: Центр Интернета вещей обрабатывает прием данных, а Stream Analytics обрабатывает данные.

Службы машинного обучения

Эти средства и платформы позволяют разрабатывать, обучать и развертывать модели машинного обучения.

Служба AWS Служба Azure Анализ
Amazon SageMaker Машинное обучение Azure Эти комплексные платформы позволяют создавать, обучать и развертывать модели машинного обучения.
ИНТЕРФЕЙСы AMIS для глубокого обучения AWS Azure Виртуальная машина для обработки и анализа данных Эти службы предоставляют предварительно настроенные виртуальные машины, оптимизированные для рабочих нагрузок машинного обучения и обработки и анализа данных.
Amazon SageMaker Autopilot Автоматизированное машинное обучение (AutoML) Эти службы предоставляют автоматизированное машинное обучение для создания и обучения моделей.
Amazon SageMaker Studio Студия машинного обучения Azure Эти службы предоставляют интегрированные среды разработки для машинного обучения. SageMaker Studio предоставляет единый интерфейс для всех шагов разработки машинного обучения, включая средства отладки и профилирования.

Службы искусственного интеллекта

Службы ИИ предоставляют предварительно созданные, настраиваемые возможности искусственного интеллекта для приложений, включая визуальное распознавание, речь, язык и принятие решений.

Служба AWS Служба Azure Анализ
Amazon Rekognition Распознавание ИИ Azure с помощью OCR и ИИ Эти службы предоставляют возможности анализа изображений и видео, в том числе распознавание объектов и con режим палатки ration.
Amazon Polly Речь СИ Azure (текст в речь) Эти службы можно использовать для преобразования текста в жизненную речь, чтобы приложения могли взаимодействовать с пользователями с естественным звуком голоса.
Amazon Transcribe Речь ИИ Azure Эти службы преобразуют речь в текст, что позволяет приложениям транскрибировать звуковые потоки.
Amazon Translate Azure AI Translator Эти службы предоставляют возможности машинного перевода для перевода текста с одного языка на другой.
Amazon Понять Язык ИИ Azure Эти службы анализируют текст для извлечения аналитических сведений, таких как тональность, ключевые фразы, сущности и обнаружение языка.
Amazon Lex Azure AI Служба Bot Эти службы можно использовать для создания диалоговых интерфейсов и чат-ботов, использующих распознавание естественного языка. Azure предоставляет модульный подход с отдельными службами для платформы разработки ботов и распознавания речи. Amazon Lex предоставляет интегрированное решение для создания диалоговых интерфейсов в AWS.
Amazon Textract Аналитика документов ИИ Azure Обе эти службы автоматически извлекают текст и данные из сканированных документов и форм с помощью машинного обучения. Azure предоставляет настраиваемые модели для определенных типов документов, которые позволяют извлекать данные с учетом. Textract обеспечивает извлечение сложных структур данных вне поля.
Amazon OpenSearch Service Поиск ИИ Azure (создание поиска) OpenSearch и поиск ИИ предоставляют мощные возможности поиска и аналитики. Их можно использовать для распространенных шаблонов ИИ, таких как получение дополненного поколения (RAG).

Службы создания искусственного интеллекта

Эти службы искусственного интеллекта создают новое содержимое или данные, которые похожи на выходные данные, созданные человеком, например текст, изображения или звук.

Служба AWS Службы Azure; Анализ
Amazon Bedrock Azure OpenAI ServiceAzure AI Foundry Amazon Bedrock, Azure AI Foundry и Azure OpenAI Service предоставляют базовые модели для создания и развертывания создаваемых приложений ИИ.

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участниками.

Автор субъекта:

Другой участник:

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.

Следующие шаги