Поделиться через


Руководство по принятию решений Microsoft Fabric. Выбор между хранилищем и Lakehouse

Microsoft Fabric предлагает две рабочие нагрузки корпоративного формата, открытые стандартные для хранения данных: Склад и Lakehouse. В этой статье сравниваются две платформы и точки принятия решений для каждого.

Критерий

диаграмма, содержащая деревья принятия решений для Lakehouse и Warehouse в Microsoft Fabric.

Решения No Code или Pro Code: как вы хотите развиваться?

  • Искра
    • Используйте Lakehouse
  • T-SQL
    • Используйте хранилище

потребности в хранилище: требуются ли транзакции с несколькими таблицами?

  • Да
    • Использование хранилища
  • Нет
    • Используйте Lakehouse

сложности данных: какой тип данных вы анализируете?

  • Не знаю
    • Используйте Lakehouse
  • Неструктурированные и структурированные данные
    • Использование Lakehouse
  • Структурированные данные только
    • Используйте хранилище

Выберите службу кандидата

Выполните подробную оценку службы, чтобы убедиться, что она соответствует вашим потребностям.

Элемент хранилища в Хранилище данных Fabric — это хранилище данных корпоративного масштаба с открытым стандартным форматом.

  • Производительность обеспечивается без сложных настроек, с минимальными усилиями на установку и развертывание, при этом нет необходимости в конфигурации вычислительных ресурсов или хранилища. ​
  • Простой и интуитивно понятный интерфейс хранилища для начинающих и опытных специалистов по данным (без/pro кода).
  • Хранилище, ориентированное на озеро, хранит данные в OneLake в открытом формате Delta с простым восстановлением и управлением данными.
  • Полностью интегрирована со всеми рабочими нагрузками Fabric.
  • Масштабируемая загрузка и преобразование данных с полными гарантиями многотабличных транзакций, обеспечиваемыми движком SQL.
  • Виртуальные хранилища с запросами между базами данных и полностью интегрированным семантическим уровнем.
  • Платформа, готовая для корпоративного использования, с конечной до конечной производительностью и мониторингом использования, со встроенным управлением и безопасностью.
  • Гибкость в создании хранилища данных или сетки данных на основе потребностей организации и выбора без кода, низкого кода или T-SQL для преобразований.

Элемент Lakehouse в Fabric Data Engineering — это платформа архитектуры данных для хранения, управления и анализа структурированных и неструктурированных данных в одном расположении.

  • Хранение, управление и анализ структурированных и неструктурированных данных в одном расположении для получения аналитических сведений и принятия решений быстрее и эффективно.
  • Гибкое и масштабируемое решение, позволяющее организациям обрабатывать большие объемы данных всех типов и размеров.
  • Легко принимать данные из многих различных источников, преобразуя их в унифицированный формат Delta
  • Автоматическое обнаружение и регистрация таблиц для полностью управляемого процесса преобразования файлов в таблицы для инженеров данных и специалистов по данным. ​
  • Автоматическая конечная точка аналитики SQL и набор данных по умолчанию, который позволяет T-SQL запрашивать разностные таблицы в озере

Оба включены в возможности Power BI Premium и/или Fabric.

Сравнение различных возможностей хранения

В этой таблице сравнивается хранилище данных с конечной точкой SQL-аналитики в Lakehouse.

Предложение Microsoft Fabric

Склад

конечная точка аналитики SQL Lakehouse


Основные возможности

ACID-соответствующее полное хранилище данных с поддержкой транзакций на T-SQL.

Только для чтения, автоматически созданная системой точка доступа аналитики SQL для Lakehouse, предназначенная для запросов и работы с T-SQL. Поддерживает аналитику на таблицах Lakehouse Delta и папках Delta Lake, упоминаемых через ярлыки и.


Профиль разработчика

Разработчики SQL или разработчики граждан

Инженеры данных или разработчики SQL


Загрузка данных

SQL, конвейеры, потоки данных

Spark, конвейеры, потоки данных, сочетания клавиш


Поддержка таблицы Delta

Считывает и записывает разностные таблицы

Считывает разностные таблицы


Уровень хранилища

Формат открытых данных — delta

Формат открытых данных — delta


Рекомендуемый вариант использования

  • Хранение данных для корпоративного использования
  • Хранилище данных, поддерживающее использование в отделах, бизнес-единицах или для самостоятельного использования
  • Структурированный анализ данных в T-SQL с таблицами, представлениями, процедурами и функциями и расширенной поддержкой SQL для бизнес-аналитики
  • Изучение и выполнение запросов к дельта-таблицам из лейкхауса
  • Промежуточные данные и зона архивации для анализа
  • архитектура Medallion Lakehouse с зонами для анализа бронзы, серебра и золота
  • Связывание с хранилищем для вариантов использования аналитики предприятия

Опыт разработки

  • Редактор хранилища с полной поддержкой приема данных T-SQL, моделирования, разработки и пользовательского интерфейса для операций приема данных, моделирования и выполнения запросов.
  • Поддержка чтения и записи для 1-го и 3-го стороннего инструментов
  • Конечная точка аналитики SQL Lakehouse с ограниченной поддержкой T-SQL для представлений, табличных функций и запросов SQL
  • Пользовательские интерфейсы для моделирования и запросов
  • Ограниченная поддержка T-SQL для инструментов первой и третьей стороны.

Возможности T-SQL

Полная поддержка DQL, DML и DDL T-SQL, полная поддержка транзакций

Full DQL, No DML, limited DDL T-SQL Support, например, представления SQL и табличные функции (TVFs)