Общие сведения о возможностях и вариантах использования бессерверных пулов SQL Azure Synapse

Завершено

Azure Synapse Analytics — это интегрированная служба аналитики, которая объединяет широкий спектр часто используемых технологий для обработки и анализа данных большого объема. Одной из наиболее распространенных технологий, используемых в решениях для обработки данных, является SQL — отраслевой стандартный язык запросов данных и управления ими.

Используйте бессерверный пул SQL в Azure Synapse Analytics

Azure Synapse SQL — это система распределенных запросов в Azure Synapse Analytics для двух типов сред выполнения:

  • Бессерверный пул SQL: обработка sql-запросов по запросу в основном используется для работы с данными в озере данных.
  • Выделенный пул SQL: экземпляры реляционной базы данных корпоративного масштаба, используемые для размещения хранилищ данных, в которых данные хранятся в реляционных таблицах.

В этом модуле мы сосредоточимся на бессерверном пуле SQL, который предоставляет конечную точку с оплатой за запрос данных в озере данных. Преимущества использования бессерверного пула SQL:

  • Знакомый синтаксис Transact-SQL для запрашивания данных на месте без копирования или загрузки в специальное хранилище.
  • Интегрированное подключение из широкого ряда инструментов для бизнес-аналитики и ad-hoc-запросов, в том числе для самых популярных драйверов.
  • Обработка распределенных запросов, созданная для крупномасштабных данных и вычислительных функций, повышает производительность выполнения запросов.
  • Благодаря встроенным механизмам отказоустойчивости при выполнении запросов система обеспечивает высокую надежность и успешное выполнение даже длительных запросов с большими наборами данных.
  • Для использования бессерверного пула SQL не нужно настраивать инфраструктуру или обслуживать кластеры. Встроенная конечная точка для этой службы предоставляется в каждой рабочей области Azure Synapse, поэтому можно отправлять запросы к данным сразу после создания рабочей области.
  • Плата за резервирование ресурсов не взимается — вы оплачиваете только данные, обработанные выполненными запросами.

Когда следует использовать бессерверные пулы SQL в Azure Synapse

Кроме того, бессерверный пул SQL адаптирован для выполнения запросов к данным в озере данных, поэтому, кроме упрощения управления, исключается необходимость приема данных в систему. Вы просто указываете запрос к данным, которые уже находятся в озере, и выполняете его.

Бессерверная модель ресурсов Synapse SQL отлично подходит для незапланированных или "пиковых" рабочих нагрузок, которые можно обработать с помощью бессерверной конечной точки SQL в рабочей области Azure Synapse Analytics. Бессерверный пул отлично подходит для определения точной стоимости каждого выполняемого запроса, что позволяет отслеживать и распределять расходы.

Примечание.

Бессерверный пул SQL — это система аналитики и не рекомендуется для рабочих нагрузок OLTP, таких как базы данных, используемые приложениями для хранения транзакционных данных. Для бессерверного пула SQL не подходят рабочие нагрузки, требующие времени ответа, составляющего всего несколько миллисекунд, и используемые для определения одной строки в наборе данных.

Распространенные варианты использования бессерверных пулов SQL:

  • Исследование данных. Исследование данных позволяет просматривать озеро данных, чтобы получать начальные полезные сведения о данных. Исследование можно выполнять с помощью Azure Synapse Studio. Вы можете просматривать файлы в связанном хранилище озера данных и использовать встроенный бессерверный пул SQL для автоматического создания сценария SQL, чтобы выбрать первые 100 строк из файла или папки так же, как и из таблицы на сервере SQL Server. В связи с этим можно применять проекции, фильтрацию, группировку и выполнять большую часть операций так, как если бы данные находились в обычной таблице на сервере SQL Server.
  • Преобразование данных. Azure Synapse Analytics предоставляет широкие возможности преобразования данных с помощью Synapse Spark. Некоторым инженерам по работе с данными может быть проще выполнить преобразование данных с помощью SQL. Бессерверный пул SQL позволяет выполнять преобразования данных на основе SQL либо интерактивно, либо в составе автоматизированного конвейера данных.
  • Логическое хранилище данных. После первоначального просмотра данных в озере данных можно определить внешние объекты, такие как таблицы и представления, в бессерверной базе данных SQL. Данные остаются сохраненными в файлах озера данных, но абстрагируются реляционной схемой, которая может использоваться клиентскими приложениями и аналитическими средствами для запроса данных, как это делается в реляционной базе данных, установленной на сервере SQL Server.