Общие сведения о возможностях и вариантах использования бессерверных пулов SQL Azure Synapse
Azure Synapse Analytics — это интегрированная служба аналитики, которая объединяет широкий спектр часто используемых технологий для обработки и анализа данных большого объема. Одной из наиболее распространенных технологий, используемых в решениях для обработки данных, является SQL — отраслевой стандартный язык запросов данных и управления ими.
Используйте бессерверный пул SQL в Azure Synapse Analytics
Azure Synapse SQL — это система распределенных запросов в Azure Synapse Analytics для двух типов сред выполнения:
- Бессерверный пул SQL: обработка sql-запросов по запросу в основном используется для работы с данными в озере данных.
- Выделенный пул SQL: экземпляры реляционной базы данных корпоративного масштаба, используемые для размещения хранилищ данных, в которых данные хранятся в реляционных таблицах.
В этом модуле мы сосредоточимся на бессерверном пуле SQL, который предоставляет конечную точку с оплатой за запрос данных в озере данных. Преимущества использования бессерверного пула SQL:
- Знакомый синтаксис Transact-SQL для запрашивания данных на месте без копирования или загрузки в специальное хранилище.
- Интегрированное подключение из широкого ряда инструментов для бизнес-аналитики и ad-hoc-запросов, в том числе для самых популярных драйверов.
- Обработка распределенных запросов, созданная для крупномасштабных данных и вычислительных функций, повышает производительность выполнения запросов.
- Благодаря встроенным механизмам отказоустойчивости при выполнении запросов система обеспечивает высокую надежность и успешное выполнение даже длительных запросов с большими наборами данных.
- Для использования бессерверного пула SQL не нужно настраивать инфраструктуру или обслуживать кластеры. Встроенная конечная точка для этой службы предоставляется в каждой рабочей области Azure Synapse, поэтому можно отправлять запросы к данным сразу после создания рабочей области.
- Плата за резервирование ресурсов не взимается — вы оплачиваете только данные, обработанные выполненными запросами.
Когда следует использовать бессерверные пулы SQL в Azure Synapse
Кроме того, бессерверный пул SQL адаптирован для выполнения запросов к данным в озере данных, поэтому, кроме упрощения управления, исключается необходимость приема данных в систему. Вы просто указываете запрос к данным, которые уже находятся в озере, и выполняете его.
Бессерверная модель ресурсов Synapse SQL отлично подходит для незапланированных или "пиковых" рабочих нагрузок, которые можно обработать с помощью бессерверной конечной точки SQL в рабочей области Azure Synapse Analytics. Бессерверный пул отлично подходит для определения точной стоимости каждого выполняемого запроса, что позволяет отслеживать и распределять расходы.
Примечание.
Бессерверный пул SQL — это система аналитики и не рекомендуется для рабочих нагрузок OLTP, таких как базы данных, используемые приложениями для хранения транзакционных данных. Для бессерверного пула SQL не подходят рабочие нагрузки, требующие времени ответа, составляющего всего несколько миллисекунд, и используемые для определения одной строки в наборе данных.
Распространенные варианты использования бессерверных пулов SQL:
- Исследование данных. Исследование данных позволяет просматривать озеро данных, чтобы получать начальные полезные сведения о данных. Исследование можно выполнять с помощью Azure Synapse Studio. Вы можете просматривать файлы в связанном хранилище озера данных и использовать встроенный бессерверный пул SQL для автоматического создания сценария SQL, чтобы выбрать первые 100 строк из файла или папки так же, как и из таблицы на сервере SQL Server. В связи с этим можно применять проекции, фильтрацию, группировку и выполнять большую часть операций так, как если бы данные находились в обычной таблице на сервере SQL Server.
- Преобразование данных. Azure Synapse Analytics предоставляет широкие возможности преобразования данных с помощью Synapse Spark. Некоторым инженерам по работе с данными может быть проще выполнить преобразование данных с помощью SQL. Бессерверный пул SQL позволяет выполнять преобразования данных на основе SQL либо интерактивно, либо в составе автоматизированного конвейера данных.
- Логическое хранилище данных. После первоначального просмотра данных в озере данных можно определить внешние объекты, такие как таблицы и представления, в бессерверной базе данных SQL. Данные остаются сохраненными в файлах озера данных, но абстрагируются реляционной схемой, которая может использоваться клиентскими приложениями и аналитическими средствами для запроса данных, как это делается в реляционной базе данных, установленной на сервере SQL Server.