Руководство по настройке производительности для бессерверного пула SQL Azure Synapse Analytics

Статья
11/20/2024

Область применения: Azure Synapse Analytics

Эта статья поможет повысить производительность бессерверного пула SQL Azure Synapse Analytics.

Примечание.

Просмотрите список известных проблем , которые в настоящее время активны или недавно устранены в Azure Synapse Analytics.

Дополнительные сведения о достижении оптимальной производительности и предотвращении сбоев, связанных с ограничениями ресурсов в бессерверных пулах SQL Azure Synapse Analytics, см. в следующих разделах.

Общие сведения о масштабировании бессерверного пула SQL

Бессерверные пулы SQL не требуют, чтобы вы вручную выбрали нужный размер. Система автоматически настраивает размер на основе требований запроса и тем самым управляет инфраструктурой и выбирает нужный размер решения.

Руководство по настройке производительности файлов Delta Lake

Дополнительные сведения о настройке производительности для файлов Delta Lake см. в следующих ресурсах:

Руководство по настройке производительности для CSV-файлов

При запросе CSV-файлов в бессерверном пуле SQL наиболее важной задачей является обеспечение высокой производительности для создания статистики во внешних таблицах. Хотя статистика автоматически создается в файлах Parquet и CSV и обращается к ним с помощью, чтение CSV-файлов с помощью OPENQUERY()внешних таблиц требует создания статистики вручную.

Дополнительные сведения о роли статистики в запросе CSV-файлов в бессерверных пулах SQL см. в следующих статьях:

Рекомендации по использованию Power BI и других средств отчетности

При использовании Power BI и других средств создания отчетов рекомендуется использовать следующие рекомендации.

Обязательно проверьте расположение клиента.
Настройте кэш для улучшения взаимодействия с пользователем.
Старайтесь не возвращать миллионы записей на панель мониторинга.
Используйте запланированные обновления, чтобы избежать параллельных выполнения запросов, которые стекают ресурсы бессерверного пула SQL.
Используйте Spark для предварительной статистической обработки общих аналитических запросов. Этот подход "записать один раз и чтение много" может избежать интенсивных запросов, которые выполняются непрерывно.
Для соединений между различными хранилищами данных используйте фильтры, чтобы избежать объемов больших данных, которые были перемещены в инфраструктуру Azure.
Используйте Latin1_General_100_BIN2_UTF8 параметры сортировки для типов символьных данных. Этот параметр сортировки позволяет избежать передачи всех данных из хранилища в бессерверный пул SQL, передавая фильтры при чтении средств из хранилища.
Используйте наиболее оптимальный размер, если выполняется приведение или преобразование данных char в запрос или varchar при выполнении запроса. По возможности избегайте использования VARCHAR(MAX).
Автоматическое вывод преобразует типы данных в формат, который может быть неоптимальным. Для оптимизации типов данных используйте предложение WITH.
Ресурсы бессерверного пула Azure Synapse SQL имеют ограничения. Одновременное выполнение запросов будет использовать ресурсы. Обычно панели мониторинга Power BI (PBI) достигают ограничений ресурсов при параллельном выполнении нескольких обновлений. Запланированные обновления и нагрузочное тестирование могут помочь избежать этой проблемы. Кроме того, использование нескольких рабочих областей Azure Synapse может решать более широкие требования к параллелизму.
Вы можете выполнить запрос sys.columns или использовать sp_describe_first_result_set и select top 0 from <view> проверить типы данных после создания представления. Этот подход быстрее и менее затратен, чем использование SELECT * FROM....
Используйте генератор инструкций для автоматического создания оптимальных форматов столбцов для запроса.
Используйте функцию OPENJSON для предоставления вложенных данных JSON в виде столбцов. Но если вы также используете AS JSON команду, тип столбца должен быть NVARCHAR(MAX). Этот подход не идеально подходит для производительности. Лучше использовать предложение WITH для предоставления вложенных массивов в качестве столбцов.
Ключ секции хранилища транзакций Cosmos DB не используется в аналитическом хранилище. Теперь в Azure Synapse Link можно моделировать данные о транзакциях для оптимизации приема данных и считывания точек данных.

Дополнительные рекомендации и рекомендации

Категория	Рекомендуемые действия или документация
Исследование данных	Служба хранилища Azure Хранение результатов запросов в службе хранилища Azure Логическое хранилище данных
OPENROWSET и внешние таблицы	Функция OPENROWSET Внешние таблицы Хранимые процедуры Представления Преобразования данных
Доступные функции T-SQL в бессерверных пулах SQL	Функции T-SQL в пулах Azure Synapse

Заявление об отказе от ответственности за сведения о продуктах сторонних производителей

В этой статье упомянуты программные продукты независимых производителей. Корпорация Майкрософт не дает никаких гарантий, подразумеваемых и прочих, относительно производительности и надежности этих продуктов.

Поделиться через

Руководство по настройке производительности для бессерверного пула SQL Azure Synapse Analytics

Рекомендации и руководства по устранению неполадок

Общие сведения о масштабировании бессерверного пула SQL

Руководство по настройке производительности файлов Delta Lake

Руководство по настройке производительности для CSV-файлов

Рекомендации по использованию Power BI и других средств отчетности

Дополнительные рекомендации и рекомендации

Обратная связь

Дополнительные ресурсы