Поделиться через


Руководство по настройке производительности для бессерверного пула SQL Azure Synapse Analytics

Область применения: Azure Synapse Analytics

Эта статья поможет повысить производительность бессерверного пула SQL Azure Synapse Analytics.

Примечание.

Просмотрите список известных проблем , которые в настоящее время активны или недавно устранены в Azure Synapse Analytics.

Дополнительные сведения о достижении оптимальной производительности и предотвращении сбоев, связанных с ограничениями ресурсов в бессерверных пулах SQL Azure Synapse Analytics, см. в следующих разделах.

Рекомендации и руководства по устранению неполадок

Сведения и стратегии, приведенные в следующих статьях, помогут повысить производительность бессерверного пула SQL. Мы рекомендуем использовать эти статьи для просмотра вариантов использования и устранения распространенных проблем.

Общие сведения о масштабировании бессерверного пула SQL

Бессерверные пулы SQL не требуют, чтобы вы вручную выбрали нужный размер. Система автоматически настраивает размер на основе требований запроса и тем самым управляет инфраструктурой и выбирает нужный размер решения.

Руководство по настройке производительности файлов Delta Lake

Дополнительные сведения о настройке производительности для файлов Delta Lake см. в следующих ресурсах:

Руководство по настройке производительности для CSV-файлов

При запросе CSV-файлов в бессерверном пуле SQL наиболее важной задачей является обеспечение высокой производительности для создания статистики во внешних таблицах. Хотя статистика автоматически создается в файлах Parquet и CSV и обращается к ним с помощью, чтение CSV-файлов с помощью OPENQUERY()внешних таблиц требует создания статистики вручную.

Дополнительные сведения о роли статистики в запросе CSV-файлов в бессерверных пулах SQL см. в следующих статьях:

Рекомендации по использованию Power BI и других средств отчетности

При использовании Power BI и других средств создания отчетов рекомендуется использовать следующие рекомендации.

  • Обязательно проверьте расположение клиента.
  • Настройте кэш для улучшения взаимодействия с пользователем.
  • Старайтесь не возвращать миллионы записей на панель мониторинга.
  • Используйте запланированные обновления, чтобы избежать параллельных выполнения запросов, которые стекают ресурсы бессерверного пула SQL.
  • Используйте Spark для предварительной статистической обработки общих аналитических запросов. Этот подход "записать один раз и чтение много" может избежать интенсивных запросов, которые выполняются непрерывно.
  • Для соединений между различными хранилищами данных используйте фильтры, чтобы избежать объемов больших данных, которые были перемещены в инфраструктуру Azure.
  • Используйте Latin1_General_100_BIN2_UTF8 параметры сортировки для типов символьных данных. Этот параметр сортировки позволяет избежать передачи всех данных из хранилища в бессерверный пул SQL, передавая фильтры при чтении средств из хранилища.
  • Используйте наиболее оптимальный размер, если выполняется приведение или преобразование данных char в запрос или varchar при выполнении запроса. По возможности избегайте использования VARCHAR(MAX).
  • Автоматическое вывод преобразует типы данных в формат, который может быть неоптимальным. Для оптимизации типов данных используйте предложение WITH.
  • Ресурсы бессерверного пула Azure Synapse SQL имеют ограничения. Одновременное выполнение запросов будет использовать ресурсы. Обычно панели мониторинга Power BI (PBI) достигают ограничений ресурсов при параллельном выполнении нескольких обновлений. Запланированные обновления и нагрузочное тестирование могут помочь избежать этой проблемы. Кроме того, использование нескольких рабочих областей Azure Synapse может решать более широкие требования к параллелизму.
  • Вы можете выполнить запрос sys.columns или использовать sp_describe_first_result_set и select top 0 from <view> проверить типы данных после создания представления. Этот подход быстрее и менее затратен, чем использование SELECT * FROM....
  • Используйте генератор инструкций для автоматического создания оптимальных форматов столбцов для запроса.
  • Используйте функцию OPENJSON для предоставления вложенных данных JSON в виде столбцов. Но если вы также используете AS JSON команду, тип столбца должен быть NVARCHAR(MAX). Этот подход не идеально подходит для производительности. Лучше использовать предложение WITH для предоставления вложенных массивов в качестве столбцов.
  • Ключ секции хранилища транзакций Cosmos DB не используется в аналитическом хранилище. Теперь в Azure Synapse Link можно моделировать данные о транзакциях для оптимизации приема данных и считывания точек данных.

Дополнительные рекомендации и рекомендации

Категория Рекомендуемые действия или документация
Исследование данных Служба хранилища Azure
Хранение результатов запросов в службе хранилища Azure
Логическое хранилище данных
OPENROWSET и внешние таблицы Функция OPENROWSET
Внешние таблицы
Хранимые процедуры
Представления
Преобразования данных
Доступные функции T-SQL в бессерверных пулах SQL Функции T-SQL в пулах Azure Synapse

Заявление об отказе от ответственности за сведения о продуктах сторонних производителей

В этой статье упомянуты программные продукты независимых производителей. Корпорация Майкрософт не дает никаких гарантий, подразумеваемых и прочих, относительно производительности и надежности этих продуктов.