Руководство по настройке производительности для бессерверного пула SQL Azure Synapse Analytics
Область применения: Azure Synapse Analytics
Эта статья поможет повысить производительность бессерверного пула SQL Azure Synapse Analytics.
Примечание.
Просмотрите список известных проблем , которые в настоящее время активны или недавно устранены в Azure Synapse Analytics.
Дополнительные сведения о достижении оптимальной производительности и предотвращении сбоев, связанных с ограничениями ресурсов в бессерверных пулах SQL Azure Synapse Analytics, см. в следующих разделах.
Рекомендации и руководства по устранению неполадок
Сведения и стратегии, приведенные в следующих статьях, помогут повысить производительность бессерверного пула SQL. Мы рекомендуем использовать эти статьи для просмотра вариантов использования и устранения распространенных проблем.
- Рекомендации по использованию бессерверного пула SQL в Azure Synapse Analytics
- Устранение неполадок с бессерверным пулом SQL в Azure Synapse Analytics
Общие сведения о масштабировании бессерверного пула SQL
Бессерверные пулы SQL не требуют, чтобы вы вручную выбрали нужный размер. Система автоматически настраивает размер на основе требований запроса и тем самым управляет инфраструктурой и выбирает нужный размер решения.
Руководство по настройке производительности файлов Delta Lake
Дополнительные сведения о настройке производительности для файлов Delta Lake см. в следующих ресурсах:
- Страница документации по Delta Lake.
- Сведения о Delta Lake
- Запрос файлов Delta Lake с использованием бессерверного пула SQL в Azure Synapse Analytics
Руководство по настройке производительности для CSV-файлов
При запросе CSV-файлов в бессерверном пуле SQL наиболее важной задачей является обеспечение высокой производительности для создания статистики во внешних таблицах. Хотя статистика автоматически создается в файлах Parquet и CSV и обращается к ним с помощью, чтение CSV-файлов с помощью OPENQUERY()
внешних таблиц требует создания статистики вручную.
Дополнительные сведения о роли статистики в запросе CSV-файлов в бессерверных пулах SQL см. в следующих статьях:
- Запрос CSV-файлов
- Статистика в бессерверном пуле SQL
- Создание статистики для файлов CSV вручную
- Истекло время ожидания запроса
Рекомендации по использованию Power BI и других средств отчетности
При использовании Power BI и других средств создания отчетов рекомендуется использовать следующие рекомендации.
- Обязательно проверьте расположение клиента.
- Настройте кэш для улучшения взаимодействия с пользователем.
- Старайтесь не возвращать миллионы записей на панель мониторинга.
- Используйте запланированные обновления, чтобы избежать параллельных выполнения запросов, которые стекают ресурсы бессерверного пула SQL.
- Используйте Spark для предварительной статистической обработки общих аналитических запросов. Этот подход "записать один раз и чтение много" может избежать интенсивных запросов, которые выполняются непрерывно.
- Для соединений между различными хранилищами данных используйте фильтры, чтобы избежать объемов больших данных, которые были перемещены в инфраструктуру Azure.
- Используйте
Latin1_General_100_BIN2_UTF8
параметры сортировки для типов символьных данных. Этот параметр сортировки позволяет избежать передачи всех данных из хранилища в бессерверный пул SQL, передавая фильтры при чтении средств из хранилища. - Используйте наиболее оптимальный размер, если выполняется приведение или преобразование данных
char
в запрос илиvarchar
при выполнении запроса. По возможности избегайте использованияVARCHAR(MAX)
. - Автоматическое вывод преобразует типы данных в формат, который может быть неоптимальным. Для оптимизации типов данных используйте предложение
WITH
. - Ресурсы бессерверного пула Azure Synapse SQL имеют ограничения. Одновременное выполнение запросов будет использовать ресурсы. Обычно панели мониторинга Power BI (PBI) достигают ограничений ресурсов при параллельном выполнении нескольких обновлений. Запланированные обновления и нагрузочное тестирование могут помочь избежать этой проблемы. Кроме того, использование нескольких рабочих областей Azure Synapse может решать более широкие требования к параллелизму.
- Вы можете выполнить запрос
sys.columns
или использоватьsp_describe_first_result_set
иselect top 0 from <view>
проверить типы данных после создания представления. Этот подход быстрее и менее затратен, чем использованиеSELECT * FROM...
. - Используйте генератор инструкций для автоматического создания оптимальных форматов столбцов для запроса.
- Используйте функцию
OPENJSON
для предоставления вложенных данных JSON в виде столбцов. Но если вы также используетеAS JSON
команду, тип столбца должен бытьNVARCHAR(MAX)
. Этот подход не идеально подходит для производительности. Лучше использовать предложениеWITH
для предоставления вложенных массивов в качестве столбцов. - Ключ секции хранилища транзакций Cosmos DB не используется в аналитическом хранилище. Теперь в Azure Synapse Link можно моделировать данные о транзакциях для оптимизации приема данных и считывания точек данных.
Дополнительные рекомендации и рекомендации
Категория | Рекомендуемые действия или документация |
---|---|
Исследование данных | Служба хранилища Azure Хранение результатов запросов в службе хранилища Azure Логическое хранилище данных |
OPENROWSET и внешние таблицы | Функция OPENROWSET Внешние таблицы Хранимые процедуры Представления Преобразования данных |
Доступные функции T-SQL в бессерверных пулах SQL | Функции T-SQL в пулах Azure Synapse |
Заявление об отказе от ответственности за сведения о продуктах сторонних производителей
В этой статье упомянуты программные продукты независимых производителей. Корпорация Майкрософт не дает никаких гарантий, подразумеваемых и прочих, относительно производительности и надежности этих продуктов.