Поделиться через


Управление рабочей нагрузкой

Область применения:✅ конечная точка аналитики SQL и хранилище в Microsoft Fabric

В этой статье описывается архитектура и управление рабочими нагрузками для хранения данных в Microsoft Fabric.

Обработка данных

Конечная точка аналитики хранилища и SQL используют ту же базовую архитектуру обработки. При получении или приеме данных используется распределенный механизм, созданный как для небольших, так и для крупномасштабных данных и вычислительных функций.

Система обработки бессерверная в этой серверной вычислительной емкости масштабируется вверх и вниз автономно для удовлетворения требований рабочей нагрузки.

Схема подсистемы SQL.

При отправке запроса интерфейс SQL выполняет оптимизацию запросов, чтобы определить оптимальный план на основе размера и сложности данных. После создания плана он будет предоставлен подсистеме распределенной обработки запросов (DQP). DQP оркеструет распределенное выполнение запроса, разделив его на небольшие запросы, выполняемые на внутренних вычислительных узлах. Каждый небольшой запрос называется задачей и представляет распределенную единицу выполнения. Он считывает файлы из OneLake, присоединяет результаты из других задач, групп или заказов данных, полученных из других задач. Для заданий приема он также записывает данные в соответствующие целевые таблицы.

При обработке данных результаты возвращаются в интерфейс SQL для обслуживания пользователя или вызывающего приложения.

Эластичность и устойчивость

Серверная емкость вычислений обеспечивает преимущества быстрой архитектуры подготовки. Хотя соглашение об уровне обслуживания отсутствует при назначении ресурсов, обычно новые узлы получаются в течение нескольких секунд. По мере увеличения спроса на ресурсы новые рабочие нагрузки используют масштабируемую емкость. Масштабирование — это онлайн-операция, а обработка запросов выполняется без прерывания.

Схема, демонстрирующая быструю подготовку ресурсов.

Система отказоустойчива, и если узел становится неработоспособным, операции, выполняемые на узле, распространяются на здоровые узлы для завершения.

Конечная точка аналитики хранилища и SQL обеспечивают высокую емкость , которая позволяет рабочим нагрузкам использовать больше ресурсов для повышения производительности и использовать сглаживание для клиентов, которые создают внезапные пики во время пиков, в то время как они имеют много неиспользуемой емкости. Сглаживание упрощает управление емкостью, распространяя оценку вычислений, чтобы обеспечить плавное и эффективное выполнение заданий клиентов.

Планирование и получение ресурсов

Планировщик обработки распределенных запросов работает на уровне задачи . Запросы представляются планировщику в виде ациклического графа (DAG) задач. Эта концепция знакома пользователям Spark. DaG позволяет выполнять параллелизм и параллелизм в качестве задач, которые не зависят друг от друга, могут выполняться одновременно или вне порядка.

По мере поступления запросов их задачи планируются на основе принципов первого выхода (FIFO). Если емкость неактивна, планировщик может использовать подход "оптимальный" для оптимизации параллелизма.

Когда планировщик определяет давление ресурсов, он вызывает операцию масштабирования. Масштабирование управляется автономно, а серверная топология растет по мере увеличения параллелизма. Так как для получения узлов требуется несколько секунд, система не оптимизирована для согласованной подсекундной производительности запросов, требующих распределенной обработки.

Когда давление утихает, серверная топология масштабируется вниз и освобождает ресурс обратно в регион.

Изоляция приема

Область применения:✅ хранилище в Microsoft Fabric

В серверном пуле вычислений хранилища в Microsoft Fabric действия загрузки обеспечивают изоляцию ресурсов от аналитических рабочих нагрузок. Это повышает производительность и надежность, так как задания приема могут выполняться на выделенных узлах, оптимизированных для ETL, и не конкурировать с другими запросами или приложениями для ресурсов.

Схема, показывающая изоляцию действий приема.

Сеансы

Конечная точка аналитики хранилища и SQL имеют ограничение на сеанс пользователя 724 на рабочую область. После достижения этого ограничения будет возвращена ошибка: The user session limit for the workspace is 724 and has been reached

Примечание.

Так как Microsoft Fabric — это платформа SaaS, существует множество системных подключений, выполняемых для непрерывной оптимизации среды. Динамические административные представления показывают как системные, так и пользовательские сеансы. Дополнительные сведения см. в разделе "Мониторинг с помощью динамических административных представлений".

Рекомендации

Рабочая область Microsoft Fabric предоставляет границу естественной изоляции распределенной вычислительной системы. Рабочие нагрузки могут воспользоваться этой границей для управления затратами и производительностью.

Сочетания клавиш OneLake можно использовать для создания реплик таблиц только для чтения в других рабочих областях для распределения нагрузки между несколькими ядрами SQL, создавая границу изоляции. Это может эффективно увеличить максимальное количество сеансов, выполняющих запросы только для чтения.

Схема, показывающая изоляцию двух рабочих областей, например финансы и рабочая область маркетинга.