Создание агрегатов и управление ими

Завершено

При агрегировании данных эти данные суммируются и предоставляются в более высокой степени детализации (уровне). Например, можно суммировать все данные о продажах и сгруппировать их по датам, клиентам, продуктам и т. д. Процесс агрегирования уменьшает размеры таблиц в семантической модели, что позволяет сосредоточиться на важных данных и помогает повысить производительность запросов.

Ваша организация может решить использовать агрегаты в своих семантических моделях по следующим причинам:

  • При работе с большим объемом данных (большие данные) агрегаты обеспечивают лучшую производительность запросов и позволяют анализировать и наглядно просматривать аналитику больших объемов данных. Агрегированные данные кэшируются и, следовательно, используют в разы меньше ресурсов, необходимых для подробных данных.

  • Если вы испытываете трудности с медленным обновлением, агрегаты помогут ускорить этот процесс. Минимальный размер кэша сокращает время обновления, поэтому пользователь быстрее получает данные. Вместо обновления сведений, которые могут состоять из миллионов строк, будет обновляться меньший объем данных.

  • Если у вас большая семантическая модель, агрегаты могут помочь уменьшить и поддерживать размер модели.

  • Если вы ожидаете, что размер семантической модели в будущем будет расти, можно использовать агрегаты в качестве упреждающего шага к будущей проверке семантической модели, уменьшая вероятность проблем с производительностью и обновлением, а также общих проблем с запросами.

Продолжая работу со сценарием Tailwind Traders, вы выполнили несколько действий по оптимизации производительности семантической модели, но ИТ-отдел сообщил вам, что размер файла по-прежнему слишком велик. Размер файла в настоящее время составляет 1 гигабайт (ГБ), и вам необходимо сократить его до 50 мегабайт (МБ). В ходе проверки производительности вы определили, что предыдущий разработчик не использовал агрегаты в семантической модели, поэтому теперь необходимо создать некоторые агрегаты для данных о продажах, чтобы уменьшить размер файла и еще больше оптимизировать производительность.

Создание агрегатов

Прежде чем приступать к созданию агрегатов, необходимо выбрать степень детализации (уровень), на котором они будут созданы. В этом примере необходимо выполнить агрегирование данных о продажах на уровне дня.

После того как мы определились с уровнем, необходимо решить, как мы будем создавать агрегаты. Агрегаты можно создавать различными способами, и каждый из них приведет к одинаковому результату.

  • Если у вас есть доступ к базе данных, можно создать таблицу с агрегированием, а затем импортировать эту таблицу в Power BI Desktop.

  • Если у вас есть доступ к базе данных, можно создать представление с агрегированием, а затем импортировать это представление в Power BI Desktop.

  • В Power BI Desktop можно использовать редактор Power Query, чтобы создать агрегат в пошаговом режиме.

В нашем примере мы откроем запрос в редакторе Power Query и увидим, что данные не были агрегированы. Они содержат более 999 строк, как показано на следующем снимке экрана.

Необходимо выполнить агрегирование данных по столбцу OrderDate и просмотреть столбцы OrderQuantity и SalesAmount. Начните с нажатия кнопки Выбрать столбцы на вкладке Главная. В появившемся окне выберите столбцы, которые требуется включить в агрегирование, а затем нажмите ОК.

Когда выбранные столбцы отобразятся на странице, выберите параметр Группировать по на вкладке Главная. В появившемся окне выберите столбец, по которому необходимо выполнить группирование (OrderDate), и введите имя нового столбца (OnlineOrdersCount).

Выберите параметр Дополнительно, а затем нажмите кнопку Добавить агрегат, чтобы показать еще одну строку столбца. Введите имя столбца агрегирования, выберите операцию столбца, а затем выберите столбец, к которому необходимо привязать агрегат. Повторите эти действия, пока не будут добавлены все агрегаты, а затем нажмите ОК.

Отображение агрегата может занять несколько минут, но, когда это произойдет, вы увидите, как преобразуются данные. Данные будут объединены по каждой дате, и вы увидите значения счетчика заказов, соответствующую сумму продаж и количества заказов.

Нажмите кнопку Закрыть и применить, чтобы закрыть Редактор Power Query и применить изменения к семантической модели. Вернитесь на страницу Power BI Desktop, а затем нажмите кнопку Обновить, чтобы просмотреть результаты. Просмотрите экран, так как в кратком сообщении будет отображаться количество строк, которые теперь есть в вашей семантической модели. Количество строк должно быть значительно меньше числа, которое было в начале. Это число можно также увидеть при повторном открытии редактора Power Query, как показано на следующем снимке экрана. В нашем примере число строк уменьшилось до 30.

Помните, что вначале было более 999 строк. Использование агрегирования значительно сократило количество строк в семантической модели, что означает, что Power BI имеет меньше данных для обновления и ваша модель должна работать лучше.

Управление агрегатами

После создания агрегатов можно управлять ими в Power BI Desktop и при необходимости вносить изменения в их поведение.

Можно открыть окно Управление агрегатами из любого представления в Power BI Desktop. В области Поля щелкните правой кнопкой мыши таблицу и выберите Управление агрегатами.

Для каждого столбца агрегирования можно выбрать параметр из раскрывающегося списка Сводные данные и внести изменения в выбранную таблицу сведений и столбец. Завершив управление агрегатами, нажмите Применить все.

Более подробные сведения о создании агрегатов и управлении ими см. в разделе Использование агрегатов в Power BI Desktop.