Автоматическое группирование элементов атрибута
При просмотре куба обычно выполняется распределение по измерениям элементов одной иерархии атрибута на основе элементов другой иерархии атрибута. Например, можно сгруппировать продажи по таким признакам, как город, приобретенный товар или пол. Однако при работе с некоторыми типами атрибутов лучше группировать их элементы автоматически с использованием служб Microsoft Службы Analysis Services, основываясь на распределении элементов в рамках иерархии атрибута. Например, с помощью служб Службы Analysis Services можно объединить заказчиков в группы на основе их годового дохода. При этом пользователь, просматривающий иерархию атрибута, будет видеть названия и значения групп вместо самих элементов групп. Данный подход ограничивает количество отображаемых уровней, что упрощает анализ данных.
Свойство DiscretizationMethod определяет, создают ли службы Службы Analysis Services группирования, а также определяет тип выполняемого группирования. По умолчанию в службах Службы Analysis Services группирование не выполняется. При включении автоматического группирования можно настроить параметры служб Службы Analysis Services таким образом, чтобы выполнялся автоматический выбор оптимального метода группирования, основанного на структуре данного атрибута, либо выбрать один из алгоритмов группирования в следующем списке:
EqualAreas
В службах Службы Analysis Services диапазоны групп создаются таким образом, что элементы измерения распределяются по группам пропорционально.Clusters
В службах Службы Analysis Services группы создаются путем проведения одномерной кластеризации входных значений, используя метод кластеризации К-средних с нормальным распределением. Эта функция применима только в отношении числовых столбцов.
После выбора метода группирования необходимо указать количество групп, используя свойство DiscretizationBucketCount. Дополнительные сведения см. в разделе Группирование элементов атрибутов (дискретизация).
В ходе выполнения задач данного раздела будут опробованы следующие критерии группирования: значение годового дохода в измерении Заказчик, количество часов отсутствия по болезни в измерении Сотрудники, данные о количестве часов отпуска сотрудников в измерении Сотрудники. Затем предстоит выполнить обработку куба учебника по службам Службы Analysis Services и просмотреть результаты группирования элементов. На конечной стадии будут изменены свойства групп элементов, чтобы выявить эффект от изменения типа группирования.
Группирование элементов иерархии атрибута в измерении «Заказчик»
В обозревателе решений дважды щелкните элемент Заказчик в папке Измерения. Будет открыт конструктор измерений для измерения «Заказчик».
На панели Представление источника данных щелкните правой кнопкой мыши таблицу Customer и выберите команду Просмотреть данные.
Обратите внимание на диапазон данных в столбце YearlyIncome. Указанные значения используются для заполнения иерархии атрибута Yearly Income, если не включено группирование элементов.
Закройте вкладку Просмотр таблицы Customer.
На панели Атрибуты выберите атрибут Yearly Income.
В окне свойств измените значение свойства DiscretizationMethod на Automatic, а значение свойства DiscretizationBucketCount — на 5.
На следующем рисунке показаны измененные свойства атрибута Yearly Income.
Группирование элементов иерархии атрибута в измерении Employee
В конструкторе измерений откройте измерение «Сотрудник».
На панели Представление источника данных щелкните правой кнопкой мыши таблицу Employee и выберите команду Просмотреть данные.
Обратите внимание на значения столбцов SickLeaveHours и VacationHours.
Закройте вкладку Просмотр таблицы Employee.
На панели Атрибуты выберите атрибут Sick Leave Hours.
В окне свойств измените значение свойства DiscretizationMethod на Clusters, а значение свойства DiscretizationBucketCount — на 5.
На панели Атрибуты выберите атрибут Vacation Hours.
В окне свойств измените значение свойства DiscretizationMethod на Равные области, а значение свойства DiscretizationBucketCount на 5.
Просмотр измененных иерархий атрибутов
В меню Построение среды SQL Server Data Tools (SSDT) выберите команду Развернуть Analysis Services Tutorial.
После завершения развертывания переключитесь в конструктор кубов на куб по службам Службы Analysis Services Tutorial, а затем нажмите кнопку Повторное соединение на вкладке Обозреватель.
Щелкните ярлык Excel, а затем выберите Включить.
Перетащите меру Продажи через Интернет — сумма продаж в область значений списка полей сводной таблицы.
В списке полей разверните измерение Продукт, а затем перетащите пользовательскую иерархию Линии моделей товаров в область Метки строк списка полей.
В списке полей разверните измерение Заказчик, разверните папку отображения Демография и перетащите иерархию атрибута Годовой доход в область Метки столбцов.
Теперь элементы иерархии атрибута Годовой доход сгруппированы в шесть сегментов, один из которых содержит данные о клиентах с неизвестным годовым доходом. Отображаются не все сегменты.
Удалите иерархию атрибута Годовой доход из области столбцов и удалите меру Продажи через Интернет — сумма продаж из области Значения.
Добавьте меру Товарооборот посредников — сумма продаж в область данных.
В списке полей разверните измерение Сотрудник, затем узел Организация, а затем перетащите Часы отсутствия по болезни в область Метки столбцов.
Обратите внимание, что все продажи были сделаны сотрудниками, включенными в одну из двух групп. Кроме того, обратите внимание, что сотрудники, отсутствовавшие по болезни от 32 до 42 часов, сделали существенно больше продаж, чем сотрудники, отсутствовавшие от 20 часов до 31 часа.
На приведенном ниже рисунке приведена зависимость объемов продаж от количества часов отпуска по болезни.
Удалите иерархию атрибута Sick Leave Hours из раздела столбцов панели Данные.
Добавьте столбец Vacation Hours к разделу столбцов панели Данные.
Обратите внимание, что отображаются две группы, созданные с помощью метода группирования по равным областям. Остальные три группы не показаны, так как не содержат значений.
Изменение свойств группирования и просмотр результата изменений
Откройте в конструкторе измерений измерение Сотрудник и выберите на панели Атрибуты атрибут Часы отпуска.
В окне свойств задайте для свойства DiscretizationBucketCount значение 10**.**
В меню Построение среды SQL Server Data Tools выберите команду Развернуть Analysis Services Tutorial.
После завершения развертывания переключитесь обратно в конструктор кубов на куб по службам Службы Analysis Services Tutorial.
На вкладке Обозреватель нажмите кнопку Повторное подключение, щелкните значок Excel и снова создайте сводную таблицу, чтобы просмотреть результаты изменения метода группирования.
Перетащите меру «Товарооборот посредников — сумма продаж» в область значений
Перетащите атрибут «Часы отпуска» (в папке «Организация сотрудников») в область столбцов
Перетащите атрибут «Линии моделей товаров» в область строк
Обратите внимание, что созданы три группы элементов атрибута Часы отпуска, в которых содержатся значения по продажам товаров. В остальных 7 группах содержатся элементы без данных о продажах.
Следующая задача занятия
Скрытие и отключение иерархий атрибутов