Выявление выбросов с помощью визуальных элементов Power BI

Завершено

Выброс — это тип аномалий в данных (то, чего вы не ожидали или что удивило вас) на основе среднего или накопленных результатов. Вам потребуется определить выбросы, чтобы изолировать точки данных, которые значительно отличаются от других точек данных, а затем выполнить анализ причин различий. Результаты этого анализа могут существенно повлиять на принятие бизнес-решений.

Рассмотрим сценарий, в котором вы выполняете анализ данных для склада отгрузки. Вы заметили увеличение заказов конкретной категории продуктов выше среднего значения. Сначала необходимо узнать, что это за категория продуктов. Затем необходимо выяснить несколько моментов относительно выбросов.

  • Имелись ли в тот день отгрузки, объем которых был выше среднего?

  • Затронула ли эта аномалия определенный склад?

  • Наблюдалось ли событие, после которого было замечено увеличение заказов продуктов определенной категории?

  • Были ли другие дни, подобные этому, в прошлом месяце, квартале, в текущем или прошлом году?

Power BI позволяет определять выбросы в данных, но сначала необходимо определить логику, которая формирует выброс. Вы можете использовать пороговые точки, такие как вычисления, на основе которых можно считать, что произошел выброс.

Процесс определения выбросов включает сегментирование данных по двум группам. Одна группа — это данные выбросов, а другая группа — нет. Вычисляемые столбцы можно использовать для обнаружения выбросов, однако результаты будут статическими до тех пор, пока не будут обновлены данные. Наиболее эффективным способом обнаружения выбросов является использование визуализации или формулы DAX, поскольку эти методы гарантируют, что результаты будут динамическими.

После определения выбросов в данных можно использовать срезы или фильтры для выделения этих выбросов. Кроме того, можно добавить условные обозначения в визуальные элементы, чтобы выбросы можно было с легкостью идентифицировать на фоне других данных. Затем можно детализировать данные выбросов для более подробного анализа.

Использование визуального элемента для обнаружения выбросов

Для обнаружения выбросов лучше всего подходит точечная диаграмма, которая позволяет увидеть связь между двумя числовыми значениями. Точечные диаграммы отображают закономерности в больших наборах данных и, следовательно, идеально подходят для отображения выбросов.

При добавлении точечной диаграммы в отчет Power BI интересующие вас поля необходимо разместить в разделах Ось X и Ось Y соответственно. В этом случае поле Отгруженные заказы находится на оси X, а поле Количество заказов — на оси Y.

Визуальный элемент будет обновлен для отображения данных в соответствии с выбранными полями, и вы сможете с легкостью идентифицировать выбросы в этих данных — это отдельные элементы, которые находятся далеко от основного объема данных.

Теперь, когда выбросы в данных определены, можно изучить причины их возникновения и предпринять корректирующие действия.

Использование DAX для обнаружения выбросов

DAX можно использовать для создания меры, которая будет определять выбросы в данных, например так, как в следующей формуле:

Outliers =
CALCULATE (
    [Order Qty],
    FILTER (
        VALUES ( Product[Product Name] ),
        COUNTROWS ( FILTER ( Sales, [Order Qty] >= [Min Qty] ) ) > 0
    )
)

Order Qty — это мера в таблице Sales, а Min Qty — наименьшее число заказов в таблице Sales.

После создания новой меры выбросов можно сгруппировать продукты по категориям с помощью функции группирования, как вы делали это ранее при создании гистограммы. Затем необходимо добавить визуальный элемент "Точечная диаграмма", как в предыдущем разделе, так как это наилучший вариант визуализации для отображения выбросов. После добавления точечной диаграммы вы заполните ее полями, связанными с формулой DAX и мерой выбросов.

На точечной диаграмме вы сможете определить выбросы в данных. Затем можно изучить причины их существования и предпринять корректирующие действия.