Поделиться через


Применение аналитических сведений в Power BI для обнаружения разных распределений

ОБЛАСТЬ ПРИМЕНЕНИЯ: Служба Power BI Power BI Desktop

Часто в визуальных элементах отображается точка данных и интересно, будет ли распределение одинаковым для разных категорий. С помощью аналитических сведений в Power BI вы можете узнать только несколько щелчков мыши.

Рассмотрим следующий визуальный элемент, показывающий TotalSales by CountryName. Большинство продаж приходят из США, что составляет 57% всех продаж с меньшим вкладом, поступающим из других стран или регионов. В таких случаях часто интересно изучить, будет ли такое же распределение рассматриваться для разных подпопуляций. Например, это одинаково для всех лет, всех каналов продаж и всех категорий продуктов? Хотя вы можете применить различные фильтры и сравнить результаты визуально, это может занять много времени и подвержено ошибкам. Снимок экрана: диаграмма с большим распределением.

Вы можете сообщить Power BI , чтобы найти, где распределение отличается и получить быстрый, автоматизированный и аналитический анализ данных. Щелкните правой кнопкой мыши точку данных и выберите "Анализ>поиска", где это распределение отличается, и аналитические сведения доставляются вам в удобном окне.

Снимок экрана: аналитические сведения, показывающие другое распределение.

В этом примере автоматизированный анализ показывает, что доля продаж для туринг велосипедов в США и Канаде ниже, чем доля, поступающая из других стран или регионов.

Использование аналитики

Чтобы использовать аналитические сведения, чтобы найти, где дистрибутивы, видимые на диаграммах, отличаются, просто щелкните правой кнопкой мыши любую точку данных или визуальный элемент в целом. Затем выберите "Анализ>поиска", где это распределение отличается.

Снимок экрана: диаграмма столбцов с меню правой кнопкой мыши.

Power BI выполняет свои алгоритмы машинного обучения по данным. Затем он заполняет окно визуальным элементом и описанием категорий (столбцов), а значения этих категорий приводят к наиболее значительно разному распределению. Аналитика предоставляется в виде диаграммы столбцов, как показано на следующем рисунке:

Снимок экрана: диаграмма столбцов и аналитические сведения.

Значения с выбранным фильтром имеют цвет по умолчанию. Общие значения, как показано на исходном начальном визуальном элементе, отображаются серым цветом для простого сравнения. В этом примере можно включить до трех разных фильтров (туринг велосипедов, горных велосипедов и дорожных велосипедов) и различные фильтры можно выбрать, выбрав точку данных или нажав клавиши CTRL, чтобы выбрать несколько.

Для простых аддитивных мер, таких как Total Sales в этом примере, сравнение основано на относительные, а не абсолютные значения. Продажи для туринг велосипедов ниже общих продаж для всех категорий; однако визуальный элемент по умолчанию использует двойную ось, чтобы разрешить сравнение доли продаж в разных странах или регионах. Это для туринг велосипедов против всех категорий велосипедов. Переключение под визуальным элементом позволяет отображать два значения в одной оси, что позволяет легко сравнивать абсолютные значения, как показано на следующем рисунке:

Снимок экрана: визуальный элемент с аналитическим представлением.

Описательный текст также указывает уровень важности, который может быть присоединен к значению фильтра, учитывая количество записей, соответствующих фильтру. В этом примере видно, что в то время как распределение для touring Bikes может отличаться, они составляют только 16,6% записей.

Пальцы вверх и пальцы вниз значки в верхней части страницы существуют, чтобы вы могли предоставить отзыв о визуальном элементе и функции. Однако это не обучает алгоритм, чтобы повлиять на результаты, возвращенные в следующий раз, когда вы используете эту функцию.

Важно, что + кнопка в верхней части визуального элемента позволяет добавить выбранный визуальный элемент в отчет, как если бы вы создали визуальный элемент вручную. Затем можно отформатировать или настроить добавленный визуальный элемент так же, как и любой другой визуальный элемент в отчете. При редактировании отчета в Power BI можно добавить только выбранный визуальный элемент аналитики.

Вы можете использовать аналитические сведения, если отчет находится в режиме чтения или редактирования. Это делает его универсальным для анализа данных и создания визуальных элементов, которые можно добавить в отчеты.

Сведения о возвращаемых результатах

Вы можете подумать об алгоритме как о принятии всех других столбцов в модели и для всех значений этих столбцов, применяя их в качестве фильтров к исходному визуальному элементу. Затем алгоритм находит, какие из этих значений фильтров создают наиболее разные результаты от исходного.

Скорее всего, вы задаелись вопросом, что другое означает. Например, предположим, что общее разделение продаж между США и Канадой является следующим:

Страна или регион Продажи ($M)
USA 15
Канада 5

Затем для определенной категории продукта "Road Bike", разделение продаж может быть следующим:

Страна или регион Продажи ($M)
USA 3
Канада 1

Хотя числа отличаются в каждой из этих таблиц, относительные значения между США и Канадой идентичны: 75% и 25% в целом и для дорожных велосипедов. Поэтому они не считаются разными. Для простых аддитивных мер, таких как это, алгоритм ищет различия в относительном значении.

В отличие от этого, рассмотрим меру, например маржу, вычисляемую как прибыль или стоимость. Если общие поля для США и Канады были следующими:

Страна или регион Маржа (%)
USA 15
Канада 5

Затем для определенной категории продукта "Road Bike", разделение продаж может быть следующим:

Страна или регион Маржа (%)
USA 3
Канада 1

Учитывая характер таких мер, это интересно отличается . Для недитивных мер, таких как этот пример поля, алгоритм ищет различия в абсолютном значении.

Таким образом, отображаемые визуальные элементы предназначены для отображения различий между общим распределением, как показано в исходном визуальном элементе, и значение с конкретным примененным фильтром.

Для аддитивных мер, таких как Sales в предыдущем примере, используется столбец и график. Там использование двойной оси с соответствующим масштабированием заключается в том, что относительные значения можно сравнить. В столбцах отображается значение с примененным фильтром, а в строке отображается общее значение. Ось столбца находится слева, а ось линии находится справа, как обычно. Линия показана с помощью ступенчатого стиля, с тиреной линией, заполненной серым цветом. В предыдущем примере, если максимальное значение оси столбца равно 4, а максимальное значение оси линии равно 20, то это позволит легко сравнить относительные значения между США и Канадой для отфильтрованных и общих значений.

Аналогичным образом, для недитивных мер, таких как поля в предыдущем примере, используется столбец и график, где использование одной оси означает, что абсолютные значения можно легко сравнить. Строка, заполненная серым цветом, показывает общее значение. Независимо от того, сравниваются ли фактические или относительные числа, определение степени, в которой два распределения отличаются, не просто вопрос вычисления разницы в значениях. Например:

  • Если размер совокупности учитывается, разница менее статистически значима и менее интересна, если она применяется к меньшей части общей совокупности. Например, распределение продаж по странам или регионам может отличаться для конкретного продукта. Это было бы не интересно, если бы были тысячи продуктов, так что конкретный продукт составил только небольшой процент общих продаж.

  • Различия для этих категорий, где исходные значения были высокими или близки к нулю, весят выше, чем другие. Например, если страна или регион в целом вносит только 1% продаж, но для определенного типа продукта вносит 6%, это более статистически значимый, и, следовательно, более интересный, чем страна или регион, вклад которого изменился с 50% до 55%.

  • Различные эвристики выбирают наиболее значимые результаты, например, учитывая другие связи между данными.

После изучения различных столбцов и значений для каждого из этих столбцов выбирается набор значений, которые дают самые большие различия. Для простоты понимания они затем выходные данные и группируются по столбцу, с столбцом, значения которого дают наибольшее различие, указанное в первую очередь. До трех значений отображаются на столбец, но меньше может отображаться либо в случае, если было меньше трех значений, имеющих большой эффект, или если некоторые значения имеют гораздо больше влияния, чем другие.

Это не обязательно случай, когда все столбцы в модели будут проверяться в доступное время, поэтому не гарантируется, что отображаются наиболее затронутые столбцы и значения. Однако различные эвристики гарантируют, что наиболее вероятные столбцы сначала проверяются. Например, предположим, что после изучения всех столбцов определяется, что следующие столбцы и значения оказывают наибольшее влияние на распределение, от наибольшего влияния до наименьшего:

Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store

Они будут получать выходные данные в порядке столбца следующим образом:

  • Подкатегория: Туринг Велосипеды, Горные велосипеды, Дорожные велосипеды (только три перечисленных, с текстом, включая "... среди прочего", чтобы указать, что более трех имеют значительное влияние)

  • Channel = Direct (только direct listed, если его уровень влияния был больше, чем Магазин)

Рекомендации и ограничения

Следующий список представляет собой коллекцию неподдерживаемых сценариев для аналитики:

  • Фильтры TopN
  • Фильтры мер
  • Нечисловые меры
  • Использование параметра "Показать значение как"
  • Отфильтрованные меры — отфильтрованные меры — это вычисления визуального уровня с определенным фильтром, примененным, например Total Sales for France, и используются для некоторых визуальных элементов, созданных функцией аналитики.

Кроме того, следующие типы моделей и источники данных в настоящее время не поддерживаются для аналитики:

  • DirectQuery
  • Динамическое подключение
  • Локальные службы Reporting Services
  • Векторное представление

Дополнительные сведения см. в разделе: