Введение

Завершено

Рассмотрим сценарий, в котором необходимо импортировать данные в Power BI из нескольких различных источников. Вы изучаете данные и понимаете, что они не готовы для анализа. Почему данные не готовы?

Вы обнаруживаете несколько проблем, в том числе следующие.

  • Столбец с именем Employment status содержит только цифры.

  • Несколько столбцов содержат ошибки.

  • Некоторые столбцы содержат значения NULL.

  • Идентификатор клиента в некоторых столбцах постоянно повторяется.

  • Один столбец адреса содержит улицу, город, штат и почтовый индекс.

Вы начинаете работать с данными, но при каждом создании визуальных элементов в отчетах вы получаете неправильные данные и некорректные результаты, простые отчеты об итогах продаж содержат неверные данные.

Грязные данные могут быть слишком большими, и, хотя вы можете чувствовать разочарование, вы решили приступить к работе и выяснить, как сделать эту семантическую модель как можно более нетронутой.

К счастью, Power BI и Power Query предлагают эффективную среду для очистки и подготовки данных. Очистка данных дает следующие преимущества.

  • Меры и столбцы дают более точные результаты при выполнении агрегатов и вычислений.

  • Таблицы организованы, и пользователи могут находить данные интуитивно понятным способом.

  • Дубликаты удаляются, что упрощает навигацию по данным. Кроме того, создаются столбцы, которые можно использовать в срезах и фильтрах.

  • Сложный столбец можно разделить на два более простых столбца. Для удобочитаемости несколько столбцов можно объединить в один столбец.

  • Коды и целые числа можно заменить понятными значениями.

В этом модуле вы научитесь выполнять следующее.

  • Устранять несоответствия, непредвиденные значения или значение NULL, а также проблемы с качеством данных.

  • Применять удобные для пользователя замены значений.

  • Профилировать данные, чтобы получить дополнительные сведения о конкретном столбце перед его использованием.

  • Вычислять и преобразовывать типы данных столбцов.

  • Применять преобразования по формированию данных к структурам таблицы.

  • Объединять запросы.

  • Применять соглашения об именовании, чтобы у столбцов и запросов были понятные имена.

  • Изменять код M в расширенном редакторе.