Введение
Рассмотрим сценарий, в котором необходимо импортировать данные в Power BI из нескольких различных источников. Вы изучаете данные и понимаете, что они не готовы для анализа. Почему данные не готовы?
Вы обнаруживаете несколько проблем, в том числе следующие.
Столбец с именем Employment status содержит только цифры.
Несколько столбцов содержат ошибки.
Некоторые столбцы содержат значения NULL.
Идентификатор клиента в некоторых столбцах постоянно повторяется.
Один столбец адреса содержит улицу, город, штат и почтовый индекс.
Вы начинаете работать с данными, но при каждом создании визуальных элементов в отчетах вы получаете неправильные данные и некорректные результаты, простые отчеты об итогах продаж содержат неверные данные.
Грязные данные могут быть слишком большими, и, хотя вы можете чувствовать разочарование, вы решили приступить к работе и выяснить, как сделать эту семантическую модель как можно более нетронутой.
К счастью, Power BI и Power Query предлагают эффективную среду для очистки и подготовки данных. Очистка данных дает следующие преимущества.
Меры и столбцы дают более точные результаты при выполнении агрегатов и вычислений.
Таблицы организованы, и пользователи могут находить данные интуитивно понятным способом.
Дубликаты удаляются, что упрощает навигацию по данным. Кроме того, создаются столбцы, которые можно использовать в срезах и фильтрах.
Сложный столбец можно разделить на два более простых столбца. Для удобочитаемости несколько столбцов можно объединить в один столбец.
Коды и целые числа можно заменить понятными значениями.
В этом модуле вы научитесь выполнять следующее.
Устранять несоответствия, непредвиденные значения или значение NULL, а также проблемы с качеством данных.
Применять удобные для пользователя замены значений.
Профилировать данные, чтобы получить дополнительные сведения о конкретном столбце перед его использованием.
Вычислять и преобразовывать типы данных столбцов.
Применять преобразования по формированию данных к структурам таблицы.
Объединять запросы.
Применять соглашения об именовании, чтобы у столбцов и запросов были понятные имена.
Изменять код M в расширенном редакторе.