Поделиться через


Руководство. Структура для пользователей Power BI

В этом руководстве вы узнаете, как использовать потоки данных 2-го поколения и конвейеры для приема данных в Lakehouse и создания трехмерной модели. Вы также узнаете, как создать красивый отчет автоматически, чтобы отобразить последние цифры продаж от начала до окончания всего 45 минут.

Теперь можно приступать к работе.

  • Подготовка и загрузка данных в lakehouse
  • Создание мерной модели в лейкхаусе
  • Автоматическое создание отчета с помощью быстрого создания

Необходимые компоненты

Создание lakehouse для хранения данных

Начнем с создания lakehouse для хранения данных, потоков данных 2-го поколения для подготовки и преобразования столбцов, а также конвейера для обработки оркестрации запланированного обновления и действия электронной почты.


  1. Перейдите в рабочую область и нажмите кнопку "Создать". Затем выберите "Дополнительные параметры".

    Снимок экрана: дополнительные параметры в меню нового элемента.

  2. На экране создания нового элемента выберите Lakehouse в категории "Инженерия данных".

    Снимок экрана: элементы проектирования данных.

  3. Задайте имя Lakehouse в SalesLakehouse. Затем выберите Создать.

    Снимок экрана: именование имени Lakehouse.

  4. Когда вы находитесь в редакторе Lakehouse, выберите Новый поток данных 2-го поколения.

    Примечание.

    Вы также можете выбрать " Получить данные " на ленте, а затем создать поток данных 2-го поколения.

    Снимок экрана: раскрывающийся список

Подготовка и загрузка данных в lakehouse

Чтобы загрузить данные в lakehouse, сделайте следующее:

  1. Когда вы находитесь в редакторе Power Query Online для потоков данных 2-го поколения, выберите импорт из шаблона Power Query и выберите файл шаблона, скачанный из предварительных требований.

    Снимок экрана: водяной знак в редакторе Dataflows 2-го поколения.

  2. Выберите запрос DimDate в группе запросов загрузки данных и выберите параметр "Настройка подключения". При необходимости задайте для типа проверки подлинности анонимную перед нажатием кнопки Connect.

    Снимок экрана: меню

  3. При выборе запроса DimDate в окне предварительного просмотра данных измените тип данных столбца DateKey на date/Time, выбрав значок в левом верхнем углу.

    Снимок экрана: изменение типов данных в редакторе Power Query.

  4. Выберите "Заменить текущий" в окне "Изменить тип столбца".

    Снимок экрана: меню типа столбца изменений.

Добавление назначения данных

Чтобы добавить назначение данных, сделайте следующее:

  1. Выбрав таблицу DimDate, на вкладке "Главная" выберите "Добавить назначение данных" и выберите пункт меню "Лейкхаус".

    Снимок экрана: параметр get data destination Lakehouse.

  2. При необходимости задайте для учетной записи организации проверку подлинности и нажмите кнопку "Далее".

    Снимок экрана: меню

  3. В навигаторе выберите рабочую область, используемую для этого руководства, и разверните ее, чтобы просмотреть все элементы Lakehouse . Выберите SalesLakehouse и убедитесь, что выбрана новая таблица по умолчанию перед нажатием кнопки "Далее".

    Снимок экрана: целевой элемент навигатора назначения.

  4. Задайте для метода Update значение "Заменить", а затем нажмите кнопку "Сохранить параметры".

    Внимание

    Установка метода обновления для замены удаляет все существующие данные и заменяет их новыми данными при каждом последующем обновлении.

    Снимок экрана: пункт меню параметров назначения.

    Примечание.

    В правом нижнем углу редактора Power Query Online можно найти настроенные параметры назначения данных для запроса, где можно дополнительно настроить или удалить.

    Снимок экрана с настроенным назначением данных.

  5. Прежде чем перейти к следующему разделу этого руководства, обязательно выполните те же действия , что и в предыдущем разделе, чтобы настроить Lakehouse в качестве назначения данных для каждого из следующих запросов.

    Query
    DimCustomer
    DimEmployee
    DimProduct
    DimStore
  6. Выберите запрос FactOnlineSales в группе запросов преобразования данных. На вкладке "Главная" выберите " Добавить назначение данных". Выберите параметр Lakehouse.

    Снимок экрана: параметр целевого объекта Data Lakehouse.

  7. При необходимости задайте для учетной записи организации проверку подлинности и нажмите кнопку "Далее".

    Снимок экрана: меню

  8. В навигаторе выберите рабочую область, используемую для этого руководства, и разверните ее, чтобы просмотреть все элементы Lakehouse . Выберите SalesLakehouse и убедитесь, что выбрана новая таблица по умолчанию перед нажатием кнопки "Далее".

    Снимок экрана: окно целевого навигатора назначения.

  9. Задайте для метода Update значение "Добавить", а затем нажмите кнопку "Сохранить параметры".

    Примечание.

    Этот процесс вставляет данные, сохраняя существующие строки в таблице при каждом последующем обновлении.

    Снимок экрана: выбор меню параметров назначения.

  10. Выберите "Опубликовать" , чтобы сохранить поток данных и выйти из редактора Power Query Online .

    Снимок экрана: кнопка публикации в Power Query Online.

  11. Наведите указатель мыши над созданным потоком данных в рабочей области, выберите многоточие (...) и параметр "Свойства ".

    Снимок экрана: свойства потоков данных в рабочей области.

  12. Измените имя потока данных на OnlineSalesDataflow и нажмите кнопку "Сохранить".

    Снимок экрана: переименование параметра потока данных.

Оркестрация конвейера данных

Используя конвейеры, мы сначала оркестрируем обновление потока данных. Если возникает ошибка, мы отправим настроенную электронную почту Outlook, содержащую важные сведения.

  1. Выберите элемент Lakehouse с именем SalesLakehouse в рабочей области.

    Снимок экрана: переименование существующего потока данных.

  2. Когда вы находитесь в редакторе Lakehouse, выберите новый конвейер данных.

    Примечание.

    Вы также можете выбрать " Получить данные " на ленте, а затем создать конвейер данных.

    Снимок экрана: подложки в редакторе Lakehouse.

  3. Задайте для имени конвейера значение SalesPipeline. Затем выберите Создать.

    Снимок экрана: пункт меню имени конвейера.

  4. Закройте помощник по копированию данных, нажав кнопку "Отмена". Если вам будет предложено подтвердить выход из окна данных копирования, нажмите кнопку "Да", отмена.

    Снимок экрана: меню помощника по копированию данных.

  5. Когда вы находитесь в редакторе конвейера, выберите "Добавить действие конвейера" и выберите "Поток данных".

    Примечание.

    Вы также можете выбрать поток данных на ленте.

    Снимок экрана: холст подложки конвейера и параметр

  6. Выберите действие потока данных в редакторе конвейера и измените его значение Name на OnlineSalesActivity в разделе "Общие".

    Снимок экрана: значение имени потока данных.

  7. Если действие потока данных по-прежнему выбрано, выберите "Параметры " и выберите OnlineSalesDataflow из списка потоков данных. При необходимости для обновления списка выберите значок "Обновить ".

    Снимок экрана: параметр выбора потока данных.

  8. Перейдите на вкладку "Действия" , а затем действие Office365 Outlook .

    Примечание.

    Если появится окно предоставления согласия, нажмите кнопку "ОК", войдите с помощью учетной записи организации и нажмите кнопку "Разрешить доступ".

    Снимок экрана: сведения о действиях Office365 Outlook.

  9. Выберите действие Office365 Outlook в редакторе конвейера и измените его значение Name на Mail при сбое в разделе "Общие".

    Снимок экрана: имя действия Office365 Outlook.

  10. Если действие Office365 Outlook по-прежнему выбрано, выберите "Параметры". Обновите поле To на адрес электронной почты и сбой субъекта конвейера. Выберите динамическое содержимое [ALT+SHIFT+D] для текста почты.

    Примечание.

    Дополнительные параметры конфигурации электронной почты, такие как From (Send as), Cc, Bcc, Метка конфиденциальности и многое другое доступны в дополнительных свойствах.

    Снимок экрана: параметры Office365 Outlook.

  11. В построителе выражений конвейера вставьте следующий блок кода выражения:

    @concat(
        'Pipeline: '
        , 
        , '<br>'
        , 'Workspace: '
        , 
        , '<br>'
        , 'Time: '
        , 
    )
    

    Снимок экрана: действие Office365 Outlook с построителем выражений.

  12. Выберите системные переменные и вставьте следующие переменные , выбрав соответствующее имя из следующей таблицы.

    Value name График Системная переменная
    Конвейер. 3 Идентификатор конвейера
    Рабочая область: 6 Идентификатор рабочей области

    Снимок экрана: переменные системы конвейера.

  13. Выберите функции и вставьте следующую функцию, выбрав соответствующее имя из следующей таблицы. После завершения нажмите кнопку "ОК".

    Value name График Системная переменная
    Время: 9 utcnow

    Снимок экрана: функции конвейера.

  14. Выберите OnlineSalesActivity. В доступных параметрах пути выберите "X" (При сбое). При этом создается стрелка, которая удаляется на действие "Почта" при сбое. Это действие вызывается при сбое OnlineSalesActivity .

    Снимок экрана: путь к сбою.

  15. На вкладке "Главная" выберите "Расписание". После обновления следующих конфигураций нажмите кнопку "Применить ", чтобы сохранить изменения.

    Имя. Значение
    Запланированное выполнение Включено
    Repeat Ежедневно
    Время 00:00:00

    Снимок экрана: ветвь сбоя.

  16. На вкладке "Главная" выберите "Выполнить". Если откроется диалоговое окно, выберите параметр "Сохранить и запустить ", чтобы продолжить.

    Снимок экрана: параметр запуска с домашней вкладки.

    Чтобы отслеживать текущее состояние конвейера, можно просмотреть таблицу выходных данных , которая отображает текущий ход выполнения действия. Таблица периодически обновляется самостоятельно или можно вручную выбрать значок обновления, чтобы обновить его.

    Снимок экрана: текущий ход выполнения действия конвейера.

  17. Когда состояние возвращается успешно, вы можете перейти к следующему разделу руководства, вернувшись в рабочую область.

    Снимок экрана: боковой рельс с выбором рабочей области.

Создание семантической модели в Lakehouse

Загруженные данные почти готовы для создания отчетов. Сначала будем использовать конечную точку SQL для создания связей и представлений SQL в нашем озерном доме. Это позволяет легко получить доступ к нашим данным в семантической модели, которая представляет собой модель метаданных, содержащую объекты физической базы данных, абстрактные и измененные в логические измерения. Он предназначен для представления данных для анализа в соответствии со структурой бизнеса.

Создание отношений

Эта модель представляет собой схему звездочки, которую можно увидеть из хранилищ данных: она напоминает звезду. Центр звезды — таблица фактов. Окружающие таблицы называются таблицами измерений, которые связаны с таблицей фактов с связями.


  1. В представлении рабочей области выберите элемент конечной точки SQL с именем SalesLakehouse.

    Снимок экрана: элемент конечной точки SQL в рабочей области.

  2. В обозревателе выберите представление модели в нижней части экрана, чтобы начать создание связей.

    Снимок экрана: выбор представления модели.

  3. Создайте связь путем перетаскивания столбца CustomerKey из таблицы FactOnlineSales в customerKey в таблице DimCustomer.

  4. После создания связи убедитесь, что выбраны правильные таблицы, столбцы и параметры, как показано в следующей таблице. Нажмите кнопку "Подтвердить" , чтобы продолжить.

    Активировать связь Из: таблица 1 (столбец) To: Table 2 (column) Кратность Направление перекрестной фильтрации
    FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) Многие к одному (*:1) Одна

    Снимок экрана: связь между таблицей FactOnlineSales и DimCustomer.

  5. Выполните эти же действия для каждой оставшейся таблицы и столбцов, перечисленных в следующей таблице, чтобы создать связи.

    Активировать связь Из: таблица 1 (столбец) To: Table 2 (column) Кратность Направление перекрестной фильтрации
    FactOnlineSales (ProductKey) DimProduct (ProductKey) Многие к одному (*:1) Одна
    FactOnlineSales (StoreKey) DimStore (StoreKey) Многие к одному (*:1) Одна
    FactOnlineSales (DateKey) DimDate (DateKey) Многие к одному (*:1) Одна
    DimStore (StoreKey) DimEmployee (StoreKey) Многие к одному (*:1) Оба

    На следующем рисунке показано готовое представление семантической модели со всеми созданными связями.

    Снимок экрана: связи таблиц в области представления модели.

Запись меры в DAX

Давайте напишите базовую меру, которая вычисляет общую сумму продаж.

  1. Выберите таблицу FactOnlineSales в папке "Таблицы ". На вкладке "Главная" выберите "Создать меру".

    Снимок экрана: связи таблиц в представлении модели.

  2. В редакторе формул скопируйте и вставьте или введите следующую меру, чтобы вычислить общую сумму продаж. Установите флажок для фиксации.

    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    Снимок экрана: выбор флажка для фиксации меры DAX.

Создание представления SQL

Давайте напишем инструкцию SQL, которая вычисляет общую сумму продаж по месяцам. Затем мы сохраните это заявление в виде представления в нашем лейкхаусе. Это позволяет нам легко получить общий объем продаж за месяц в будущем.

  1. На вкладке "Главная" выберите новый SQL-запрос.

    Снимок экрана: новый SQL-запрос на домашней вкладке.

  2. В редакторе запросов скопируйте и вставьте или введите этот запрос, чтобы вычислить общую сумму продаж по номеру месяца в порядке убывания. После ввода нажмите кнопку "Выполнить ", чтобы просмотреть результаты.

    SELECT 
    MONTH(DateKey) as "MonthNumber",
    SUM(SalesAmount) as "TotalSalesAmount"
    FROM FactOnlineSales
    GROUP BY MONTH(DateKey)
    

    Снимок экрана редактора sql-запросов.

  3. Выделите полный текст запроса и нажмите кнопку "Сохранить как представление".

    Снимок экрана: параметр

  4. В окне "Сохранить как представление" задайте для имени представления значение TotalSalesByMonth и нажмите кнопку "ОК".

    Снимок экрана: окно

  5. В обозревателе разверните раздел "Представления" и выберите TotalSalesByMonth , чтобы просмотреть результаты в предварительной версии данных.

    Снимок экрана: Представления с обозревателем Lakehouse.

    После изучения редактора конечной точки SQL вы можете перейти к следующему разделу руководства, вернувшись в рабочую область.

    Снимок экрана: боковой рельс и выбор рабочей области.

Автоматическое создание отчета

Теперь, когда вы моделировали данные, пришло время визуализировать и изучить данные с помощью быстрого создания.


  1. В представлении рабочей области наведите указатель мыши над набором данных типа элемента (по умолчанию) и именем SalesLakehouse. Выберите многоточие (...) и выберите автоматический отчет.

    Снимок экрана: параметр

    Отчет автоматически создается для вас и динамически обновляется на основе выбранных столбцов на панели данных .

    • Отображаемый отчет может отличаться от изображения.

    Снимок экрана: готовый отчет об автоматическом создании.

  2. Нажмите кнопку "Сохранить " на ленте, чтобы сохранить копию в текущей рабочей области

    • Чтобы ввести полный интерфейс разработки визуальных элементов, можно выбрать команду "Изменить " на ленте.

    Снимок экрана: кнопка

  3. В диалоговом окне "Сохранить отчет" введите "Сводка по продажам" в поле "Введите имя" для поля отчета . Нажмите кнопку "Сохранить после завершения".

    Снимок экрана: кнопка

Дополнительные сведения о быстром создании можно узнать.

Поздравляем с завершением работы с руководством. Если вы создали рабочую область для учебника, ее можно удалить. Кроме того, можно удалить отдельные элементы, созданные во время руководства.

Мы надеемся, что в этом руководстве показано, как пользователи Power BI могут легко предоставлять аналитические сведения о данных на любом уровне масштабирования с помощью Microsoft Fabric.