Анализ данных в Azure Data Lake Storage 1-го поколения с помощью Power BI
В этой статье вы узнаете, как использовать Power BI Desktop для анализа и визуализации данных, хранящихся в Azure Data Lake Storage 1-го поколения.
Предпосылки
Перед началом работы с этим учебником необходимо иметь следующее:
- подписка Azure. Посмотрите Получение бесплатной пробной версии Azure.
- Учетная запись Data Lake Storage 1-го поколения. Следуйте инструкциям , чтобы начать работу с Azure Data Lake Storage первого поколения с помощью портала Azure. В этой статье предполагается, что вы уже создали учетную запись Data Lake Storage 1-го поколения, называемую myadlsg1, и отправили в него пример файла данных (Drivers.txt). Этот пример файла доступен для скачивания из репозитория Azure Data Lake Git.
- Power BI Desktop. Вы можете скачать это из Центра загрузки Майкрософт.
Создание отчета в Power BI Desktop
Запустите Power BI Desktop на компьютере.
На ленте главная щелкните Получить данные, затем щелкните "Ещё". В диалоговом окне Получение данных щелкните Azure, щелкните Azure Data Lake Store, а затем щелкните Подключить.
Если появится диалоговое окно о соединителе на этапе разработки, выберите продолжить.
В диалоговом окне Azure Data Lake Store укажите URL-адрес учетной записи Data Lake Storage 1-го поколения и нажмите кнопку ОК.
URL-адрес
В следующем диалоговом окне нажмите Войти, чтобы войти в учетную запись Data Lake Storage первого поколения. Вы будете перенаправлены на страницу входа вашей организации. Следуйте инструкциям по входу в учетную запись.
После успешного входа нажмите кнопку Подключиться.
В следующем диалоговом окне показан файл, отправленный в учетную запись Data Lake Storage 1-го поколения. Проверьте сведения и нажмите кнопку Загрузить.
После успешной загрузки данных в Power BI вы увидите следующие поля на вкладке Поля.
Однако для визуализации и анализа данных мы предпочитаем, чтобы данные были доступны для следующих полей.
В следующих шагах мы обновим запрос, чтобы преобразовать импортированные данные в нужном формате.
На вкладке Главная щелкните Изменить запросы.
В редакторе запросов в столбце содержимого щелкните Двоичное.
Появится значок файла, представляющий загруженный файл Drivers.txt. Щелкните файл правой кнопкой мыши и кликните CSV.
Вы должны увидеть выходные данные, как показано ниже. Теперь данные доступны в формате, который можно использовать для создания визуализаций.
На ленте Главная нажмите кнопку Закрыть и применить, а затем нажмите кнопку Закрыть и применить.
После обновления запроса вкладка Поля отобразит новые поля, доступные для визуализации.
Давайте создадим круговую диаграмму для представления драйверов в каждом городе для определенной страны или региона. Для этого выберите следующее.
На вкладке "Визуализации" щелкните символ круговой диаграммы.
Используемые столбцы: Столбец 4 (название города) и Столбец 7 (название страны/региона). Перетащите эти столбцы из вкладки "Поля " на вкладку "Визуализации ", как показано ниже.
Круговая диаграмма должна выглядеть так же, как показано ниже.
Выбрав конкретную страну или регион в фильтрах уровня страниц, теперь можно просмотреть количество водителей в каждом городе выбранной страны или региона. Например, на вкладке визуализаций в разделе фильтры уровня страницывыберите Бразилии.
Круговая диаграмма автоматически обновляется для отображения драйверов в городах Бразилии.
В меню файла щелкните Сохранить, чтобы сохранить визуализацию как файл Power BI Desktop.
Публикация отчета в службе Power BI
После создания визуализаций в Power BI Desktop вы можете поделиться ими с другими пользователями, публикуя их в службе Power BI. Инструкции по тому, как это сделать, см. в разделе Публиковать из Power BI Desktop.