Поделиться через


Руководство. Анализ данных веб-страницы с помощью Power BI Desktop

Как давний футбольный болельщик, вы хотите сообщить о победителях чемпионата Европы УЕФА (Кубок Европы) на протяжении многих лет. С помощью Power BI Desktop эти данные можно импортировать с веб-страницы в отчет и создать визуализации, отображающие данные. В этом руководстве описано, как использовать Power BI Desktop для:

  • Подключитесь к источнику веб-данных и перейдите по доступным таблицам.
  • Фигура и преобразование данных в Редактор Power Query.
  • Назовите запрос и импортируйте его в отчет Power BI Desktop.
  • Создание и настройка карты и визуализации круговой диаграммы.

Подключение к источнику веб-данных

Вы можете получить данные победителей УЕФА из таблицы результатов на странице https://en.wikipedia.org/wiki/UEFA_European_Football_ChampionshipВикипедии чемпионата Европы по футболу УЕФА.

Снимок экрана: таблица

Веб-подключения устанавливаются только с помощью базовой проверки подлинности. Веб-сайты, требующие проверки подлинности, могут работать неправильно с веб-соединителем.

Чтобы импортировать данные, выполните следующие действия.

  1. На вкладке домашней ленты Power BI Desktop в раскрывающемся списке рядом с кнопкой "Получить данные" и выберите "Интернет".

    Снимок экрана: параметр

    Примечание.

    Вы также можете выбрать элемент "Получить данные" или выбрать "Получить данные из других источников" из домашней страницы Power BI Desktop, а затем выбрать веб-сайт из раздела "Все" или "Другие" диалогового окна "Получить данные", а затем нажмите кнопку "Подключить".

  2. В диалоговом окне "Из Интернета" вставьте URL-адрес в текстовое поле URL-адреса https://en.wikipedia.org/wiki/UEFA_European_Football_Championship и нажмите кнопку "ОК".

    Снимок экрана: диалоговое окно

    После подключения к веб-странице Википедии диалоговое окно "Навигатор " отображает список доступных таблиц на странице. Чтобы просмотреть данные, можно выбрать любое из имен таблиц. Таблица 3 содержит нужные данные, хотя это не совсем в нужной форме. Перед загрузкой данных в отчет вы будете перепечатываться и очищать их.

    Снимок экрана: диалоговое окно

    Примечание.

    В области предварительного просмотра показана последняя таблица, но все выбранные таблицы загружаются в Редактор Power Query при выборе преобразования данных или загрузки.

  3. Выберите таблицу 3 в списке навигатора и выберите " Преобразовать данные".

    Предварительная версия таблицы открывается в Редактор Power Query, где можно применить преобразования для очистки данных.

    Снимок экрана: Редактор Power Query с импортированными данными, готовыми к преобразованиям.

Данные фигуры в Редактор Power Query

Вы хотите упростить сканирование данных, отображая только годы и страны или регионы, которые выиграли. Вы можете использовать Редактор Power Query для выполнения этих действий по формированию и очистке данных.

Сначала удалите все столбцы, кроме двух из таблицы. Переименуйте один из этих столбцов в качестве CountryRegion позже в процессе.

  1. В сетке Редактор Power Query выберите столбцы. Нажмите клавиши CTRL , чтобы выбрать несколько элементов.

  2. Щелкните правой кнопкой мыши и выберите "Удалить другие столбцы" или выберите "Удалить>другие столбцы" в группе "Управление столбцами" на вкладке "Главная лента", чтобы удалить все остальные столбцы из таблицы.

    Снимок экрана: столбцы, выделенные с помощью команды

    or

    Снимок экрана: столбцы, выделенные с выделенным элементом

Вторая строка импортированных данных содержит значения, которые не нужны. Вы можете отфильтровать окончательный столбец, чтобы исключить слово "Победители".

  1. Выберите стрелку раскрывающегося списка фильтра в столбце.

  2. В раскрывающемся меню прокрутите вниз и снимите флажок рядом с параметром "Победители ", а затем нажмите кнопку "ОК".

    Снимок экрана: текстовые фильтры в контекстном меню, где можно удалить записи.

    Ячейка со словом "Победители" отфильтровывается вместе с одной рядом с ней, null значение в той же строке для другого столбца.

  3. Сделайте то же самое в 2028 и 2032 годах, так как эти игры еще не сыграны, и результаты неизвестны.

Так как вы просматриваете только последние данные победителей сейчас, вы можете переименовать второй столбец в CountryRegion. Чтобы переименовать столбец, выполните следующие действия.

  1. Дважды щелкните или коснитесь и удерживайте его во втором заголовке столбца или

    • Щелкните правой кнопкой мыши заголовок столбца и выберите " Переименовать" или
    • Выберите столбец и выберите "Переименовать " из группы "Любой столбец " на вкладке "Преобразование " ленты.

    Снимок экрана: параметр

    or

    Снимок экрана: параметр

  2. Введите CountryRegion в заголовке и нажмите клавишу ВВОД , чтобы переименовать столбец.

Вы также хотите отфильтровать строки, имеющие null значения в столбце CountryRegion . Вы можете использовать меню фильтра, как это было с значением "Победитель ", или вы можете:

  1. Щелкните правой кнопкой мыши строку со значением NULL . Так как оба столбца имеют значение NULL в одной строке, вы можете щелкнуть правой кнопкой мыши ячейку в любом столбце.

  2. Выберите текстовые>фильтры не равны в контекстном меню, чтобы удалить строки, содержащие значение этой ячейки.

    Снимок экрана: контекстное меню с фильтрами текста и не равно выбрано.

Импортированные данные имеют надстрочный маркер заметки [c] к 2020 году. Вы можете удалить маркер заметки [c], или изменить значение на 2021, которое происходит при выполнении сопоставления, в соответствии с примечанием.

  1. Выберите первый столбец.

  2. Щелкните правой кнопкой мыши и выберите "Заменить значения" или выберите "Заменить значения" в группе "Преобразование" на вкладке "Главная" ленты. Этот параметр также найден в группе "Любой столбец " на вкладке "Преобразование ".

    Снимок экрана: столбец, выделенный параметром

    or

    Снимок экрана: столбец, выделенный в разделе

  3. В диалоговом окне "Заменить значения" введите 2020[c] в текстовом поле "Найти значение", введите 2021 в текстовом поле "Заменить с помощью" и нажмите кнопку "ОК", чтобы заменить значение в столбце.

    Снимок экрана: диалоговое окно

Импорт запроса в представление отчета

Теперь, когда вы создали нужные данные, вы можете присвоить запросу "Победители Кубка Евро" и импортировать его в отчет.

  1. В области "Запросы" в текстовом поле "Имя" введите победителей Кубка Евро.

    Снимок экрана: параметры запроса с именем

  2. Нажмите кнопку "Закрыть" и "Применить>" на вкладке "Главная" ленты.

    Снимок экрана: параметр

Запрос загружается в представление отчета Power BI Desktop, где его можно увидеть на панели данных.

Снимок экрана: панель

Совет

Вы всегда можете вернуться к Редактор Power Query, чтобы изменить и уточнить запрос:

  • Выбор дополнительных параметров с многоточием (...) рядом с победителями Кубка Евро в области "Поля " и нажатием кнопки "Изменить запрос" или
  • Выбор данных преобразования в группе "Запросы" вкладки "Главная лента" в представлении отчета.

Создание визуализации

Чтобы создать визуализацию на основе данных, выполните приведенные далее действия.

  1. Выберите поле CountryRegion в области данных или перетащите его на холст отчета. Power BI Desktop распознает данные как имена стран и регионов и автоматически создает визуализацию карты .

    Снимок экрана: визуализация карты поля

  2. Увеличьте карту, перетащив дескриптора в углах, чтобы все имена стран и регионов были видимы.

    Снимок экрана: увеличенная карта, как описано ниже.

  3. На карте показаны одинаковые точки данных для каждой страны или региона, выигравшая турнир Кубка Европы. Чтобы сделать размер каждой точки данных отражением того, как часто страна или регион выиграли, перетащите поле "Год ", чтобы добавить поля данных здесь в разделе "Размер пузырьков" в нижней части области "Визуализации ". Поле автоматически изменяется на меру count of Year , и визуализация карты теперь отображает большие точки данных для стран или регионов, которые выиграли больше турниров.

    Снимок экрана: результат перетаскивания количества лет в размер пузырька.

Настройка визуализации

Как видно, очень легко создавать визуализации на основе данных. Кроме того, можно легко настроить визуализации, чтобы лучше представить нужные данные.

Форматирование карты

Вы можете изменить внешний вид визуализации, выбрав ее, а затем щелкните значок "Формат " (кисть краски) на панели "Визуализации ". Например, точки данных "Германия" в визуализации могут быть вводящими в заблуждение, потому что Западная Германия выиграла два турнира, а Германия выиграла один. Карта заменяет две точки, а не разделяет или добавляет их вместе. Эти два пункта можно цветить по-разному, чтобы выделить этот факт. Вы также можете дать карте более описательное и привлекательное название.

  1. Выбрав визуализацию, выберите значок "Формат", а затем выберите цвета визуальных>> пузырьков, чтобы развернуть параметры цвета данных.

    Снимок экрана: значок

  2. Включите все, а затем выберите раскрывающееся меню рядом с Западной Германией и выберите желтый цвет.

    Снимок экрана: цвета, которые можно выбрать для изменения цвета, включая цвета темы и последние цвета.

  3. Выберите "Общий>заголовок", чтобы развернуть параметры заголовка, а в поле "Текст" введите "Победители Кубка Евро" вместо текущего названия.

  4. Измените цвет текста на красный, размер до 12 и шрифт в пользовательский интерфейс Segoe (полужирный).

    Снимок экрана: параметр Title, где можно изменить цвет шрифта, размер и семейство.

Визуализация карты теперь выглядит следующим образом:

Снимок экрана: визуализация карты с примененными изменениями форматирования.

Изменить тип визуализации

Вы можете изменить тип визуализации, выбрав его и выбрав другой значок в верхней части области визуализаций . Например, визуализация карты отсутствует в данных для Советского Союза, так как эта страна или регион больше не существует на карте мира. Другой тип визуализации, например диаграмма дерева или круговая диаграмма, может быть более точной, так как она отображает все значения.

Чтобы изменить карту на круговую диаграмму, выберите карту и щелкните значок круговой диаграммы в области "Визуализации ".

Снимок экрана: те же поля, которые были изменены на круговую диаграмму.

Совет

  • Вы можете использовать параметры форматирования цветов данных, чтобы сделать "Германия" и "Западная Германия" одинаковым цветом.
  • Чтобы сгруппировать страны или регионы с наибольшим количеством побед на круговой диаграмме, выберите многоточие (...) в правом верхнем углу визуализации, а затем выберите ось сортировки и количество лет.

Power BI Desktop обеспечивает простой комплексный интерфейс, от получения данных из широкого спектра источников данных и его формирования в соответствии с потребностями анализа до визуализации этих данных в широких и интерактивных способах. Когда отчет будет готов, вы можете отправить его в Power BI и создать панели мониторинга на его основе, которые можно предоставить другим пользователям Power BI.