Поделиться через


Визуализации в записных книжках Databricks

Azure Databricks имеет встроенную поддержку диаграмм и визуализаций как в Databricks SQL, так и в записных книжках. На этой странице описывается, как работать с визуализациями в записной книжке Databricks. Сведения об использовании визуализаций в Databricks SQL см. в разделе "Визуализация" в Databricks SQL.

Чтобы просмотреть типы визуализаций, см . типы визуализаций.

Создание новой визуализации

Чтобы повторно создать пример в этом разделе, используйте следующий код:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

Чтобы создать визуализацию, кликните + над результатом и выберите визуализацию. Откроется редактор визуализаций.

Меню новой визуализации

  1. В раскрывающемся списке Тип визуализации выберите тип.

    Редактор визуализаций

  2. Выберите данные, которые будут отображаться в визуализации. Доступные поля будут зависть от выбранного типа.

  3. Нажмите кнопку Сохранить.

Создание профиля данных

Примечание.

Доступно в Databricks Runtime 9.1 LTS и более поздних версий.

Профили данных отображают сводную статистику кадра данных Apache Spark, кадра данных pandas или таблицы SQL в табличном и графическом формате. Чтобы создать Профиль данных из ячейки результатов, щелкните + и выберите Профиль данных.

Azure Databricks вычисляет и отображает сводную статистику.

Профиль данных

  • Числовые и категориальные признаки отображаются в отдельных таблицах.
  • В верхней части вкладки можно выполнить сортировку или поиск признаков.
  • В верхней части диаграммы можно выбрать отображение гистограммы (Стандартный) или квантилей.
  • Установите флажок развернуть, чтобы диаграммы отображались в увеличенном виде.
  • Установите флажок логарифмическая, чтобы диаграммы отображались на логарифмической шкале.
  • Вы можете наведите курсор на диаграммы для получения более подробных сведений, таких как границы столбца гистограммы и количество строк в нем, или значение квантильного значения.

Вы также можете создавать профили данных программным способом; см. команды сводки (dbutils.data.summarize).

Работа с визуализациями и профилями данных

Примечание.

Профили данных доступны в Databricks Runtime 9.1 LTS и более поздних версий.

Переименование, дублирование или удаление визуализации или профиля данных

Чтобы переименовать, дублировать или удалить визуализацию или профиль данных, щелкните стрелку вниз в правой части имени вкладки. Вы также можете создать панель мониторинга из меню.

Примечание.

Если ячейка содержит профиль данных, связанную визуализацию и профиль данных можно добавить только на панель управления записной книжки. Для ячеек, содержащих только визуализации, вы увидите дополнительный Добавить на панель мониторинга пункт меню в раскрывающемся списке. См. добавление визуализации впанели мониторинга.

раскрывающееся меню профиля данных ноутбука

Вы также можете изменить имя, щелкнув и отредактировав его.

Изменение визуализации

Щелкните Кнопка под визуализацией, чтобы открыть редактор визуализации. Закончив вносить изменения, щелкните Сохранить.

Изменение цветов

Цвета визуализации можно настроить при создании визуализации, либо при ее редактировании.

  1. Создайте или начните изменение визуализации.
  2. Щелкните Цвета.
  3. Чтобы изменить цвет, щелкните квадрат и выберите новый цвет, выполнив одно из следующих действий:
    • Щелкните его в селекторе цветов.
    • Введите шестнадцатеричное значение.
  4. Щелкните в любом месте за пределами селектора цветов, чтобы закрыть его.
  5. Нажмите кнопку Сохранить в редакторе визуализации , чтобы сохранить изменения.

Выбор серии

Чтобы выбрать определенный ряд для анализа на диаграмме, используйте следующие команды:

  • Щелкните один элемент условных обозначений, чтобы выбрать этот ряд
  • Cmd/Ctrl + щелкните на элементе легенды, чтобы выбрать или отменить выбор нескольких серий

выбор рядов

Отсортированные подсказки

Используйте подсказки на линейных диаграммах и несвязанных линейчатых диаграммах, упорядоченных по величине, для упрощения анализа.

отсортированные подсказки

Zoom / Увеличить

Для диаграмм, насыщенных данными, увеличение отдельных точек данных может оказаться полезным для изучения деталей и обрезки выбросов. Чтобы увеличить масштаб диаграммы, щелкните и перетащите его на холст. Чтобы очистить масштаб, наведите указатель мыши на холст и нажмите кнопку Очистить масштаб в правом верхнем углу визуализации.

увеличить масштаб, чтобы просмотреть сведения

Скачивание визуализации в виде PNG-файла

Чтобы загрузить визуализацию в виде PNG-файла, наведите указатель мыши на холст и щелкните значок скачивания в правом верхнем углу.

Щелкните скачивание, чтобы экспортировать визуализацию в виде PNG-файла

Png-файл скачан на устройство.

Добавление визуализации на панель мониторинга

  1. Щелкните стрелку вниз в правой части имени вкладки.
  2. Выберите Добавить на панель мониторинга. Появится список доступных представлений панели мониторинга, а также параметр меню Добавить в новую панель мониторинга.
  3. Выберите панель мониторинга или выберите Добавить в новую панель мониторинга. Откроется панель мониторинга, включая только что добавленную визуализацию.

Устаревшие визуализации

Последняя версия визуализаций диаграмм по умолчанию включена. Параметры в этом разделе описывают устаревшие визуализации, которые могут возникнуть при работе со старой диаграммой или если у вас отключена последняя версия.

Средства визуализации

Если навести указатель мыши на верхнюю правую часть диаграммы, появится панель инструментов Plotly, где можно выполнять такие операции, как выбор, масштабирование и панорамирование.

Панель инструментов редактора визуализаций для записных книжек

Скачивание визуализации

Чтобы скачать визуализацию в .png формате, щелкните значок Значок камерыкамеры в ячейке записной книжки или в редакторе визуализации.

  • В результирующий ячейке значок камеры отображается в правом верхнем углу при перемещении курсора над ячейкой.

    Значок камеры в ячейке записной книжки

  • В редакторе визуализаций значок камеры появляется при перемещении курсора на диаграмму. См. раздел Средства визуализации.

Временное скрытие или отображение ряда

Чтобы скрыть ряд в визуализации, щелкните его в условных обозначениях. Чтобы снова отобразить ряд, щелкните его еще раз в условных обозначениях.

Чтобы отобразить только один ряд, дважды щелкните его в условных обозначениях. Чтобы отобразить другие ряды, щелкните каждый из них.