Визуализации в записных книжках Databricks
Azure Databricks имеет встроенную поддержку диаграмм и визуализаций как в Databricks SQL, так и в записных книжках. На этой странице описывается, как работать с визуализациями в записной книжке Databricks. Сведения об использовании визуализаций в Databricks SQL см. в разделе "Визуализация" в Databricks SQL.
Чтобы просмотреть типы визуализаций, см . типы визуализаций.
Создание новой визуализации
Чтобы повторно создать пример в этом разделе, используйте следующий код:
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
Чтобы создать визуализацию, кликните + над результатом и выберите визуализацию. Откроется редактор визуализаций.
В раскрывающемся списке Тип визуализации выберите тип.
Выберите данные, которые будут отображаться в визуализации. Доступные поля будут зависть от выбранного типа.
Нажмите кнопку Сохранить.
Создание профиля данных
Примечание.
Доступно в Databricks Runtime 9.1 LTS и более поздних версий.
Профили данных отображают сводную статистику кадра данных Apache Spark, кадра данных pandas или таблицы SQL в табличном и графическом формате. Чтобы создать Профиль данных из ячейки результатов, щелкните + и выберите Профиль данных.
Azure Databricks вычисляет и отображает сводную статистику.
- Числовые и категориальные признаки отображаются в отдельных таблицах.
- В верхней части вкладки можно выполнить сортировку или поиск признаков.
- В верхней части диаграммы можно выбрать отображение гистограммы (Стандартный) или квантилей.
- Установите флажок развернуть, чтобы диаграммы отображались в увеличенном виде.
- Установите флажок логарифмическая, чтобы диаграммы отображались на логарифмической шкале.
- Вы можете наведите курсор на диаграммы для получения более подробных сведений, таких как границы столбца гистограммы и количество строк в нем, или значение квантильного значения.
Вы также можете создавать профили данных программным способом; см. команды сводки (dbutils.data.summarize).
Работа с визуализациями и профилями данных
Примечание.
Профили данных доступны в Databricks Runtime 9.1 LTS и более поздних версий.
Переименование, дублирование или удаление визуализации или профиля данных
Чтобы переименовать, дублировать или удалить визуализацию или профиль данных, щелкните стрелку вниз в правой части имени вкладки. Вы также можете создать панель мониторинга из меню.
Примечание.
Если ячейка содержит профиль данных, связанную визуализацию и профиль данных можно добавить только на панель управления записной книжки. Для ячеек, содержащих только визуализации, вы увидите дополнительный Добавить на панель мониторинга пункт меню в раскрывающемся списке. См. добавление визуализации впанели мониторинга.
Вы также можете изменить имя, щелкнув и отредактировав его.
Изменение визуализации
Щелкните под визуализацией, чтобы открыть редактор визуализации. Закончив вносить изменения, щелкните Сохранить.
Изменение цветов
Цвета визуализации можно настроить при создании визуализации, либо при ее редактировании.
- Создайте или начните изменение визуализации.
- Щелкните Цвета.
- Чтобы изменить цвет, щелкните квадрат и выберите новый цвет, выполнив одно из следующих действий:
- Щелкните его в селекторе цветов.
- Введите шестнадцатеричное значение.
- Щелкните в любом месте за пределами селектора цветов, чтобы закрыть его.
- Нажмите кнопку Сохранить в редакторе визуализации , чтобы сохранить изменения.
Выбор серии
Чтобы выбрать определенный ряд для анализа на диаграмме, используйте следующие команды:
- Щелкните один элемент условных обозначений, чтобы выбрать этот ряд
- Cmd/Ctrl + щелкните на элементе легенды, чтобы выбрать или отменить выбор нескольких серий
выбор рядов
Отсортированные подсказки
Используйте подсказки на линейных диаграммах и несвязанных линейчатых диаграммах, упорядоченных по величине, для упрощения анализа.
Zoom / Увеличить
Для диаграмм, насыщенных данными, увеличение отдельных точек данных может оказаться полезным для изучения деталей и обрезки выбросов. Чтобы увеличить масштаб диаграммы, щелкните и перетащите его на холст. Чтобы очистить масштаб, наведите указатель мыши на холст и нажмите кнопку Очистить масштаб в правом верхнем углу визуализации.
Скачивание визуализации в виде PNG-файла
Чтобы загрузить визуализацию в виде PNG-файла, наведите указатель мыши на холст и щелкните значок скачивания в правом верхнем углу.
Png-файл скачан на устройство.
Добавление визуализации на панель мониторинга
- Щелкните стрелку вниз в правой части имени вкладки.
- Выберите Добавить на панель мониторинга. Появится список доступных представлений панели мониторинга, а также параметр меню Добавить в новую панель мониторинга.
- Выберите панель мониторинга или выберите Добавить в новую панель мониторинга. Откроется панель мониторинга, включая только что добавленную визуализацию.
Устаревшие визуализации
Последняя версия визуализаций диаграмм по умолчанию включена. Параметры в этом разделе описывают устаревшие визуализации, которые могут возникнуть при работе со старой диаграммой или если у вас отключена последняя версия.
Средства визуализации
Если навести указатель мыши на верхнюю правую часть диаграммы, появится панель инструментов Plotly, где можно выполнять такие операции, как выбор, масштабирование и панорамирование.
Скачивание визуализации
Чтобы скачать визуализацию в .png формате, щелкните значок камеры в ячейке записной книжки или в редакторе визуализации.
В результирующий ячейке значок камеры отображается в правом верхнем углу при перемещении курсора над ячейкой.
В редакторе визуализаций значок камеры появляется при перемещении курсора на диаграмму. См. раздел Средства визуализации.
Временное скрытие или отображение ряда
Чтобы скрыть ряд в визуализации, щелкните его в условных обозначениях. Чтобы снова отобразить ряд, щелкните его еще раз в условных обозначениях.
Чтобы отобразить только один ряд, дважды щелкните его в условных обозначениях. Чтобы отобразить другие ряды, щелкните каждый из них.