Отладка кода с помощью Databricks Connect для расширения Databricks для Visual Studio Code
В этой статье описывается, как использовать интеграцию Databricks Connect в расширении Databricks для Visual Studio Code для запуска и отладки отдельных файлов Python (.py
). См. раздел "Что такое расширение Databricks для Visual Studio Code?".
Интеграция Databricks Connect также позволяет запускать и отлаживать ячейки записной книжки. См. статью "Запуск и отладка ячеек записной книжки с databricks Connect" с помощью расширения Databricks для Visual Studio Code.
Требования
Прежде чем использовать Databricks Connect из расширения Databricks для Visual Studio Code, необходимо сначала выполнить требования Databricks Connect. Эти требования включают такие требования, как рабочая область с поддержкой каталога Unity, требования к вычислениям и требования к версиям для локальной установки Python.
Активация виртуальной среды Python
Активируйте виртуальную среду Python для проекта Python. Виртуальные среды Python помогают убедиться, что проект использует совместимые версии пакетов Python и Python (в данном случае — пакет Databricks Connect).
В области конфигурации:
- Щелкните красный элемент "Активировать виртуальную среду " в разделе "Среда Python".
- В палитре команд выберите Venv или Conda.
- Выберите зависимости, которые требуется установить, если таковые имеются.
Установка Databricks Connect
В представлении конфигурации в среде Python:
- Нажмите красную кнопку "Установить databricks-connect play".
- Присоединение кластера.
- Если раздел кластера еще не настроен в расширении, появится следующее сообщение: "Подключите кластер для использования Databricks Connect". Нажмите кнопку "Подключить кластер" и выберите кластер , соответствующий требованиям Databricks Connect.
- Если раздел кластера настроен, но кластер несовместим с Databricks Connect, нажмите красную кнопку Databricks Connect, нажмите кнопку "Подключить кластер" и выберите совместимый кластер.
- Если пакет Databricks Connect (и его зависимости) еще не установлен, появится следующее сообщение: "Для интерактивной отладки и автозаполнения требуется Databricks Connect. Вы хотите установить его в среде
<environment-name>
". Щелкните Установить. - В строке состояния Visual Studio Code, если появится красная кнопка Databricks Connect, щелкните ее и выполните инструкции на экране, чтобы включить его.
- После появления кнопки Databricks Connect вы можете использовать Databricks Connect.
Примечание.
При использовании поэзии можно синхронизировать pyproject.toml
файлы с poetry.lock
установленным пакетом Databricks Connect (и его зависимостями), выполнив следующую команду. Обязательно замените 13.3.2
версию пакета Databricks Connect, которая соответствует той, которая была установлена расширением Databricks для Visual Studio Code для вашего проекта.
poetry add databricks-connect==13.3.2
Запуск или отладка кода Python
После включения Databricks Connect запустите или отладите файл Python (.py
):
В проекте откройте файл Python, который требуется запустить или отлаживать.
Задайте все точки останова отладки в файле Python.
Щелкните значок "Запустить в Databricks" рядом со списком вкладок редактора и нажмите кнопку Databricks Connect: Отладка текущего файла.
Выходные данные отображаются в области консоли отладки.
Вы также можете щелкнуть файл правой
.py
кнопкой мыши и нажать кнопку "Выполнить в Databricks>Databricks Connect: отладка текущего файла".