Что такое расширение Databricks для Visual Studio Code?
Расширение Databricks для Visual Studio Code позволяет подключаться к удаленным рабочим областям Azure Databricks из интегрированной среды разработки Visual Studio Code (IDE), работающей на локальном компьютере разработки. Затем можно:
- Определите, разверните и запустите пакеты ресурсов Databricks для применения шаблонов CI/CD и рекомендаций к заданиям Azure Databricks, конвейерам Delta Live Tables и MLOps Stacks с помощью пользовательского интерфейса Visual Studio Code. Ознакомьтесь с функциями расширения databricks Asset Bundles? и Databricks Asset Bundles.
- Запустите локальные файлы кода Python из Visual Studio Code в кластерах Azure Databricks в удаленных рабочих областях. См. статью "Запуск файла Python в кластере"
- Запустите локальные файлы кода Python () и Python, R, Scala и записные книжки SQL (
.py
.py
, ,.ipynb
и.r
.scala
.sql
) из Visual Studio Code в качестве заданий Azure Databricks в удаленных рабочих областях. См. статью "Запуск файла Python в качестве задания". - Настройте среду отладки и Databricks Connect с помощью простого контрольного списка, который вызывает диалоги выбора. См . код отладки с помощью Databricks Connect для расширения Databricks для Visual Studio Code.
- Отладка записных книжек по ячейкам в Visual Studio Code с помощью Databricks Connect. См. статью "Запуск и отладка ячеек записной книжки с databricks Connect" с помощью расширения Databricks для Visual Studio Code.
- Синхронизируйте локальный код, разрабатываемый в Visual Studio Code, с кодом в удаленных рабочих областях. См. раздел Синхронизация папки рабочей области с Databricks
Примечание.
Расширение Databricks для Visual Studio Code поддерживает выполнение записных книжек R, Scala и SQL в качестве автоматизированных заданий, но не обеспечивает более глубокую поддержку этих языков в Visual Studio Code.
Начало работы
Чтобы приступить к работе с расширением Databricks для Visual Studio Code, выполните следующие действия.
- Установите расширение.
- Создайте новый проект Databricks или преобразуйте существующий проект Visual Studio Code.
- Легко настройте проект с помощью пользовательского интерфейса расширения Databricks.
- Запустите код Python в рамках руководства по расширению.
- Отладка кода с помощью интеграции Databricks Connect.
- Тестирование кода с помощью
pytest
. См. сведения о выполнении тестов с pytest с помощью расширения Databricks для Visual Studio Code.
Создание проекта Databricks
После установки расширения можно создать проект Databricks с помощью расширения Databricks для Visual Studio Code:
- Запустите Visual Studio Code.
- Щелкните значок Databricks на боковой панели Visual Studio Code, чтобы открыть расширение.
- Щелкните Создать новый проект.
- Впалитры команд
выберите метод узла и проверки подлинности для проекта. См. настройка авторизации расширения Databricks для Visual Studio Code. - В Укажите путь к папке, в которой вы хотите, чтобы новый проект был, введите путь к папке на локальном компьютере разработки, где вы хотите создать проект, или щелкните Открыть диалоговое окно выбора папок и выберите путь к папке проекта.
- Чтобы использовать шаблон в представлении инициализации проекта Databricks, используйте стрелки вверх и вниз для выбора шаблона, а затем нажмите клавишу ВВОД. Сведения о шаблонах проектов пакета см. в шаблонах проектов пакета ресурсов Databricks.
- Введите уникальное имя для этого проекта или оставьте имя
my_project
проекта по умолчанию, а затем нажмите клавишу ВВОД. - Выберите, следует ли добавить в проект заглушку (пример) записной книжки, заглушку (пример) конвейера Delta Live Tables или заглушку (пример) пакета Python, или любую комбинацию этих заглушек (примеров).
- Нажмите любую клавишу, чтобы закрыть вкладку редактора Project Init Для Databricks.
- Для Выберите проект, который вы хотите открыть, выберите только что созданный проект.
Открытие существующего проекта наборов активов Databricks
Проект наборов активов Databricks содержит databricks.yml
файл в корневой папке проекта. См. сведения о конфигурации пакета активов Databricks. Если вы хотите использовать расширение с существующим проектом наборов активов Databricks:
Запустите Visual Studio Code. В главном меню щелкните "Открыть папку">и перейдите в каталог, содержащий проект пакета.
Щелкните значок Databricks на боковой панели Visual Studio Code, чтобы открыть и начать использование функций расширения.
Если расширение Databricks для Visual Studio Code обнаруживает несколько проектов наборов ресурсов Databricks в текущей папке, он позволяет открыть проект или создать файл конфигурации проекта в корневой папке.
- Если вы выбрали проект, в командной палитревыберите существующий проект Databricks Asset Bundles.
- При создании конфигурации в корневой папке эта папка становится проектом пакета.
Выберите для проекта метод узла и проверки подлинности. См. настройка авторизации расширения Databricks для Visual Studio Code.
Примечание.
При открытии проекта, созданного с помощью расширения Databricks для Visual Studio Code версии 1, миграция выполняется автоматически с помощью существующей конфигурации проверки подлинности и рабочей области проекта. Кнопка миграции доступна только в том случае, если автоматическая миграция завершается ошибкой.
Переключение между проектами Databricks
Расширение Databricks для Visual Studio Code позволяет иметь несколько проектов Databricks в рабочей области Visual Studio Code и легко переключаться между ними. При открытом многопакетном проекте в рабочей области Visual Studio Code:
Щелкните значок Databricks на боковой панели Visual Studio Code, чтобы открыть расширение.
Нажмите локальную папку, чтобы выбрать проект для расширения.
Примечание.
Действия запуска доступны только для файлов в активном пакете.
Преобразование проекта в проект Databricks
Если у вас есть существующий проект, который вы хотите преобразовать в проект Databricks:
- Запустите Visual Studio Code. В главном меню щелкните "Открыть папку">и перейдите к проекту, чтобы открыть его.
- Щелкните значок Databricks на боковой панели Visual Studio Code, чтобы открыть расширение.
- Нажмите кнопку " Создать конфигурацию".
- Впалитры команд
выберите метод узла и проверки подлинности для проекта. См. настройка авторизации расширения Databricks для Visual Studio Code.