Что такое Databricks Apps?
Внимание
Приложения Databricks доступны в общедоступной предварительной версии.
Databricks Apps позволяет разработчикам создавать безопасные данные и приложения ИИ на платформе Databricks и совместно использовать эти приложения с пользователями.
Ранее создание приложений данных и ИИ, использующих данные, управляемые рабочей областью Databricks, и функции аналитики данных платформы Databricks, необходимые для развертывания отдельной инфраструктуры для размещения приложений, обеспечения соответствия элементам управления управлением данными, управлению безопасностью приложений, включая проверку подлинности и авторизацию, и т. д. При использовании Databricks Apps Databricks размещает приложения, поэтому вам не нужно настраивать или развертывать дополнительную инфраструктуру.
Приложения могут использовать ресурсы и функции платформы Databricks, включая Unity Catalog для управления, Databricks SQL для запроса данных, функций ИИ, таких как обслуживание моделей, задания Databricks для ETL и уже настроенные правила безопасности в рабочей области, включая правила, управляющие доступом к данным, используемым приложением. Проверка подлинности и авторизация используют существующие функции Azure Databricks, включая OAuth и субъекты-службы.
Databricks разработал Приложения Databricks для разработчиков. Вы разрабатываете приложения на Python с помощью любой платформы, например Dash, Streamlit или Gradio. Так как приложения переносятся, вы можете создавать и отлаживать их локально, развертывать их в рабочей области Databricks, а затем перемещать их в другую рабочую область.
Требования
Требования к рабочей области
Чтобы развернуть и запустить приложения в рабочей области Azure Databricks, рабочая область должна соответствовать следующим требованиям:
- Необходимо убедиться, что брандмауэр не блокирует домен
*.databricksapps.com
. - Рабочая область Databricks должна находиться в поддерживаемом регионе. См. доступность бессерверных функций.
Требования к среде разработки
Чтобы создавать приложения локально и развертывать эти приложения в рабочей области Azure Databricks, среда разработки должна соответствовать следующим требованиям:
Python 3.11 или более поздней версии.
Интерфейс командной строки Databricks (Интерфейс командной строки Databricks), версия 0.229.0 или более поздней версии, настроенная для доступа к рабочей области Databricks. Сведения об установке или update и настройке Databricks CLI см. в разделе Установка или update Databricks CLI и Аутентификация для Databricks CLI.
Пакет SDK Databricks для Python. Пакет SDK можно установить с помощью
pip3
:pip3 install databricks-sdk
См. пакет SDK Databricks для Python.
(Необязательно) Если приложению требуется доступ к Databricks SQL, установите соединитель Databricks SQL для Python. Соединитель можно установить с помощью
pip3
:pip3 install databricks-sql-connector
Как Where разрабатывать приложение Databricks?
Вы можете создавать и тестировать приложения в любой интегрированной среде разработки, поддерживающей Python, например PyCharm, IntelliJ IDEA или Visual Studio Code. Databricks рекомендует разрабатывать приложения с помощью Visual Studio Code и расширения Databricks для Visual Studio Code, но вы также можете использовать записную книжку Databricks и редактор файлов для редактирования кода непосредственно в рабочей области Databricks.
Разделы справки разрабатывать и развертывать приложение Databricks?
Для локальной разработки приложения используется типичный рабочий процесс:
- Разработка приложения в предпочтительной интегрированной среде разработки, например Visual Studio Code.
- Запустите приложение локально в командной строке и просмотрите его в браузере.
- После завершения и тестирования кода переместите код и необходимые артефакты в рабочую область Databricks.
См. Get, начатые с приложений Databricks.
Чтобы создать приложение в пользовательском интерфейсе или с помощью предварительно созданного примера, см. Разделы справки создать приложение в пользовательском интерфейсе Databricks Apps?.
Можно ли использовать платформы Python с приложением Databricks?
Вы можете разрабатывать свое приложение с помощью любимых платформ Python, таких как Dash, Streamlit или Gradio. Примеры использования популярных платформ Python можно просмотреть в пользовательском интерфейсе Databricks Apps. См. Разделы справки создание приложения в пользовательском интерфейсе Databricks Apps?.
Как Databricks Apps управляет авторизацией?
Модель авторизации Databricks Apps включает пользователей, обращаюющихся к приложению, и субъекту-службе Azure Databricks, назначенному приложению:
Чтобы получить доступ к приложению, пользователь должен иметь CAN_USE или CAN_MANAGE разрешения на приложение. Дополнительные сведения о назначении разрешений приложению см. в статье "Настройка разрешений для приложения Databricks".
При создании приложения Databricks Apps автоматически создает управляемый субъект-службу Azure Databricks и назначает этот субъект-службу приложению. Этот сервисный принципал имеет доступ только к рабочей области, в которой создано приложение, и используется для аутентификации и авторизации доступа к ресурсам в рабочей области, таким как хранилища SQL, эндпоинты обслуживания моделей или защищаемые объекты в Unity Catalog. Все доступ приложения к данным или другим ресурсам рабочей области выполняется от имени субъекта-службы, а не владельца приложения или пользователя.
Databricks Apps автоматически предоставляет субъекту-службе разрешения на любые ресурсы, назначенные приложению, если пользователь, развертывающий приложение, имеет
CAN MANAGE
разрешение на эти ресурсы. Если требуется доступ сервисного принципала к другим ресурсам, например, tables или файлы рабочей области, администратор учетной записи или администратор рабочей области должен grant сервисному принципалу доступ к этим ресурсам. При предоставлении доступа к ресурсам Databricks рекомендует выполнить принцип наименьших привилегий и предоставить субъекту-службе только минимальные необходимые разрешения. См. статью Управление субъектами-службами.Имя субъекта-службы можно найти на странице сведений о приложении на карточке ресурсов приложения. Субъект-служба включает имя приложения, например для имени
my-hello-world-app
приложения, имяapp-22ixod my-hello-world-app
субъекта-службы .
Кто может создавать приложения Databricks?
Любой пользователь в рабочей области может создавать приложения. Однако для управления разрешениями субъекта-службы, назначенного приложению, необходимо быть учетной записью или администратором рабочей области.
Разделы справки настроить приложение Databricks?
Databricks Apps автоматически задает несколько переменных среды, к которым может получить доступ ваше приложение, например узел Databricks, на котором работает ваше приложение. Вы также можете set настроить parameters с помощью YAML-файла. См. сведения о конфигурации Databricks Apps.
Разделы справки интегрировать приложение Databricks со службами Azure Databricks?
Приложения могут использовать функции платформы Databricks, такие как Databricks SQL, для запроса данных, заданий Databricks для приема и обработки данных, Службы модели ИИ Мозаики для доступа к созданным моделям ИИ и секретам Databricks для управления конфиденциальной информацией. При настройке приложения эти функции платформы Databricks называются ресурсами.
Тем не менее, поскольку приложения предназначены для переноса, Databricks рекомендует, чтобы приложения не зависели от определенных ресурсов. Например, приложение не должно быть жестко закодировано для использования определенного хранилища SQL. Вместо этого настройте хранилище SQL в пользовательском интерфейсе Databricks Apps при создании или обновлении приложения.
Кроме того, так как приложения настроены на выполнение с минимальными привилегиями, они не должны создавать новые ресурсы. Вместо этого они должны полагаться на платформу Databricks для разрешения существующих зависимых служб. Каждое приложение назначено субъекту-службе Databricks. Во время создания приложения или updateучётная запись службы получает необходимые разрешения на определённые зависимости ресурсов.
Дополнительные сведения о добавлении функций платформы Databricks в качестве ресурсов приложения см. в статье "Назначение функций платформы Databricks" в приложение Databricks.
Where можно ли найти журналы аудита для моих приложений Databricks?
Чтобы найти события аудита для приложений, используйте систему Azure Databricks tables. Вы можете использовать систему tables для запроса.
- Имена входа в приложение. Узнайте , какие пользователи вошли в приложение Databricks?.
- Разрешения или предоставление общего доступа к приложениям. Узнайте , какие приложения Databricks были обновлены, чтобы изменить способ совместного использования приложения с другими пользователями или группами?.
Какова стоимость приложений Databricks?
Сведения о ценах на Приложения Databricks см. в разделе "Вычисления для приложений".
Системная среда Databricks Apps
Примечание.
Чтобы просмотреть среду для конкретного приложения, включая переменные среды и установленные пакеты, перейдите на вкладку "Среда " на странице сведений о приложении. См. сведения о приложении Databricks.
Ниже описана системная среда, в которой выполняются приложения, ресурсы, доступные для приложения, и версии установленных приложений и библиотек.
- Операционная система: Ubuntu 22.04 LTS
-
Python: 3.11.0. Приложения выполняются в виртуальной среде Python. Все зависимости устанавливаются в этой виртуальной среде, включая автоматически установленные библиотеки и все установленные библиотеки, например с файлом
requirements.txt
. - Системные ресурсы: приложения могут использовать до двух виртуальных ЦП и 6 ГБ памяти. Приложение может быть перезапущено, если оно превышает выделенные ресурсы.
Установленные библиотеки Python
Библиотека | Версия |
---|---|
databricks-sql-connector | 3.4.0 |
databricks-sdk | 0.33.0 |
mlflow-skinny | 2.16.2 |
gradio | 4.44.0 |
streamlit | 1.38.0 |
блестящий | 1.1.0 |
панель мониторинга | 2.18.1 |
flask | 3.0.3 |
fastapi | 0.115.0 |
uvicorn[standard] | 0.30.6 |
gunicorn | 23.0.0 |
dash-ag-grid | 31.2.0 |
Dash-mantine-components | 0.14.4 |
Dash-bootstrap-components | 1.6.0 |
график | 5.24.1 |
график-resampler | 0.10.0 |
Ограничения
В рабочей области Databricks насчитывается 50 приложений с кодом limit.
Файлы, используемые приложением, не могут превышать 10 МБ в размере. Если файл в каталоге приложения превышает этот limit, развертывание приложения завершается ошибкой.
Databricks Apps не соответствует стандартам соответствия HIPAA, PCI или FedRAMP.
Журналы, созданные приложением, не сохраняются при завершении вычислений Azure Databricks, в которых размещено приложение. См . ведение журнала из приложения Databricks.
Так как они не поддерживают OAuth, вы не можете использовать устаревшие региональные URL-адреса с приложениями Databricks.