Поделиться через


Интеграция Git для папок Databricks Git

Папки Databricks Git — это визуальный клиент Git и API в Azure Databricks. Она поддерживает распространенные операции Git, такие как клонирование репозитория, фиксация и отправка, извлечение, управление ветвями и визуальное сравнение диффов при фиксации.

В папках Git вы можете разрабатывать код в записных книжках или других файлах, а также следовать рекомендациям по разработке кода для обработки и проектирования данных с помощью Git для управления версиями, совместной работы и CI/CD.

Примечание.

Папки Git (Repos) в основном предназначены для разработки и совместной работы рабочих процессов.

Что можно сделать с папками Databricks Git?

Папки Databricks Git обеспечивают контроль версий для проектов в области данных и ИИ путем интеграции с Git providers.

В папках Databricks Git можно использовать функции Git для:

  • Клонирование, отправка и извлечение из удаленного репозитория Git.
  • Создание ветвей для работы по разработке и управление ими, включая объединение, перебазирование и разрешение конфликтов.
  • Создайте записные книжки (включая записные книжки IPYNB) и измените их и другие файлы.
  • Визуально сравнивайте различия при фиксации и разрешении конфликт слияния.

Пошаговые инструкции см. в статье Запуск операций Git в папках Databricks Git (Repos).

Примечание.

Папки Databricks Git также имеют API, которые можно интегрировать с конвейером CI/CD. Например, вы можете программно update репозиторий Databricks, чтобы он всегда был последней версией кода. Сведения о рекомендациях по разработке кода с помощью папок Databricks Git см. в статьях CI/CD с папками Git и Databricks (Repos).

Сведения о типах записных книжек, поддерживаемых в Azure Databricks, см. в статье "Экспорт и импорт записных книжек Databricks".

Поддерживаемый Git providers

Папки Databricks Git поддерживаются интегрированным репозиторием Git. Репозиторий может размещаться любой из облачных и корпоративных providers Git, перечисленных в следующем разделе.

Примечание.

Что такое "поставщик Git"?

Поставщик Git — это конкретная (именованной) служба, в которую размещается модель управления версиями на основе Git. Платформы управления версиями на основе Git размещаются двумя способами: как облачная служба, размещенная развивающейся компанией, или как локальная служба, установленная и управляемая собственной компанией на собственном оборудовании. Многие providers Git, такие как GitHub, Microsoft, GitLab и Atlassian, предоставляют как облачные службы SaaS, так и локальные (иногда называемые "самостоятельно управляемыми") службами Git.

При выборе поставщика Git во время настройки необходимо учитывать различия между облачными (SaaS) и локальными providersGit. Локальные решения обычно размещаются за VPN компании и могут быть недоступны из Интернета. Как правило, локальные providers Git имеют имя, заканчивающееся на "Сервер" или "Самостоятельно управляемый", но если вы не уверены, обратитесь к администраторам вашей компании или просмотрите документацию поставщика Git.

Если поставщик Git является облачным и не указан в качестве поддерживаемого поставщика, выберите "GitHub", так как ваш поставщик может работать, но не гарантируется.

Примечание.

Если вы используете "GitHub" в качестве поставщика и по-прежнему не уверены, используете ли вы облачную или локальную версию, см. статью "О GitHub Enterprise Server " в документации по GitHub.

Поддержка Cloud Git providers от Databricks

  • GitHub, GitHub AE и GitHub Enterprise Cloud
  • Atlassian BitBucket Cloud
  • GitLab и GitLab EE
  • Microsoft Azure DevOps (Azure Repos)

Локальная providers Git, поддерживаемая Databricks

  • GitHub Enterprise Server
  • Atlassian BitBucket Server и Центр обработки данных
  • Самостоятельное управление GitLab
  • Microsoft Azure DevOps Server: администратор рабочей области должен явно разрешить префиксы домена URL-адреса для сервера Microsoft Azure DevOps, если URL-адрес не совпадает или dev.azure.com/*не соответствуетvisualstudio.com/*. Дополнительные сведения см. в разделе Ограничение использования URL-адресов в разрешенном списке list

Если вы интегрируете локальный репозиторий Git, который недоступен из Интернета, прокси-сервер для запросов проверки подлинности Git также должен быть установлен в VPN вашей компании. Дополнительные сведения см. в разделе Set о настройке частных подключений Git для папок Git Azure Databricks (Repos).

Чтобы узнать, как использовать маркеры доступа с вашим поставщиком Git, см. в статье Настройка Git credentials & Подключение удаленного репозитория к Azure Databricks.

Ресурсы для интеграции с Git

Используйте интерфейс командной строки Databricks 2.0 для интеграции Git с Azure Databricks:

Ознакомьтесь со следующими справочными документами:

Следующие шаги