Git-integratie voor Databricks Git-mappen
Databricks Git-mappen is een visuele Git-client en API in Azure Databricks. Het biedt ondersteuning voor algemene Git-bewerkingen, zoals het klonen van een opslagplaats, doorvoeren en pushen, pullen, vertakkingsbeheer en visuele vergelijking van diffs bij het doorvoeren.
In Git-mappen kunt u code ontwikkelen in notebooks of andere bestanden en best practices voor het ontwikkelen van data science- en engineeringcode volgen met behulp van Git voor versiebeheer, samenwerking en CI/CD.
Notitie
Git-mappen (opslagplaatsen) zijn voornamelijk ontworpen voor het ontwerpen en samenwerken van werkstromen.
Wat kunt u doen met Databricks Git-mappen?
Databricks Git-mappen bieden broncodebeheer voor gegevens en AI-projecten door integratie met Git providers.
In Git-mappen van Databricks kunt u git-functionaliteit gebruiken om het volgende te doen:
- Kloon, push naar en pull vanuit een externe Git-opslagplaats.
- Vertakkingen maken en beheren voor ontwikkelingswerkzaamheden, waaronder samenvoegen, herbaseren en conflicten oplossen.
- Maak notebooks (inclusief IPYNB-notebooks) en bewerk ze en andere bestanden.
- Vergelijk visueel verschillen bij doorvoeren en samenvoegingsconflicten oplossen.
Zie Git-bewerkingen uitvoeren in Databricks Git-mappen (opslagplaatsen) voor stapsgewijze instructies.
Notitie
Databricks Git-mappen hebben ook een API die u kunt integreren met uw CI/CD-pijplijn. U kunt bijvoorbeeld programmatisch update een Databricks-opslagplaats, zodat deze altijd de meest recente versie van de code heeft. Zie CI/CD-technieken met Git- en Databricks Git-mappen (opslagplaatsen) voor informatie over aanbevolen procedures voor het ontwikkelen van code met behulp van Databricks Git-mappen.
Zie Databricks-notebooks exporteren en importeren voor informatie over de soorten notebooks die worden ondersteund in Azure Databricks.
Git providers ondersteund
Databricks Git-mappen worden ondersteund door een geïntegreerde Git-opslagplaats. De opslagplaats kan worden gehost door een van de Cloud- en Enterprise Git-providers die in de volgende sectie worden vermeld.
Notitie
Wat is een 'Git-provider'?
Een 'Git-provider' is de specifieke (benoemde) service die als host fungeert voor een broncodebeheermodel op basis van Git. Git-platformen voor broncodebeheer worden op twee manieren gehost: als een cloudservice die wordt gehost door het ontwikkelende bedrijf, of als een on-premises service die door uw eigen bedrijf op zijn eigen hardware wordt geïnstalleerd en beheerd. Veel Git-providers zoals GitHub, Microsoft, GitLab en Atlassian bieden zowel cloudgebaseerde SaaS- als on-premises Git-services (ook wel zelfbeheerd genoemd).
Wanneer u uw Git-provider kiest tijdens de configuratie, moet u rekening houden met de verschillen tussen cloud (SaaS) en on-premises Git providers. On-premises oplossingen worden doorgaans gehost achter een bedrijfs-VPN en zijn mogelijk niet toegankelijk via internet. Normaal gesproken heeft de on-premises Git-providers een naam die eindigt op Server of Zelfbeheerd, maar als u niet zeker weet, neemt u contact op met de beheerders van uw bedrijf of raadpleegt u de documentatie van de Git-provider.
Als uw Git-provider cloudgebaseerde provider is en niet wordt vermeld als een ondersteunde provider, werkt het selecteren van 'GitHub' omdat uw provider mogelijk werkt, maar niet gegarandeerd.
Notitie
Als u 'GitHub' als provider gebruikt en nog steeds niet zeker weet of u de cloud of on-premises versie gebruikt, raadpleegt u Over GitHub Enterprise Server in de GitHub-documenten.
Cloud Git providers ondersteund door Databricks
- GitHub, GitHub AE en GitHub Enterprise Cloud
- Atlassian BitBucket Cloud
- GitLab en GitLab EE
- Microsoft Azure DevOps (Azure-opslagplaatsen)
On-premises Git-providers ondersteund door Databricks
- GitHub Enterprise Server
- Atlassian BitBucket Server en Data Center
- Zelfbeheerde GitLab
- Microsoft Azure DevOps Server: een werkruimtebeheerder moet expliciet de URL-domeinvoorvoegsels voor uw Microsoft Azure DevOps-server toestaan als de URL niet overeenkomt
dev.azure.com/*
ofvisualstudio.com/*
. Zie Gebruik beperken tot URL's in een toegestane list voor meer informatie.
Als u een on-premises Git-opslagplaats integreert die niet toegankelijk is vanaf internet, moet er ook een proxy voor Git-verificatieaanvragen worden geïnstalleerd binnen de VPN van uw bedrijf. Zie Set privé-Git-connectiviteit voor Azure Databricks Git-mappen (opslagplaatsen)voor meer informatie.
Om te leren hoe u toegangstokens kunt gebruiken met uw Git-provider, zie Configureer Git credentials & verbind een externe opslagplaats met Azure Databricks.
Resources voor Git-integratie
Gebruik de Databricks CLI 2.0 voor Git-integratie met Azure Databricks:
Lees de volgende referentiedocumenten: