Git-integrering för Databricks Git-mappar
Databricks Git-mappar är en visuell Git-klient och ETT API i Azure Databricks. Den stöder vanliga Git-åtgärder, till exempel kloning av en lagringsplats, incheckning och push-överföring, dragning, grenhantering och visuell jämförelse av diff vid incheckning.
I Git-mappar kan du utveckla kod i notebook-filer eller andra filer och följa metodtips för datavetenskap och teknisk kodutveckling med git för versionskontroll, samarbete och CI/CD.
Kommentar
Git-mappar (Repos) är främst utformade för redigering och samarbetsarbetsflöden.
Vad kan du göra med Databricks Git-mappar?
Databricks Git-mappar ger källkontroll för data- och AI-projekt genom att integrera med Git providers.
I Databricks Git-mappar kan du använda Git-funktioner för att:
- Klona, skicka till och hämta från en fjärransluten Git-lagringsplats.
- Skapa och hantera grenar för utvecklingsarbete, inklusive sammanslagning, ombasering och konfliktlösning.
- Skapa notebook-filer (inklusive IPYNB-notebook-filer) och redigera dem och andra filer.
- Jämför skillnader visuellt vid incheckning och lösa sammanslagningskonflikter.
Stegvisa instruktioner finns i Köra Git-åtgärder på Databricks Git-mappar (Repos).
Kommentar
Databricks Git-mappar har också ett API som du kan integrera med din CI/CD-pipeline. Du kan till exempel programmatiskt update en Databricks-lagringsplats så att den alltid har den senaste versionen av koden. Information om metodtips för kodutveckling med Hjälp av Databricks Git-mappar finns i CI/CD-tekniker med Git- och Databricks Git-mappar (Repos).
Information om vilka typer av notebook-filer som stöds i Azure Databricks finns i Exportera och importera Databricks-notebook-filer.
Stödda Git providers
Databricks Git-mappar backas upp av en integrerad Git-lagringsplats. Lagringsplatsen kan vara värd hos något av moln- och företags-Git providers som anges i följande avsnitt.
Kommentar
Vad är en "Git-provider"?
En "Git-provider" är den specifika (namngivna) tjänsten som är värd för en källkontrollmodell baserat på Git. Git-baserade källkontrollplattformar finns på två sätt: som en molntjänst som hanteras av det utvecklande företaget eller som en lokal tjänst installerad och hanterad av ditt eget företag på egen maskinvara. Många Git-providers som GitHub, Microsoft, GitLab och Atlassian tillhandahåller både molnbaserade SaaS- och lokala (kallas ibland "självhanterade") Git-tjänster.
När du väljer din Git-provider under konfigurationen måste du vara medveten om skillnaderna mellan molnet (SaaS) och den lokala Git-providers. Lokala lösningar finns vanligtvis bakom ett företags VPN och kanske inte är tillgängliga från Internet. Vanligtvis har den lokala Git-providers ett namn som slutar med "Server" eller "Självhanterad", men om du är osäker kontaktar du företagets administratörer eller granskar Git-providerns dokumentation.
Om git-providern är molnbaserad och inte visas som en leverantör som stöds kan det fungera att välja "GitHub" som leverantör, men det är inte garanterat.
Kommentar
Om du använder "GitHub" som leverantör och fortfarande är osäker på om du använder molnet eller den lokala versionen läser du Om GitHub Enterprise Server i GitHub-dokumenten.
Git-providers i molnet som stöds av Databricks
- GitHub, GitHub AE och GitHub Enterprise Cloud
- Atlassian BitBucket Cloud
- GitLab och GitLab EE
- Microsoft Azure DevOps (Azure Repos)
Lokal Git-providers som stöds av Databricks
- GitHub Enterprise Server
- Atlassian BitBucket Server och Data Center
- Självhanterad GitLab
- Microsoft Azure DevOps Server: En arbetsyteadministratör måste uttryckligen tillåta att URL-domänprefixen för Din Microsoft Azure DevOps Server anges om URL:en inte matchar
dev.azure.com/*
ellervisualstudio.com/*
. Mer information finns i Begränsa användningen till URL:er i en tillåten list
Om du integrerar en lokal Git-lagringsplats som inte är tillgänglig från Internet måste även en proxy för Git-autentiseringsbegäranden installeras i företagets VPN. För mer information, se Set ställa in privat Git-anslutning för Azure Databricks Git-mappar (Repos).
Mer information om hur du använder åtkomsttoken med din Git-provider finns i Konfigurera Git credentials & ansluta en fjärransluten lagringsplats till Azure Databricks.
Resurser för Git-integrering
Använd Databricks CLI 2.0 för Git-integrering med Azure Databricks:
Läs följande referensdokument: