Dela via


Källkontroll i Azure Data Factory

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Dricks

Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Som standard är UX-författarna (Azure Data Factory User Interface Experience) direkt mot datafabrikstjänsten. Den här upplevelsen har följande begränsningar:

  • Data Factory-tjänsten innehåller inte någon lagringsplats för lagring av JSON-entiteter för dina ändringar. Det enda sättet att spara ändringar är via knappen Publicera alla och alla ändringar publiceras direkt till datafabrikstjänsten.
  • Data Factory-tjänsten är inte optimerad för samarbete och versionskontroll.
  • Den Azure Resource Manager-mall som krävs för att distribuera själva Data Factory ingår inte.

För att ge en bättre redigeringsupplevelse kan du med Azure Data Factory konfigurera en Git-lagringsplats med antingen Azure Repos eller GitHub. Git är ett versionskontrollsystem som möjliggör enklare spårning och samarbete. Den här artikeln beskriver hur du konfigurerar och arbetar på en git-lagringsplats tillsammans med att markera metodtips och en felsökningsguide.

Du kan också referera till Kontinuerlig integrering och leverans (CI/CD) i Azure Data Factory för att lära dig mer om det större CI/CD-mönstret, där källkontroll är en viktig aspekt.

Kommentar

Vi har lagt till offentligt Stöd för GitHub på Azure Gov och Microsoft Azure som drivs av 21Vianet. Se tillkännagivandebloggen.

Mer information om hur Azure Data Factory integreras med Git finns i självstudievideon på 15 minuter nedan:

Fördelar med Git-integrering

Nedan visas en lista över några av fördelarna med git-integrering för redigeringsupplevelsen:

  • Källkontroll: När dina datafabriksarbetsbelastningar blir avgörande vill du integrera din fabrik med Git för att tillämpa flera fördelar med källkontroll som följande:
    • Möjlighet att spåra/granska ändringar.
    • Möjlighet att återställa ändringar som introducerade buggar.
  • Partiella sparanden: När du redigerar mot datafabrikstjänsten kan du inte spara ändringar som ett utkast, och alla publiceringar måste godkännas av datafabriken. Oavsett om dina pipelines inte är färdiga eller om du helt enkelt inte vill förlora ändringar om datorn kraschar, tillåter git-integrering inkrementella ändringar av datafabriksresurser oavsett vilket tillstånd de befinner sig i. När du konfigurerar en git-lagringsplats kan du spara ändringar så att du bara kan publicera efter att du har testat dina ändringar till din belåtenhet.
  • Samarbete och kontroll: Om du har flera teammedlemmar som bidrar till samma fabrik kanske du vill låta dina teammedlemmar samarbeta med varandra via en kodgranskningsprocess. Du kan också konfigurera din fabrik så att inte alla deltagare har samma behörigheter. Vissa teammedlemmar kan bara tillåtas göra ändringar via Git och endast vissa personer i teamet får publicera ändringarna i fabriken.
  • Bättre CI/CD: Om du distribuerar till flera miljöer med en kontinuerlig leveransprocess gör git-integrering vissa åtgärder enklare. Några av dessa åtgärder är:
    • Konfigurera versionspipelinen så att den utlöses automatiskt så snart det görs ändringar i din dev-fabrik.
    • Anpassa de egenskaper i din fabrik som är tillgängliga som parametrar i Resource Manager-mallen. Det kan vara användbart att bara behålla den obligatoriska uppsättningen egenskaper som parametrar och ha allt annat hårdkodat.
  • Bättre prestanda: En genomsnittlig fabrik med git-integrering läses in 10 gånger snabbare än en redigering mot datafabrikstjänsten. Den här prestandaförbättringen beror på att resurser laddas ned via Git.

Kommentar

Redigering direkt med Data Factory-tjänsten inaktiveras i Azure Data Factory UX när en Git-lagringsplats har konfigurerats. Ändringar som görs via PowerShell eller en SDK publiceras direkt till Data Factory-tjänsten och anges inte i Git.

Ansluta till en Git-lagringsplats

Det finns fyra olika sätt att ansluta en Git-lagringsplats till din datafabrik för både Azure Repos och GitHub. När du har anslutit till en Git-lagringsplats kan du visa och hantera din konfiguration i hanteringshubben under Git-konfiguration i avsnittet Källkontroll .

Konfigurationsmetod 1: Startsida

På startsidan för Azure Data Factory väljer du Konfigurera kodlagringsplats högst upp.

Konfigurera en kodlagringsplats från startsidan

Konfigurationsmetod 2: Redigeringsarbetsyta

I azure Data Factory UX-redigeringsarbetsytan väljer du den nedrullningsbara menyn Data Factory och väljer sedan Konfigurera kodlagringsplats.

Konfigurera inställningarna för kodlagringsplatsen från redigering

Konfigurationsmetod 3: Hanteringshubben

Gå till hanteringshubben i Azure Data Factory Studio. Välj Git-konfiguration i avsnittet Källkontroll . Om du inte har någon ansluten lagringsplats väljer du Konfigurera.

Konfigurera inställningarna för kodlagringsplatsen från hanteringshubben

Konfigurationsmetod 4: När fabriken skapas

När du skapar en ny datafabrik i Azure Portal kan du konfigurera Git-lagringsplatsinformation på fliken Git-konfiguration.

Kommentar

När du konfigurerar git i Azure-portalen måste inställningar som projektnamn och lagringsplatsnamn anges manuellt i stället för att ingå i en listruta.

Konfigurera inställningarna för kodlagringsplatsen från Azure-portalen

Skapa med Git-integrering för Azure-lagringsplatser

Visuell redigering med Azure Repos Git-integrering stöder källkontroll och samarbete för arbete med dina datafabrikspipelines. Du kan associera en datafabrik med en Azure Repos Git-organisationslagringsplats för källkontroll, samarbete, versionshantering och så vidare. En enda Azure Repos Git-organisation kan ha flera lagringsplatser, men en Git-lagringsplats för Azure Repos kan bara associeras med en datafabrik. Om du inte har någon Azure Repos-organisation eller lagringsplats följer du de här anvisningarna för att skapa dina resurser.

Kommentar

Du kan lagra skript- och datafiler på en Azure Repos Git-lagringsplats. Du måste dock ladda upp filerna manuellt till Azure Storage. En datafabrikspipeline laddar inte automatiskt upp skript eller datafiler som lagras på en Azure Repos Git-lagringsplats till Azure Storage. Ytterligare filer som ARM-mallar, skript eller konfigurationsfiler kan lagras på lagringsplatsen utanför den mappade mappen. Om du gör det måste du tänka på att det krävs ytterligare en uppgift för att skapa/distribuera och interagera med filerna som lagras utanför den mappade Azure DevOps-mappen.

Inställningar för Azure Repos

Skärmbild som visar inställningarna för Konfigurera en lagringsplats.

Konfigurationsfönstret beskriver steg för steg hur du konfigurerar var och en av följande inställningar för kodlagringsplatsen:

Inställning beskrivning Värde
Lagringsplatstyp Typen av Azure Repos-kodlagringsplats.
Azure DevOps Git eller GitHub
Microsoft Entra ID Ditt Microsoft Entra-klientnamn. <your tenant name>
Azure Repos Organization Namnet på din Azure Repos-organisation. Du kan hitta ditt organisationsnamn för Azure Repos på https://{organization name}.visualstudio.com. Du kan logga in på din Azure Repos-organisation för att få åtkomst till din Visual Studio-profil och se dina lagringsplatser och projekt. <your organization name>
ProjectName Namnet på ditt Azure Repos-projekt. Du kan hitta namnet på ditt Azure Repos-projekt på https://{organization name}.visualstudio.com/{project name}. <your Azure Repos project name>
RepositoryName Namnet på din Azure Repos-kodlagringsplats. Azure Repos-projekt innehåller Git-lagringsplatser för att hantera källkoden när projektet växer. Du kan skapa en ny lagringsplats eller använda en befintlig lagringsplats som redan finns i projektet. <your Azure Repos code repository name>
Samarbetsgren Din Azure Repos-samarbetsgren som används för publicering. Som standard är maindet . Ändra den här inställningen om du vill publicera resurser från en annan gren. <your collaboration branch name>
Publicera gren Grenen Publicera är grenen på din lagringsplats där publiceringsrelaterade ARM-mallar lagras och uppdateras. Som standard är adf_publishdet . <your publish branch name>
Rotmapp Din rotmapp i din Azure Repos-samarbetsgren. <your root folder name>
Importera befintliga Data Factory-resurser till lagringsplatsen Anger om du vill importera befintliga datafabriksresurser från UX-redigeringsarbetsytan till en Azure Repos Git-lagringsplats. Markera rutan för att importera dina datafabriksresurser till den associerade Git-lagringsplatsen i JSON-format. Den här åtgärden exporterar varje resurs individuellt (det vill: de länkade tjänsterna och datauppsättningarna exporteras till separata JSON:er). När den här rutan inte är markerad importeras inte de befintliga resurserna. Markerad (standard)
Gren för att importera resurs till Anger till vilken gren datafabriksresurserna (pipelines, datauppsättningar, länkade tjänster osv.) importeras. Du kan importera resurser till någon av följande grenar: a. Samarbete b. Skapa ny c. Använd befintlig

Kommentar

Om du använder Microsoft Edge och inte ser några värden i listrutan Azure DevOps-konto lägger du till https://*.visualstudio.com i listan över betrodda webbplatser.

Redigera lagringsplatsens inställningar

Om du behöver justera inställningarna för din konfigurerade Git-lagringsplats för Azure Repos kan du välja Redigera.

Skärmbild som visar redigeringsknappen för redigering av en Azure Repos Git-lagringsplats.

Du kan uppdatera publiceringsgrenen och bestämma om du vill inaktivera publiceringsknappen från ADF-studion eller inte. Om du väljer att inaktivera publiceringsknappen från studion är publiceringsknappen nedtonad i studion. Detta hjälper dig att undvika att skriva över den senaste automatiserade publiceringsdistributionen.

Skärmbild som visar en kryssruta för att inaktivera publiceringsknappen för Data Factory Studio.

Använda en annan Microsoft Entra-klientorganisation

Git-lagringsplatsen för Azure Repos kan finnas i en annan Microsoft Entra-klientorganisation. Om du vill ange en annan Microsoft Entra-klient måste du ha administratörsbehörighet för den Azure-prenumeration som du använder. Mer information finns i Ändra prenumerationsadministratör.

Viktigt!

Om du vill ansluta till ett annat Microsoft Entra-ID måste användaren som är inloggad vara en del av den active directory-katalogen.

Använda ditt personliga Microsoft-konto

Om du vill använda ett personligt Microsoft-konto för Git-integrering kan du länka din personliga Azure-lagringsplats till organisationens Active Directory.

  1. Lägg till ditt personliga Microsoft-konto i organisationens Active Directory som gäst. Mer information finns i Lägga till Microsoft Entra B2B-samarbetsanvändare i Azure Portal.

  2. Logga in på Azure Portal med ditt personliga Microsoft-konto. Växla sedan till organisationens Active Directory.

  3. Gå till avsnittet Azure DevOps, där du nu ser din personliga lagringsplats. Välj lagringsplatsen och anslut med Active Directory.

Efter de här konfigurationsstegen är din personliga lagringsplats tillgänglig när du konfigurerar Git-integrering i Data Factory-användargränssnittet.

Mer information om hur du ansluter Azure Repos till din organisations Active Directory finns i Ansluta din Azure DevOps-organisation till Microsoft Entra-ID.

Skapa med GitHub-integrering

Visuell redigering med GitHub-integrering stöder källkontroll och samarbete för arbete med dina datafabrikspipelines. Du kan associera en datafabrik med en GitHub-kontolagringsplats för källkontroll, samarbete och versionshantering. Ett enda GitHub-konto kan vara värd för flera lagringsplatser och varje lagringsplats kan associeras med flera datafabriker. Genom att konfigurera varje datafabrik för att använda en annan gren på samma lagringsplats kan du underhålla separata miljöer (till exempel utveckling, mellanlagring och produktion) samtidigt som du hanterar deras konfigurationer oberoende av varandra. Om du inte har något GitHub-konto eller en lagringsplats följer du de här anvisningarna för att skapa dina resurser.

GitHub-integreringen med Data Factory stöder både offentliga GitHub (dvs. https://github.com), GitHub Enterprise Cloud och GitHub Enterprise Server. Du kan använda både offentliga och privata GitHub-lagringsplatser med Data Factory så länge du har läs- och skrivbehörighet till lagringsplatsen i GitHub. Om du vill ansluta till en offentlig lagringsplats väljer du alternativet Använd länklagringsplats eftersom de inte visas i listrutan i Lagringsplatsens namn. ADF:s GitHub Enterprise-serverintegrering fungerar endast med officiellt stödda versioner av GitHub Enterprise Server.

För lagringsplatser som ägs av GitHub-organisationskontot måste administratören auktorisera ADF-appen. För lagringsplatser som ägs av GitHub-användarkontot kan en användare med minst samarbetspartnersbehörighet auktorisera ADF-appen. Den här behörigheten ger inte ADF-appen direkt åtkomst till alla lagringsplatser som ägs av kontot/organisationen. Den tillåter bara att ADF-appen agerar åt användaren för att få åtkomst till lagringsplatser baserat på användarens åtkomstbehörigheter.

Kommentar

Om du använder Microsoft Edge fungerar inte GitHub Enterprise-versionen mindre än 2.1.4 med den. GitHub stöder >officiellt =3.0 och alla dessa bör vara bra för ADF. När GitHub ändrar sin lägsta version ändras även versioner som stöds av ADF.

GitHub-inställningar

 Skärmbild som visar fönstret Konfigurera en lagringsplats i GitHub.

Kommentar

Om du får felet Det gick inte att lista GitHub-lagringsplatser. Kontrollera att kontonamnet är korrekt och att du har behörighet att utföra åtgärden. Kontrollera att du använder rätt ägarnamn och inte Url:en för GitHub-lagringsplatsen. Om lagringsplatsens URL till exempel är https://github.com/contoso/contoso-adsär ägaren contoso, inte den fullständiga URL:en.

Skärmbild som visar GitHub Konfigurera en lagringsplats med företagsserverfönstret.

Inställningar för GitHub-lagringsplats

Konfigurationsfönstret visar följande Inställningar för GitHub-lagringsplats:

Inställning Beskrivning Värde
Lagringsplatstyp Typen av Azure Repos-kodlagringsplats. GitHub
Använda GitHub Enterprise Server Kryssruta för att välja GitHub Enterprise Server. omarkerad (standard)
GitHub Enterprise Server URL GitHub Enterprise-rot-URL :en (måste vara HTTPS för den lokala GitHub Enterprise-servern). Exempel: https://github.mydomain.com. Krävs endast om Använd GitHub Enterprise Server har valts <your GitHub Enterprise Server URL>
GitHub-lagringsplatsägare GitHub-organisation eller konto som äger lagringsplatsen. Det här namnet kan hittas från https://github.com/{owner}/{repository namnet}. När du navigerar till den här sidan uppmanas du att ange autentiseringsuppgifter för GitHub OAuth till din GitHub-organisation eller ditt GitHub-konto. Om du väljer Använd GitHub Enterprise Server visas en dialogruta där du kan ange din åtkomsttoken. <your GitHub repository owner name>
Namn på lagringsplats Namnet på din GitHub-kodlagringsplats. GitHub-konton innehåller Git-lagringsplatser för att hantera källkoden. Du kan skapa en ny lagringsplats eller använda en befintlig lagringsplats som redan finns i ditt konto. Ange namnet på din GitHub-kodlagringsplats när du väljer Välj lagringsplats. <your repository name>
Länk till Git-lagringsplats Länken till GitHub-kodlagringsplatsen. Ange länken till din GitHub-kodlagringsplats när du väljer Länken Använd lagringsplats. <your repository link>
Samarbetsgren Din GitHub-samarbetsgren som används för publicering. Som standard är det huvudinställningen. Ändra den här inställningen om du vill publicera resurser från en annan gren. Du kan också skapa en ny samarbetsgren här. <your collaboration branch>
Publicera gren Grenen på din lagringsplats där publiceringsrelaterade ARM-mallar lagras och uppdateras. <your publish branch name>
Rotmapp Din rotmapp i din GitHub-samarbetsgren. <your root folder name>
Importera befintliga resurser till lagringsplatsen Anger om du vill importera befintliga datafabriksresurser från UX-redigeringsarbetsytan till en GitHub-lagringsplats. Markera rutan för att importera dina datafabriksresurser till den associerade Git-lagringsplatsen i JSON-format. Den här åtgärden exporterar varje resurs individuellt (det vill: de länkade tjänsterna och datauppsättningarna exporteras till separata JSON:er). När den här rutan inte är markerad importeras inte de befintliga resurserna. Markerad (standard)
Importera resurs till den här grenen Anger till vilken gren datafabriksresurserna (pipelines, datauppsättningar, länkade tjänster osv.) importeras.

Redigera lagringsplatsens inställningar

Om du behöver justera inställningarna för din konfigurerade GitHub-lagringsplats kan du välja Redigera.

Skärmbild som visar redigeringsknappen för redigering av en GitHub-lagringsplats.

Du kan uppdatera publiceringsgrenen och bestämma om du vill inaktivera publiceringsknappen från ADF-studion eller inte. Om du väljer att inaktivera publiceringsknappen från studion är publiceringsknappen nedtonad i studion. Detta hjälper till att undvika att skriva över den senaste automatiserade publiceringsdistributionen.

Skärmbild som visar en kryssruta för att inaktivera publiceringsknappen för Azure Data Factory Studio.

GitHub-organisationer

För att ansluta till en GitHub-organisation måste organisationen bevilja behörighet till Azure Data Factory. En användare med administratörsbehörighet i organisationen måste utföra stegen nedan för att tillåta att datafabriken ansluter.

Ansluta till offentliga GitHub- eller GitHub Enterprise-moln för första gången i Azure Data Factory

Om du ansluter till offentliga GitHub eller GitHub Enterprise Cloud från Azure Data Factory för första gången följer du de här stegen för att ansluta till en GitHub-organisation.

  1. I git-konfigurationsfönstret anger du organisationsnamnet i fältet GitHub-konto . En uppmaning om att logga in på GitHub visas.
  2. Logga in med dina användarautentiseringsuppgifter.
  3. Du uppmanas att auktorisera Azure Data Factory som ett program som heter AzureDataFactory. På den här skärmen visas ett alternativ för att bevilja behörighet för ADF att få åtkomst till organisationen. Om du inte ser alternativet att bevilja behörighet ber du en administratör att manuellt bevilja behörigheten via GitHub.

När du följer de här stegen kan din fabrik ansluta till både offentliga och privata lagringsplatser i din organisation. Om du inte kan ansluta kan du prova att rensa webbläsarens cacheminne och försöka igen.

Redan ansluten till offentliga GitHub eller GitHub Enterprise Cloud med ett personligt konto

Om du redan har anslutit till offentliga GitHub eller GitHub Enterprise Cloud och endast beviljat behörighet att komma åt ett personligt konto följer du stegen nedan för att bevilja behörigheter till en organisation.

  1. Gå till GitHub och öppna Inställningar.

    Öppna GitHub-inställningar

  2. Välj ansökning. På fliken Auktoriserade OAuth-appar bör du se AzureDataFactory.

    Välj OAuth-appar

  3. Välj programmet och ge programmet åtkomst till din organisation.

    Bevilja åtkomst

När du följer de här stegen kan din fabrik ansluta till både offentliga och privata lagringsplatser i din organisation.

Ansluta till GitHub Enterprise Server

Om du ansluter till GitHub Enterprise Server måste du använda en personlig åtkomsttoken för autentisering. Lär dig hur du skapar en personlig åtkomsttoken i Skapa en personlig åtkomsttoken.

Kommentar

GitHub Enterprise Server finns i din privata miljö med egen värd, så du behöver fullständig kontroll över brandväggen, nätverksprinciperna och VPN när du använder den här autentiseringen. Mer information finns i Om GitHub Enterprise Server.

Skärmbild som visar GitHub Konfigurera en lagringsplats med företagsserverfönstret.

Skärmbild som visar hur du använder autentisering med åtkomsttoken för företagsserver.

Kända GitHub-begränsningar

  • Du kan lagra skript- och datafiler på en GitHub-lagringsplats. Du måste dock ladda upp filerna manuellt till Azure Storage. En Data Factory-pipeline laddar inte automatiskt upp skript- eller datafiler som lagras på en GitHub-lagringsplats till Azure Storage.

  • GitHub Enterprise med en äldre version än 2.14.0 fungerar inte i Microsoft Edge-webbläsaren.

  • GitHub-integrering med datafabrikens verktyg för visuell redigering fungerar bara i den allmänt tillgängliga versionen av Data Factory.

Ansluta till Azure DevOps Server 2022

Om du ansluter till Azure DevOps Server 2022 måste du använda en personlig åtkomsttoken för autentisering. Lär dig hur du skapar en personlig åtkomsttoken här.

Anslut till lokala Azure DevOps genom att tillhandahålla och Azure DevOps Server URLAzure DevOps Project Collection

Skärmbild som visar hur ADO konfigurerar en lagringsplats med hjälp av servern.

Ange token med åtkomstomfång som läs/skriv för kod.

Skärmbild som visar ADO-konfigurera åtkomsttoken.

Versionskontroll

Med versionskontrollsystem (kallas även källkontroll) kan utvecklare samarbeta om kod och spåra ändringar som görs i kodbasen. Källkontroll är ett viktigt verktyg för projekt med flera utvecklare.

Skapa funktionsgrenar

Varje Azure Repos Git-lagringsplats som är associerad med en datafabrik har en samarbetsgren. (main är standardgrenen för samarbete). Användare kan också skapa funktionsgrenar genom att klicka på + Ny gren i listrutan gren.

Skapa en ny gren

När det nya grenfönstret visas anger du namnet på funktionsgrenen och väljer en gren som du vill basera arbetet på.

Skärmbild som visar hur du skapar en gren baserat på den privata grenen.

När du är redo att sammanfoga ändringarna från funktionsgrenen till din samarbetsgren klickar du på listrutan för grenen och väljer Skapa pull-begäran. Den här åtgärden tar dig till Azure Repos Git där du kan skapa pull-begäranden, göra kodgranskningar och sammanfoga ändringar i din samarbetsgren. (main är standardvärdet). Du kan bara publicera till Data Factory-tjänsten från din samarbetsgren.

Skapa en ny pull-begäran

Konfigurera publiceringsinställningar

Som standard genererar datafabriken Resource Manager-mallarna för den publicerade fabriken och sparar dem i en gren med namnet adf_publish. Om du vill konfigurera en anpassad publiceringsgren lägger du till en publish_config.json fil i rotmappen i samarbetsgrenen. När du publicerar läser ADF den här filen, söker efter fältet publishBranchoch sparar alla Resource Manager-mallar på den angivna platsen. Om grenen inte finns skapar datafabriken den automatiskt. Ett exempel på hur den här filen ser ut finns nedan:

{
    "publishBranch": "factory/adf_publish"
}

Azure Data Factory kan bara ha en publiceringsgren i taget. När du anger en ny publiceringsgren tar Data Factory inte bort den tidigare publiceringsgrenen. Om du vill ta bort föregående publiceringsgren tar du bort den manuellt.

Kommentar

Data Factory läser publish_config.json bara filen när den läser in fabriken. Om du redan har läst in fabriken i portalen uppdaterar du webbläsaren så att ändringarna börjar gälla.

Publicera kodändringar

När du har sammanfogat ändringar i samarbetsgrenen (main är standard) klickar du på Publicera för att manuellt publicera dina kodändringar i huvudgrenen till Data Factory-tjänsten.

Publicera ändringar i Data Factory-tjänsten

En sidoruta öppnas där du bekräftar att publiceringsgrenen och väntande ändringar är korrekta. När du har verifierat ändringarna klickar du på OK för att bekräfta publiceringen.

Bekräfta rätt publiceringsgren

Viktigt!

Huvudgrenen är inte representativ för vad som distribueras i Data Factory-tjänsten. Huvudgrenen måste publiceras manuellt till Data Factory-tjänsten.

Metodtips för Git-integrering

Behörigheter

Vanligtvis vill du inte att alla teammedlemmar ska ha behörighet att uppdatera Data Factory. Följande behörighetsinställningar rekommenderas:

  • Alla teammedlemmar bör ha läsbehörighet till Data Factory.
  • Endast en utvald uppsättning personer ska tillåtas att publicera till Data Factory. För att göra det måste de ha rollen Data Factory-deltagare i resursgruppen som innehåller Data Factory. Mer information om behörigheter finns i Roller och behörigheter för Azure Data Factory.

Vi rekommenderar att du inte tillåter direkta incheckningar till samarbetsgrenen. Den här begränsningen kan hjälpa till att förhindra buggar eftersom varje incheckning går igenom en granskningsprocess för pull-begäran som beskrivs i Skapa funktionsgrenar.

Använda lösenord från Azure Key Vault

Vi rekommenderar att du använder Azure Key Vault för att lagra alla anslutningssträng eller lösenord eller hanterad identitetsautentisering för Länkade Data Factory-tjänster. Av säkerhetsskäl lagrar datafabriken inte hemligheter i Git. Ändringar av länkade tjänster som innehåller hemligheter, till exempel lösenord, publiceras omedelbart till Azure Data Factory-tjänsten.

Genom att använda Key Vault- eller MSI-autentisering blir det också enklare att integrera och distribuera kontinuerligt eftersom du inte behöver ange dessa hemligheter under distributionen av Resource Manager-mallen.

Felsöka Git-integrering

Inaktuell publiceringsgren

Nedan visas några exempel på situationer som kan orsaka en inaktuell publiceringsgren:

  • En användare har flera grenar. I en funktionsgren tog de bort en länkad tjänst som inte är AKV-associerad (icke-AKV-länkade tjänster publiceras omedelbart oavsett om de finns i Git eller inte) och sammanfogade aldrig funktionsgrenen i samarbetsgrenen.
  • En användare ändrade datafabriken med hjälp av SDK eller PowerShell
  • En användare flyttade alla resurser till en ny gren och försökte publicera för första gången. Länkade tjänster bör skapas manuellt när du importerar resurser.
  • En användare laddar upp en icke-AKV-länkad tjänst eller en Integration Runtime JSON manuellt. De refererar till resursen från en annan resurs, till exempel en datauppsättning, länkad tjänst eller pipeline. En icke-AKV-länkad tjänst som skapas via användargränssnittet publiceras omedelbart eftersom autentiseringsuppgifterna måste krypteras. Om du laddar upp en datauppsättning som refererar till den länkade tjänsten och försöker publicera tillåter användargränssnittet den eftersom den finns i git-miljön. Den avvisas vid publiceringstillfället eftersom den inte finns i datafabrikstjänsten.

Om publiceringsgrenen inte är synkroniserad med huvudgrenen och innehåller inaktuella resurser trots en publicering nyligen kan du använda någon av lösningarna nedan:

Alternativ 1: Använd funktionen Skriv över liveläge

Den publicerar eller skriver över koden från din samarbetsgren till liveläge. Den betraktar koden på lagringsplatsen som källan till sanningen.

Kodflöde: Samarbetsgren –> liveläge

framtvinga publiceringskod från samarbetsgrenen

Alternativ 2: Koppla från och återansluta Git-lagringsplats

Den importerar koden från liveläge till samarbetsgrenen. Den betraktar koden i liveläge som sanningskälla.

Kodflöde: Live-läge –> samarbetsgren

  1. Ta bort din aktuella Git-lagringsplats
  2. Konfigurera om Git med samma inställningar, men kontrollera att Importera befintliga Data Factory-resurser till lagringsplatsen är markerat och välj Samarbetsgren (samma gren)
  3. Skapa en pull-begäran för att sammanslå ändringarna till samarbetsgrenen.

Kommentar

Det är bara nödvändigt att skapa och slå samman en pull-begäran om du arbetar på en lagringsplats som inte tillåter direkta incheckningar. I de flesta organisationer kräver inlämningar till lagringsplatsen granskning innan sammanslagning, så bästa praxis är vanligtvis att använda den här metoden. Men i vissa fall krävs ingen granskning, i vilket fall det inte är nödvändigt att skapa och slå samman en pull-begäran, men ändringar kan checkas in direkt till samarbetsgrenen.

Välj någon av metoderna efter behov.

Alla resurser visas som nya vid publicering

När du publicerar kan alla resurser visas som nya även om de har publicerats tidigare. Detta kan inträffa om egenskapen lastCommitId återställs på fabrikens repoConfiguration-egenskap , antingen genom att distribuera om en ARM-fabriksmall eller uppdatera egenskapen factory repoConfiguration via PowerShell eller REST-API:et. Om du fortsätter att publicera resurserna kan du lösa problemet, men för att förhindra att det inträffar igen bör du undvika att uppdatera egenskapen factory repoConfiguration .

Växla till en annan Git-lagringsplats

Om du vill växla till en annan Git-lagringsplats går du till Git-konfigurationssidan i hanteringshubben under Källkontroll. Välj Koppla från.

Git-ikon

Ange namnet på datafabriken och klicka på bekräfta för att ta bort Git-lagringsplatsen som är associerad med datafabriken.

Ta bort associationen med den aktuella Git-lagringsplatsen

När du har ta bort associationen med den aktuella lagringsplatsen kan du konfigurera Dina Git-inställningar för att använda en annan lagringsplats och sedan importera befintliga Data Factory-resurser till den nya lagringsplatsen.

Viktigt!

Om du tar bort Git-konfigurationen från en datafabrik tas inget bort från lagringsplatsen. Fabriken innehåller alla publicerade resurser. Du kan fortsätta att redigera fabriken direkt mot tjänsten.