Broncodebeheer en implementatie van notebook
In dit artikel wordt uitgelegd hoe Git-integratie- en implementatiepijplijnen werken voor notebooks in Microsoft Fabric. Meer informatie over het instellen van een verbinding met uw opslagplaats, het beheren van uw notebooks en het implementeren ervan in verschillende omgevingen.
Git-integratie voor notebooks
Fabric-notebooks bieden Git-integratie voor broncodebeheer met Azure DevOps. Met Git-integratie kunt u een back-up maken van uw notebook en uw notebook versien, naar behoefte terugkeren naar eerdere fasen, samenwerken of alleen werken met behulp van Git-vertakkingen en de levenscyclus van uw notebookinhoud volledig beheren in Fabric.
Notitie
Vanaf oktober 2024 ondersteunt Git-integratie van Notebook de toewijzingsrelatie van de gekoppelde omgeving bij het synchroniseren met een nieuwe werkruimte. Dit betekent dat wanneer u het notebook en de gekoppelde omgeving samen met git-opslagplaats doorvoert en synchroniseert met een andere werkruimte, het zojuist gegenereerde notebook en de nieuwe omgeving aan elkaar zijn gebonden. Deze upgrade heeft invloed op bestaande notebooks en afhankelijke omgevingen die zijn geversieerd in Git. De fysieke id van de gekoppelde omgeving in de inhoud van de notitieblokmetagegevens wordt vervangen door een logische id. De wijziging wordt doorgevoerd in de diff-weergave.
Een verbinding instellen
Vanuit uw werkruimte-instellingen kunt u eenvoudig een verbinding met uw opslagplaats instellen om wijzigingen door te voeren en te synchroniseren. Zie Aan de slag met Git-integratie om de verbinding in te stellen. Nadat u verbinding hebt gemaakt, worden uw items, inclusief notitieblokken, weergegeven in het configuratiescherm Bron .
Nadat u de notebookexemplaren hebt doorgevoerd in de Git-opslagplaats, ziet u de mapstructuur van het notitieblok in de opslagplaats.
U kunt nu toekomstige bewerkingen uitvoeren, zoals pull-aanvraag maken.
Notitieblokweergave in Git
De volgende afbeelding is een voorbeeld van de bestandsstructuur van elk notitieblokitem in de opslagplaats:
Wanneer u het notebook-item doorvoert in de Git-opslagplaats, wordt de notebookcode geconverteerd naar een broncode-indeling in plaats van een standaard .ipynb-bestand. Een PySpark-notebook wordt bijvoorbeeld geconverteerd naar een notebook-content.py-bestand. Met deze aanpak kunt u eenvoudiger codebeoordelingen uitvoeren met behulp van ingebouwde diff-functies.
In het bestand met de inhoudsbron van het item blijven metagegevens (inclusief de standaardomgeving lakehouse en gekoppelde omgeving) markdown-cellen en codecellen behouden en onderscheiden. Deze benadering ondersteunt een nauwkeurig herstel wanneer u terug synchroniseert met een Infrastructuurwerkruimte.
Uitvoer van notebookcellen wordt niet opgenomen bij het synchroniseren met Git.
Notitie
- Op dit moment worden bestanden in Notebook-resources niet doorgevoerd in de opslagplaats. Het doorvoeren van deze bestanden wordt ondersteund in een toekomstige release.
- U wordt aangeraden de notebooks en hun afhankelijke omgeving in dezelfde werkruimte te beheren en Git te gebruiken voor versiebeheer, zowel notebook- als omgevingsitems . Het Git-systeem verwerkt de toewijzingsrelatie bij het synchroniseren van het notebook en de gekoppelde omgeving aan nieuwe werkruimten.
- De standaard lakehouse-id blijft behouden in het notebook wanneer u van de opslagplaats naar een Infrastructuurwerkruimte synchroniseert. Als u een notitieblok doorvoert met het standaard lakehouse, moet u handmatig verwijzen naar een nieuw lakehouse-item. Zie De Git-integratie van Lakehouse voor meer informatie.
Notebook in implementatiepijplijnen
U kunt ook de implementatiepijplijn gebruiken om uw notebookcode in verschillende omgevingen te implementeren, zoals ontwikkeling, test en productie. Met deze functie kunt u uw ontwikkelingsproces stroomlijnen, kwaliteit en consistentie garanderen en handmatige fouten verminderen met lichtgewicht bewerkingen met weinig code. U kunt ook implementatieregels gebruiken om het gedrag van uw notebooks aan te passen wanneer ze worden geïmplementeerd, zoals het wijzigen van het standaard lakehouse van een notebook.
Notitie
- U gebruikt nu het nieuwe ontwerp van de implementatiepijplijn. De oude gebruikersinterface kan worden geopend door 'Nieuwe implementatiepijplijn' uit te schakelen.
- Vanaf oktober biedt Fabric-notebook ondersteuning voor functie voor automatische binding waarmee de standaard lakehouse en gekoppelde omgeving in dezelfde werkruimte worden gekoppeld wanneer deze in de volgende fase wordt geïmplementeerd. De wijziging heeft gevolgen voor bestaande notebooks in de implementatiepijplijn.
- De standaardomgeving lakehouse en gekoppelde omgeving (wanneer alle afhankelijke items zich in dezelfde werkruimte bevinden) worden vervangen door nieuw gegenereerde items in de doelwerkruimte, wordt de wijziging van de metagegevens van het notitieblok gemarkeerd in de diff-weergave in de volgende implementatieronde.
- U kunt implementatieregels instellen voor standaard lakehouse om het automatisch gebonden lakehouse te overschrijven.
- Bekend probleem: de status van geblokkeerde cellen in het notebook gaat verloren tijdens de implementatie. We werken momenteel aan gerelateerde taken.
Gebruik de volgende stappen om uw notebookimplementatie te voltooien met behulp van de implementatiepijplijn.
Maak een nieuwe implementatiepijplijn of open een bestaande implementatiepijplijn. (Zie voor meer informatie Aan de slag met implementatiepijplijnen.)
Wijs werkruimten toe aan verschillende fasen op basis van uw implementatiedoelen.
Items selecteren, weergeven en vergelijken, inclusief notitieblokken tussen verschillende fasen, zoals wordt weergegeven in het volgende voorbeeld. De gemarkeerde badge die het aantal gewijzigde items aangeeft tussen de vorige fase en de huidige fase.
Selecteer Implementeren om uw notebooks te implementeren in de fasen Ontwikkeling, Testen en Productie.
(Optioneel.) U kunt implementatieregels selecteren om implementatieregels te maken voor een implementatieproces. Vermelding van implementatieregels bevindt zich in de doelfase voor een implementatieproces.
Fabric ondersteunt het parameteriseren van het standaard lakehouse voor elk notebookexemplaren bij het implementeren met implementatieregels. Er zijn drie opties beschikbaar om het standaard lakehouse van het doel op te geven: Hetzelfde als bron lakehouse, N/A (geen standaard lakehouse) en andere lakehouses.
U kunt beveiligde gegevensisolatie bereiken door deze regel in te stellen. Het standaard lakehouse van uw notitieblok wordt vervangen door het notitieblok dat u tijdens de implementatie hebt opgegeven als doel.
Notitie
Wanneer u standaard lakehouse instelt in implementatieregels, moet de Lakehouse-id zijn. U kunt de lakehouse-id ophalen via de koppeling naar de item-URL. De implementatieregels hebben een hogere prioriteit dan automatisch binden. Het automatisch gebonden lakehouse wordt overschreven wanneer er een implementatieregel is geconfigureerd.
Bewaak de implementatiestatus vanuit de implementatiegeschiedenis.