Wat is de Databricks-extensie voor Visual Studio Code?
Met de Databricks-extensie voor Visual Studio Code kunt u verbinding maken met uw externe Azure Databricks-werkruimten vanuit de IDE (Integrated Development Environment) van Visual Studio Code die wordt uitgevoerd op uw lokale ontwikkelcomputer. U kunt dan:
- Definieer, implementeer en voer Databricks Asset Bundles uit om CI/CD-patronen en aanbevolen procedures toe te passen op uw Azure Databricks-taken, Delta Live Tables-pijplijnen en MLOps-stacks met behulp van de Visual Studio Code-gebruikersinterface. Zie Wat zijn databricks-assetbundels? en uitbreidingsfuncties voor Databricks Asset Bundles.
- Voer lokale Python-codebestanden uit vanuit Visual Studio Code op Azure Databricks-clusters in uw externe werkruimten. Zie Een Python-bestand uitvoeren op een cluster
- Voer lokale Python-codebestanden (
.py
) en Python-, R-, Scala- en SQL-notebooks (.py
,.ipynb
,.r
en.scala
.sql
) uit vanuit Visual Studio Code als Azure Databricks-taken in uw externe werkruimten. Zie Een Python-bestand uitvoeren als een taak. - Stel uw foutopsporingsomgeving en Databricks Connect in en configureer deze met behulp van een eenvoudige controlelijst waarmee selectiedialoogvensters worden geactiveerd. Zie Code voor foutopsporing met behulp van Databricks Connect voor de Databricks-extensie voor Visual Studio Code.
- Fouten opsporen in notebooks per cel in Visual Studio Code met Databricks Connect. Zie Notebook-cellen uitvoeren en fouten opsporen met Databricks Connect met behulp van de Databricks-extensie voor Visual Studio Code.
- Synchroniseer lokale code die u in Visual Studio Code ontwikkelt met code in uw externe werkruimten.
Notitie
De Databricks-extensie voor Visual Studio Code biedt ondersteuning voor het uitvoeren van R-, Scala- en SQL-notebooks als geautomatiseerde taken, maar biedt geen diepere ondersteuning voor deze talen in Visual Studio Code.
Aan de slag
Om aan de slag te gaan met de Databricks-extensie voor Visual Studio Code:
- Installeer de extensie.
- Maak een nieuw Databricks-project of migreer een bestaand Visual Studio Code-project .
- Configureer uw project eenvoudig met behulp van de gebruikersinterface van de Databricks-extensie.
- Voer python-code uit als onderdeel van de extensiezelfstudie.
- Fouten opsporen in uw code met behulp van de Databricks Connect-integratie.
- Test uw code met behulp van
pytest
. Zie Test uitvoeren met pytest met behulp van de Databricks-extensie voor Visual Studio Code.
Een nieuw Databricks-project maken
Zodra de extensie is geïnstalleerd, kunt u een nieuw Databricks-project maken met behulp van de Databricks-extensie voor Visual Studio Code:
- Start Visual Studio Code.
- Klik op het databricks-pictogram in de zijbalk van Visual Studio Code om de extensie te openen.
- Klik op Een nieuw Databricks-project maken.
- Selecteer in het opdrachtenpalet een host- en verificatiemethode voor het project. Zie De verificatie-instelling voor de Databricks-extensie voor Visual Studio Code.
- Geef een pad op naar een map waarin u het nieuwe project wilt weergeven, voer het pad in naar een map op uw lokale ontwikkelcomputer waar u het project wilt maken, of klik op het dialoogvenster Mapselectie openen en selecteer het pad naar de projectmap.
- Als u de sjabloon wilt gebruiken in de initialisatieweergave van het Databricks-project, gebruikt u de pijl-omhoog en pijl-omlaag om een projectsjabloon te selecteren en drukt u op Enter. Zie Databricks Asset Bundle-projectsjablonen voor informatie over bundelprojectsjablonen.
- Typ een unieke naam voor dit project voor het project of laat de standaardprojectnaam staan en
my_project
druk op Enter. - Kies of u een stub (voorbeeld)-notebook, een stub (voorbeeld) Delta Live Tables-pijplijn of een stub (voorbeeld) Python-pakket wilt toevoegen aan het project, of een combinatie van deze stubs (voorbeelden).
- Druk op een willekeurige toets om het tabblad Databricks Project Init-editor te sluiten.
- Voor Selecteer het project dat u wilt openen, kiest u het project dat u zojuist hebt gemaakt.
Een project migreren naar een Databricks-project
Als u een bestaand project hebt dat u wilt migreren naar een Databricks-project, opent u het met de Databricks-extensie voor Visual Studio Code om de migratie te starten:
- Start Visual Studio Code. Klik in het hoofdmenu op Map openen> en navigeer naar het project om het te openen.
- Klik op het databricks-pictogram in de zijbalk van Visual Studio Code om de extensie te openen.
- Klik op Migreren naar een Databricks-project.
- Selecteer in het opdrachtenpalet een host- en verificatiemethode voor het project. Zie De verificatie-instelling voor de Databricks-extensie voor Visual Studio Code.
Notitie
Als u een project opent dat is gemaakt met de Databricks-extensie voor Visual Studio Code v1, wordt de migratie automatisch uitgevoerd met behulp van de bestaande verificatie- en werkruimteconfiguratie van het project. De migratieknop is alleen beschikbaar als de automatische migratie mislukt.
Een bestaand Databricks Asset Bundles-project openen
Als de Databricks-extensie voor Visual Studio Code meer dan één Databricks Asset Bundles-project in de huidige map detecteert, kunt u met de Databricks-extensie voor Visual Studio Code kiezen welk project u wilt openen.
Notitie
Een Databricks Asset Bundles-project heeft een databricks.yml
bestand in de hoofdmap van het project. Zie de configuratie van Databricks Asset Bundle.
Start Visual Studio Code. Klik in het hoofdmenu op Map openen> en navigeer naar de map die uw bundelproject bevat.
Klik op het databricks-pictogram in de zijbalk van Visual Studio Code om de extensie te openen.
Klik op Bestaand Databricks-project openen.
Selecteer uw bestaande Databricks Asset Bundles-project in het opdrachtenpalet.
Selecteer in het opdrachtenpalet een host- en verificatiemethode voor het project. Zie De verificatie-instelling voor de Databricks-extensie voor Visual Studio Code.
Nog een Databricks-project toevoegen aan de werkruimte
Met de Databricks-extensie voor Visual Studio Code kunt u meerdere Databricks-projecten in uw Visual Studio Code-werkruimte hebben en er eenvoudig tussen kunt schakelen. Een ander project toevoegen:
Start Visual Studio Code. Klik in het hoofdmenu op Map>toevoegen aan werkruimte en navigeer naar de map die uw andere bundelproject bevat.
Klik op het databricks-pictogram in de zijbalk van Visual Studio Code om de extensie te openen.
Klik op De map Actieve werkruimte om het project te selecteren voor de extensie die u wilt gebruiken.