Uw Databricks-project configureren met behulp van de Databricks-extensie voor Visual Studio Code
De Databricks-extensie voor Visual Studio Code biedt een Configuratie weergave in het extensievenster waarmee u eenvoudig instellingen voor uw Databricks-project kunt configureren en update. Deze functies omvatten een implementatiekiezer voor de doelwerkruimte, eenvoudige configuratie van verificatie en berekening, werkruimtemap syncen eenvoudige stappen voor het activeren van de virtuele Python-omgeving die nodig is voor foutopsporing.
De configuratieweergave in de Databricks-extensie voor Visual Studio Code is beschikbaar zodra u een project hebt gemaakt of gemigreerd naar een Databricks-project. Zie Een nieuw Databricks-project maken.
Notitie
Eerdere versies van de Databricks-extensie voor Visual Studio Code definieerden configuratie-instellingen in een JSON-projectbestand, en werden zowel die instellingen als de omgevingsvariabelen als set weergegeven in de terminal. In de releaseversie vindt u de project- en omgevingsconfiguratie in de databricks.yml
en databricks.env
bestanden.
Als uw project een Databricks Asset Bundle is, biedt de databricks-uitbreidingsinterface ook een bundelresourceverkenner en een weergave bundelvariabelen om uw bundelresources en -variabelen te beheren. Zie de extensiefuncties van Databricks Asset Bundles.
De doelimplementatiewerkruimte wijzigen
Als u wilt select of het implementatiedoel voor uw Databricks-project wilt wijzigen (bijvoorbeeld om over te schakelen van een dev
-doel naar een prod
-doel):
Klik in de configuratieweergave van het Databricks-uitbreidingspaneel op het tandwielpictogram (Select een Databricks Asset Bundle-doel) geassocieerd met Target.
select het gewenste implementatiedoel in het opdrachtpalet.
Zodra een doel is geconfigureerd, wordt de host- en implementatiemodus weergegeven. Zie de implementatiemodi voor Databricks Asset Bundles voor informatie over de implementatiemodi van Databricks Asset Bundle.
De werkruimtehost kan worden gewijzigd door de doelinstelling workspace
te wijzigen in het databricks.yml
configuratiebestand dat aan het project is gekoppeld. Zie doelen.
Notitie
De volgende Databricks-extensie voor Visual Studio Code-functies is alleen beschikbaar wanneer de doelimplementatiemodus wordt ontwikkeld:
- Het gekoppelde ontwikkelcluster gebruiken voor bundeltaken
- mapbestanden voor Sync werkruimte
- een interactief ontwikkelcluster Select
Het Databricks-profiel voor het project configureren
Wanneer u een Databricks-project maakt of een project migreert naar een Databricks-project, configureert u een profiel met verificatie-instellingen die worden gebruikt om verbinding te maken met Databricks. Als u het gebruikte verificatieprofiel wilt wijzigen, klikt u in de configuratieweergave op het tandwielpictogram dat is gekoppeld aan AuthType.
Select een cluster voor het uitvoeren van code en taken
Met de Databricks-extensie voor Visual Studio Code kunt u een bestaand Azure Databricks-cluster select of een nieuw Azure Databricks-cluster maken voor het uitvoeren van uw code en taken. Zodra u verbinding hebt gemaakt met compute, worden de id van het cluster, de Databricks Runtime-versie, de maker, de status en de toegangsmodus weergegeven. U kunt het cluster ook starten en stoppen en rechtstreeks naar de paginadetails van het cluster navigeren.
Tip
Als u niet wilt wachten totdat het taakcluster is opgestart, schakelt u het cluster Taken overschrijven in de bundel net onder de clusterselectie in om het geselecteerde cluster te gebruiken voor het uitvoeren van bundeltaken in de ontwikkelingsmodus.
Een bestaand cluster gebruiken
Als u een bestaand Azure Databricks-cluster hebt dat u wilt gebruiken:
Klik in de weergave Configuration naast Clusterop Select een cluster of het tandwielpictogram (Cluster configureren).
select het cluster dat u wilt gebruiken in het opdrachtpalet.
Een nieuw cluster maken
Als u geen bestaand Azure Databricks-cluster hebt of als u een nieuw cluster wilt maken:
Klik in de configuratieweergave naast Cluster op het tandwielpictogram (Cluster configureren).
Klik in het opdrachtpalet op Nieuw cluster maken.
Wanneer u wordt gevraagd om de externe website (uw Azure Databricks-werkruimte) te openen, klikt u op Openen.
Meld u aan bij uw Azure Databricks-werkruimte als u hierom wordt gevraagd.
Volg de instructies om een cluster te maken.
Notitie
Databricks raadt u aan een persoonlijk rekencluster te maken. Hierdoor kunt u workloads onmiddellijk uitvoeren, waardoor de overhead voor rekenbeheer wordt geminimaliseerd.
Nadat het cluster is gemaakt en wordt uitgevoerd, gaat u terug naar Visual Studio Code.
Klik in de configuratieweergave naast Cluster op het tandwielpictogram (Cluster configureren).
Klik in het opdrachtenpalet op het cluster dat u wilt gebruiken.
Sync uw werkruimtemap met Databricks
U kunt sync de externe Databricks-werkmap die is gekoppeld aan uw Databricks-project openen door te klikken op het pictogram sync (Synchronisatie starten) dat is gekoppeld aan Werkruimtemap in de configuratie weergave van het Databricks-extensie deelvenster.
Notitie
De Databricks-extensie voor Visual Studio Code werkt alleen met werkruimtemappen die worden gemaakt. U kunt geen bestaande werkruimtemap in uw project gebruiken, tenzij deze is gemaakt door de extensie.
Als u naar de werkruimteweergave in Databricks wilt navigeren, klikt u op het pictogram externe koppeling (koppeling extern openen) dat is gekoppeld aan de werkruimtemap.
De extensie bepaalt de map azure Databricks-werkruimte die moet worden gebruikt op basis van de file_path
instelling in de workspace
toewijzing van de gekoppelde Databricks Asset Bundle-configuratie van het project. Zie de werkruimte.
Notitie
De Databricks-extensie voor Visual Studio Code voert slechts éénrichtingssynchronisatie van bestandswijzigingen uit uw lokale Visual Studio Code-project uit naar de gerelateerde werkruimtemap in uw externe Azure Databricks-werkruimte. De bestanden in deze map met externe werkruimten zijn bedoeld om tijdelijk te zijn. Start geen wijzigingen in deze bestanden vanuit uw externe werkruimte, omdat deze wijzigingen niet worden gesynchroniseerd naar uw lokale project.
Zie voor gebruiksgegevens over de werkruimtemap sync functie voor eerdere versies van de Databricks-extensie voor Visual Studio Code Select een werkruimtemap voor de Databricks-extensie voor Visual Studio Code.
Set uw Python-omgeving en Databricks Connect
De sectie Python-omgeving van de configuratieweergave maakt het eenvoudig instellen van uw virtuele Python-ontwikkelomgeving en de installatie van Databricks Connect mogelijk voor het uitvoeren en opsporen van fouten in code- en notebookcellen. Virtuele Python-omgevingen zorgen ervoor dat uw project compatibele versies van Python- en Python-pakketten gebruikt (in dit geval het Databricks Connect-pakket).
Ga als volgt te werk om de virtuele Python-omgeving voor uw project te configureren in de configuratieweergave van het extensievenster:
- Klik op het rode item Virtuele omgeving activeren onder Python-omgeving.
- select Venv of Conda in het Opdrachtpalet.
- Select de afhankelijkheden die u wilt installeren, indien van toepassing.
Als u omgevingen wilt wijzigen, klikt u op het tandwielpictogram (virtuele omgeving wijzigen) dat is gekoppeld aan de actieve omgeving.
Zie Debug code met databricks Connect voor de Databricks-extensie voor Visual Studio Code voor het uitvoeren en opsporen van fouten in code en notebooks in Visual Studio Code voor informatie over het installeren van Databricks Connect.