Delen via


Visual Studio Code gebruiken met Databricks Connect voor Python

Notitie

Dit artikel bevat informatie over Databricks Connect voor Databricks Runtime 13.3 LTS en hoger.

In dit artikel wordt beschreven hoe u Databricks Connect voor Python gebruikt met Visual Studio Code. Met Databricks Connect kunt u populaire IDE's, notebookservers en andere aangepaste toepassingen verbinden met Azure Databricks-clusters. Zie Wat is Databricks Connect? Zie Visual Studio Code gebruiken met Databricks Connect voor Scala voor de Scala-versie van dit artikel.

Notitie

Voordat u Databricks Connect gaat gebruiken, moet u de Databricks Connect-client instellen.

Tip

De Databricks-extensie voor Visual Studio Code heeft al ingebouwde ondersteuning voor Databricks Connect voor Databricks Runtime 13.3 LTS en hoger. Zie Code voor foutopsporing met behulp van Databricks Connect voor de Databricks-extensie voor Visual Studio Code.

Als u Databricks Connect wilt gebruiken met Visual Studio Code en Python, volgt u deze instructies.

  1. Visual Studio Code starten.

  2. Open de map die uw virtuele Python-omgeving bevat (map bestand > openen).

  3. Activeer de virtuele omgeving in de Visual Studio Code-terminal (View > Terminal).

  4. Stel de huidige Python-interpreter in als de interpreter waarnaar wordt verwezen vanuit de virtuele omgeving:

    1. Typ in het opdrachtpalet (opdrachtpalet weergeven>) Python: Select Interpreteren druk op Enter.
    2. Selecteer het pad naar de Python-interpreter waarnaar wordt verwezen vanuit de virtuele omgeving.
  5. Voeg een Python-codebestand (.py) toe aan de map dat de voorbeeldcode of uw eigen code bevat. Als u uw eigen code gebruikt, moet u minimaal initialiseren DatabricksSession zoals wordt weergegeven in de voorbeeldcode.

  6. Als u de code wilt uitvoeren, klikt u op Uitvoeren > zonder foutopsporing in het hoofdmenu. Alle Python-code wordt lokaal uitgevoerd, terwijl alle PySpark-code met betrekking tot DataFrame-bewerkingen wordt uitgevoerd op het cluster in de externe Azure Databricks-werkruimte en antwoorden worden teruggestuurd naar de lokale beller.

  7. Fouten opsporen in de code:

    1. Als het Python-codebestand is geopend, stelt u eventuele onderbrekingspunten in waar u de code wilt onderbreken tijdens het uitvoeren.
    2. Klik op het pictogram Uitvoeren en foutopsporing op de zijbalk of klik op Uitvoeren > weergeven in het hoofdmenu.
    3. Klik in de weergave Uitvoeren en foutopsporing op de knop Uitvoeren en foutopsporing.
    4. Volg de instructies op het scherm om de code uit te voeren en fouten op te sporen.

    Alle Python-code wordt lokaal opgespoord, terwijl alle PySpark-code blijft worden uitgevoerd op het cluster in de externe Azure Databricks-werkruimte. De kerncode van de Spark-engine kan niet rechtstreeks vanuit de client worden opgespoord.

Zie Het foutopsporingsprogramma en python-foutopsporing in VS Code configureren en uitvoeren voor specifiekere instructies voor uitvoeren en fouten opsporen.