Co je rozšíření Databricks pro Visual Studio Code?
Rozšíření Databricks pro Visual Studio Code umožňuje připojit se ke vzdáleným pracovním prostorům Azure Databricks z integrovaného vývojového prostředí (IDE) editoru Visual Studio Code spuštěného na místním vývojovém počítači. Pak můžete:
- Definujte, nasaďte a spusťte sady prostředků Databricks, abyste mohli používat vzory CI/CD a osvědčené postupy pro úlohy Azure Databricks, kanály Delta Live Tables a zásobníky MLOps pomocí uživatelského rozhraní editoru Visual Studio Code. Podívejte se , co jsou sady prostředků Databricks? a funkce rozšíření Sady prostředků Databricks.
- Spouštění místních souborů kódu Pythonu ze sady Visual Studio Code v clusterech Azure Databricks ve vzdálených pracovních prostorech Viz Spuštění souboru Pythonu v clusteru
- Spusťte místní soubory kódu Pythonu (
.py
) a Python, R, Scala a poznámkové bloky SQL (.py
,.ipynb
,.r
,.scala
a.sql
) ze sady Visual Studio Code jako úlohy Azure Databricks ve vzdálených pracovních prostorech. Viz Spuštění souboru Pythonu jako úlohy. - Nastavte a nakonfigurujte ladicí prostředí a Databricks Connect pomocí jednoduchého kontrolního seznamu, který aktivuje dialogy výběru. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.
- Ladit buňku poznámkových bloků podle buňky v editoru Visual Studio Code pomocí databricks Connect Viz Spuštění a ladění buněk poznámkového bloku pomocí Databricks Connect pomocí rozšíření Databricks pro Visual Studio Code.
- Synchronizujte místní kód, který vyvíjíte v editoru Visual Studio Code, s kódem ve vzdálených pracovních prostorech. Podívejte se na synchronizaci složky pracovního prostoru s Databricks
Poznámka:
Rozšíření Databricks pro Visual Studio Code podporuje spouštění poznámkových bloků R, Scala a SQL jako automatizovaných úloh, ale neposkytuje žádnou hlubší podporu pro tyto jazyky v editoru Visual Studio Code.
Začít
Začínáme používat rozšíření Databricks pro Visual Studio Code:
- Nainstalujete rozšíření.
- Vytvořit nový projekt Databricks nebo převést existující projekt ve Visual Studio Code.
- Snadno nakonfigurujte projekt pomocí uživatelského rozhraní rozšíření Databricks.
- V rámci kurzu rozšíření spusťte nějaký kód Pythonu.
- Ladění kódu pomocí integrace Databricks Connect
- Otestujte kód pomocí
pytest
. Viz Spuštění testů pomocí pytestu pomocí rozšíření Databricks pro Visual Studio Code.
Vytvoření nového projektu Databricks
Po instalaci rozšíření můžete vytvořit nový projekt Databricks pomocí rozšíření Databricks pro Visual Studio Code:
- Spusťte editor Visual Studio Code.
- Kliknutím na ikonu Databricks na bočním panelu editoru Visual Studio Code otevřete rozšíření.
- Klikněte na Vytvořit nový projekt.
- V paletě příkazůvyberte pro projekt metodu hostitele a ověřování. Viz Nastavení autorizace pro rozšíření Databricks pro Visual Studio Code.
- V Zadejte cestu ke složce, do které chcete, aby byl nový projekt, zadejte cestu ke složce na místním vývojovém počítači, kam chcete projekt vytvořit, nebo klikněte na dialogové okno Otevřít výběr složky a vyberte cestu ke složce projektu.
- Pokud chcete v zobrazení inicializace projektu Databricks použít šablonu , pomocí šipek nahoru a dolů vyberte šablonu projektu a poté stiskněte klávesu Enter. Informace o šablonách projektů sady prostředků najdete v tématu Šablony projektů Sady prostředků Databricks.
-
Zadejte jedinečný název pro tento projekt pro projekt nebo ponechte výchozí název
my_project
projektu a stiskněte Enter. - Zvolte, jestli chcete do projektu přidat zástupný (ukázkový) poznámkový blok, zástupnou (ukázkovou) pipeline Delta Live Tables nebo zástupný (ukázkový) balíček Pythonu, případně libovolnou kombinaci těchto zástupných prvků (ukázek).
- Stisknutím libovolné klávesy zavřete kartu editoru inicializačního editoru projektu Databricks.
- V Vyberte projekt, který chcete otevřít, zvolte projekt, který jste právě vytvořili.
Otevření existujícího projektu Sady prostředků Databricks
Projekt Sady prostředků Databricks obsahuje databricks.yml
soubor v kořenové složce projektu. Viz konfigurace sady prostředků Databricks. Pokud chcete použít rozšíření s existujícím projektem Databricks Asset Bundles:
Spusťte editor Visual Studio Code. V hlavní nabídce klikněte na >Soubor otevřít složku a přejděte do adresáře, který obsahuje projekt sady.
Kliknutím na ikonu Databricks na bočním panelu editoru Visual Studio Code otevřete a začněte používat funkce rozšíření.
Pokud rozšíření Databricks pro Visual Studio Code zjistí v aktuální složce více než jeden projekt Sady prostředků Databricks, můžete se rozhodnout otevřít projekt nebo vytvořit konfigurační soubor projektu v kořenové složce.
- Pokud jste vybrali projekt, v příkazové paletě vyberte svůj stávající projekt Databricks Asset Bundles.
- Pokud vytvoříte konfiguraci v kořenové složce, stane se tato složka projektem sady.
Vyberte pro projekt metodu hostitele a ověřování. Viz Nastavení autorizace pro rozšíření Databricks pro Visual Studio Code.
Poznámka:
Pokud otevřete projekt vytvořený pomocí rozšíření Databricks pro Visual Studio Code v1, provede se migrace automaticky pomocí existujícího ověřování a konfigurace pracovního prostoru projektu. Tlačítko migrace je dostupné jenom v případě, že automatická migrace selže.
Přepínání mezi projekty Databricks
Rozšíření Databricks pro Visual Studio Code umožňuje mít v pracovním prostoru editoru Visual Studio Code několik projektů Databricks a snadno mezi nimi přepínat. Otevřete svůj projekt s více sadami v pracovním prostoru editoru Visual Studio Code:
Kliknutím na ikonu Databricks na bočním panelu editoru Visual Studio Code otevřete rozšíření.
Kliknutím na Místní složka vyberte projekt, který bude rozšíření používat.
Poznámka:
Akce spuštění jsou k dispozici pouze pro soubory v aktivní sadě.
Převod projektu na projekt Databricks
Pokud máte existující projekt, který chcete převést na projekt Databricks:
- Spusťte editor Visual Studio Code. V hlavní nabídce klikněte na >Soubor Otevřít složku a přejděte do projektu a otevřete ho.
- Kliknutím na ikonu Databricks na bočním panelu editoru Visual Studio Code otevřete rozšíření.
- Klikněte na Vytvořit konfiguraci.
- V paletě příkazůvyberte pro projekt metodu hostitele a ověřování. Viz Nastavení autorizace pro rozšíření Databricks pro Visual Studio Code.