Che cos’è l’estensione Databricks per Visual Studio Code?
L'estensione Databricks per Visual Studio Code consente di connettersi alle aree di lavoro remote di Azure Databricks dall'ambiente di sviluppo integrato (IDE) di Visual Studio Code in esecuzione nel computer di sviluppo locale. È quindi possibile:
- Definire, distribuire ed eseguire i Databricks Asset Bundles per applicare i modelli CI/CD e le procedure consigliate ai processi di Azure Databricks, alle pipeline delle Delta Live Tables e agli MLOps Stacks usando l’UI di Visual Studio Code. Vedere Che cosa sono i bundle di asset di Databricks? e le funzionalità di estensione bundle di asset di Databricks.
- Eseguire file di codice Python locali da Visual Studio Code nei cluster Azure Databricks nelle aree di lavoro remote. Si veda Eseguire un file Python in un cluster
- Eseguire file di codice Python locali (
.py
) e Python, R, Scala e notebook SQL (.py
,.ipynb
,.r
,.scala
e.sql
) da Visual Studio Code come processi di Azure Databricks nelle aree di lavoro remote. Si veda Eseguire un file Python come processo. - Impostare e configurare l'ambiente di debugging e Databricks Connect usando una lista di controllo semplice che attiva le finestre di dialogo della selezione. Si veda Eseguire il debug del codice con Databricks Connect per l'estensione Databricks per Visual Studio Code.
- Eseguire il debug delle celle dei notebook per cella in Visual Studio Code con Databricks Connect. Si veda Eseguire ed effettuare il debug delle celle del notebook con Databricks Connect utilizzando l'estensione Databricks per Visual Studio Code.
- Sincronizzare il codice locale sviluppato in Visual Studio Code con il codice nelle aree di lavoro remote. Consulta Sincronizza la cartella dell'area di lavoro con Databricks
Nota
L'estensione Databricks per Visual Studio Code supporta l'esecuzione di notebook R, Scala e SQL come processi automatizzati, ma non offre supporto più approfondito per questi linguaggi all'interno di Visual Studio Code.
Inizia
Per iniziare a usare l'estensione Databricks per Visual Studio Code:
- Installare l'estensione.
- Creare un nuovo progetto databricks o convertire un progetto di Visual Studio Code esistente.
- Configurare in modo semplice il progetto usando l'interfaccia utente dell'estensione Databricks.
- Eseguire codice Python come parte dell'esercitazione sull'estensione.
- Eseguire il debug del codice usando l'integrazione di Databricks Connect.
- Test del codice utilizzando
pytest
. Si veda Eseguire test con pytest usando l'estensione Databricks per Visual Studio Code.
Creare un nuovo progetto databricks
Dopo aver installato l'estensione, è possibile creare un nuovo progetto Databricks usando l'estensione Databricks per Visual Studio Code:
- Avviare Visual Studio Code.
- Fare clic sull'icona di Databricks nella barra laterale di Visual Studio Code per aprire l'estensione.
- Fare clic su Crea un nuovo progetto.
- Nel riquadro comandi , selezionare un host e un metodo di autenticazione per il progetto. Vedere Configurare l'autorizzazione per l'estensione Databricks per Visual Studio Code.
- In Fornire il percorso di una cartella in cui desideri che il nuovo progetto sia, immetti il percorso di una cartella sul tuo computer di sviluppo locale in cui vuoi creare il progetto, oppure fai clic su Apri finestra di dialogo per la selezione delle cartelle e seleziona il percorso della cartella del progetto.
- Per Modello da usare nella visualizzazione di inizializzazione del progetto Databricks, usare le frecce su e giù per selezionare un modello di progetto e quindi premere INVIO. Per informazioni sui modelli di progetto bundle, si veda Modelli di progetto bundle di asset di Databricks.
- Digitare un nome univoco per questo progetto o lasciare il nome predefinito
my_project
, poi premere INVIO. - Scegli se aggiungere al progetto un notebook stub (esempio), uno stub (esempio) della pipeline di tabelle live Delta, un pacchetto Python stub (esempio), o qualsiasi combinazione di questi stub (esempi).
- Premere un tasto qualsiasi per chiudere la scheda dell’editor Init del progetto Databricks.
- Per Selezionare il progetto da aprire, scegliere il progetto appena creato.
Aprire un progetto esistente di bundle di asset di Databricks
Un progetto di bundle di asset di Databricks include un file databricks.yml
nella cartella radice del progetto. Vedere Configurazione del bundle di asset di Databricks. Se vuoi usare l'estensione con un progetto Bundle di Asset di Databricks esistente:
Avviare Visual Studio Code. Dal menu principale fare clic su File>Apri cartella e passare alla directory che contiene il progetto bundle.
Fare clic sull'icona Databricks nella barra laterale di Visual Studio Code per aprire e iniziare a usare le funzionalità dell'estensione.
Se l'estensione Databricks per Visual Studio Code individua più di un progetto Di bundle di asset di Databricks nella cartella corrente, consente di scegliere di aprire un progetto o di creare un file di configurazione del progetto nella cartella radice.
- Se hai scelto un progetto, nella Palette comandi , seleziona il tuo progetto esistente di Bundle di Asset di Databricks.
- Se si crea una configurazione nella cartella radice, tale cartella diventa un progetto bundle.
Selezionare un host e un metodo di autenticazione per il progetto. Vedere Configurare l'autorizzazione per l'estensione Databricks per Visual Studio Code.
Nota
Se si apre un progetto creato usando l'estensione Databricks per Visual Studio Code v1, la migrazione viene tentata automaticamente usando l'autenticazione e la configurazione dell'area di lavoro esistenti del progetto. Il pulsante di migrazione è disponibile solo se la migrazione automatica ha esito negativo.
Passare da un progetto databricks all'altro
L'estensione Databricks per Visual Studio Code consente di disporre di più progetti Databricks all'interno dell'area di lavoro di Visual Studio Code e di passare facilmente dall’uno all’altro. Con il progetto multi-bundle aperto nell'area di lavoro di Visual Studio Code:
Fare clic sull'icona di Databricks nella barra laterale di Visual Studio Code per aprire l'estensione.
Fare clic su Cartella locale per selezionare il progetto che l'estensione deve usare.
Nota
Le azioni di esecuzione sono disponibili solo per i file nel bundle attivo.
Convertire un progetto in un progetto Databricks
Se si dispone di un progetto esistente che si vuole convertire in un progetto Databricks:
- Avviare Visual Studio Code. Dal menu principale fare clic su File>Apri cartella e passare al progetto per aprirlo.
- Fare clic sull'icona di Databricks nella barra laterale di Visual Studio Code per aprire l'estensione.
- Fare clic su Crea configurazione.
- Nel riquadro comandi , selezionare un host e un metodo di autenticazione per il progetto. Vedere Configurare l'autorizzazione per l'estensione Databricks per Visual Studio Code.