Utilisez Visual Studio Code avec Databricks Connect pour Python
Remarque
Cet article présente Databricks Connect pour Databricks Runtime 13.3 LTS et les versions ultérieures.
Cet article explique comment utiliser Databricks Connect pour Python avec Visual Studio Code. Databricks Connect vous permet de connecter des environnements de développement intégré (IDE) populaires, des serveurs notebook et autres applications personnalisées aux clusters Azure Databricks. Consultez Qu’est-ce que Databricks Connect ?. Pour obtenir la version Scala de cet article, consultez Utiliser Visual Studio Code avec Databricks Connect pour Scala.
Remarque
Avant de commencer à utiliser Databricks Connect, vous devez configurer le client Databricks Connect.
Conseil
L’extension Databricks pour Visual Studio Code offre déjà une prise en charge intégrée de Databricks Connect pour Databricks Runtime 13.3 LTS et ultérieur. Consultez Déboguer le code à l’aide de Databricks Connect pour l’extension Databricks pour Visual Studio Code.
Pour utiliser Databricks Connect avec Visual Studio Code et Python, suivez ces instructions.
Démarrez Visual Studio Code.
Ouvrez le dossier qui contient votre environnement virtuel Python (Fichier > Ouvrir le dossier).
Dans le terminal Visual Studio Code (Afficher > Terminal), activez l’environnement virtuel.
Définissez l’interpréteur Python actuel comme l’interpréteur de référence pour l’environnement virtuel :
- Dans la palette de commandes (Afficher > Palette de commandes), tapez
Python: Select Interpreter
et appuyez sur Entrée. - Sélectionnez le chemin d’accès à l’interpréteur Python référencé à partir de l’environnement virtuel.
- Dans la palette de commandes (Afficher > Palette de commandes), tapez
Ajoutez au dossier un fichier de code Python (
.py
) qui contient l’exemple de code ou votre propre code. Si vous utilisez votre propre code, vous devez au moins initialiserDatabricksSession
, comme indiqué dans l’exemple de code.Pour exécuter le code, cliquez sur Exécuter > Exécuter sans débogage dans le menu principal. Tout le code Python s'exécute localement, tandis que tout le code PySpark impliquant des opérations DataFrame s'exécute sur le cluster dans l'espace de travail Azure Databricks distant et les réponses d'exécution sont renvoyées à l'appelant local.
Pour déboguer le code :
- Une fois le fichier de code Python ouvert, définissez tous les points d’arrêt où vous voulez que votre code fasse une pause pendant l’exécution.
- Cliquez sur l’icône Exécuter et déboguer dans la barre latérale, ou cliquez sur Afficher > Exécuter dans le menu principal.
- Dans la vue Exécuter et déboguer, cliquez sur le bouton Exécuter et déboguer.
- Suivez les instructions à l’écran pour commencer à exécuter et déboguer le code.
Tout le code Python est débogué localement, alors que l’ensemble du code PySpark continue de s’exécuter sur le cluster dans l’espace de travail Azure Databricks distant. Le code principal du moteur Spark ne peut pas être débogué directement à partir du client.
Pour obtenir des instructions plus spécifiques sur l’exécution et le débogage, consultez Configurer et exécuter le débogueur et Débogage de Python dans VS Code.