Partager via


Mise en réseau

Cet article présente des configurations de mise en réseau pour le déploiement et la gestion des comptes et espaces de travail Azure Databricks.

Important

À compter du 4 décembre 2024, Databricks commence à facturer les coûts réseau sur les charges de travail serverless qui se connectent aux ressources externes. La facturation sera implémentée progressivement et vous ne serez peut-être pas facturé avant le 4 décembre 2024. Vous ne serez pas facturé rétroactif pour l’utilisation avant l’activation de la facturation. Une fois la facturation activée, vous pouvez être facturé pour :

  • Connectivité privée à vos ressources via Private Link. Les frais de traitement des données pour la connectivité privée à vos ressources via Private Link sont annulés indéfiniment. Les frais par heure s’appliquent.
  • Connectivité publique à vos ressources via la passerelle NAT.
  • Les frais de transfert de données encourus, par exemple lorsque le calcul serverless et la ressource cible se trouvent dans différentes régions.

Vue d’ensemble de l’architecture Azure Databricks

Azure Databricks fonctionne à partir d’un plan de contrôle et d’un plan de calcul.

  • Le plan de contrôle comprend les services back-end qu’Azure Databricks gère dans votre compte Azure Databricks. L’application web se trouve dans le plan de contrôle.
  • Le plan de calcul est l’endroit où vos données sont traitées. Il existe deux types de plans de calcul en fonction du calcul que vous utilisez.
    • Pour les calculs Azure Databricks classiques, les ressources de calcul se trouvent dans votre abonnement Azure dans ce qu’on appelle le plan de calcul classique. Ce terme fait référence au réseau de votre abonnement Azure et à ses ressources. Les ressources de plan de calcul classique se situent dans la même région que votre espace de travail.
    • Pour les calculs serverless, les ressources de calcul serverless s’exécutent dans un plan de calcul serverless dans votre compte Azure Databricks. Les ressources du plan de calcul serverless se situent dans la même région cloud que le plan de calcul classique de votre espace de travail. Vous électionnez cette région lorsque vous créez un espace de travail.

Pour en savoir plus sur l'informatique classique et l’informatique Serverless, consultez Types d'informatique. Pour plus d’informations sur l’architecture, consultez la Vue d’ensemble de l’architecture Azure Databricks.

Sécuriser la connectivité réseau

Azure Databricks fournit un environnement de mise en réseau sécurisé par défaut, mais si votre organisation a des besoins supplémentaires, vous pouvez configurer des fonctionnalités de connectivité réseau entre les différentes connexions réseau indiquées dans le diagramme ci-dessous.

Diagramme de vue d’ensemble de la connectivité réseau

  1. Utilisateurs et applications dans Azure Databricks : vous pouvez configurer des fonctionnalités pour contrôler l’accès et fournir une connectivité privée entre les utilisateurs et leurs espaces de travail Azure Databricks. Consultez l’article Mise en réseau des utilisateurs sur Azure Databricks.
  2. Le plan de contrôle et le plan de calcul classique : les ressources de calcul classiques, telles que les clusters, sont déployées dans votre abonnement Azure et se connectent au plan de contrôle. Vous pouvez utiliser des fonctionnalités de connectivité réseau classiques pour déployer des ressources de plan de calcul classiques dans vos propres réseaux virtuels et activer la connectivité privée des clusters vers le plan de contrôle. Consultez l’article Mise en réseau du plan de calcul classique.
  3. Le plan de calcul serverless et le stockage : vous pouvez configurer des connexions privées et dédiées du calcul serverless au stockage. Consultez l’article Mise en réseau du plan de calcul serverless.

Vous pouvez configurer des fonctionnalités de mise en réseau de stockage Azure, notamment des points de terminaison privés, pour sécuriser la connexion entre le plan de calcul classique et vos ressources Azure. Consultez Accorder à votre espace de travail Azure Databricks l’accès à Azure Data Lake Storage Gen2 et Recommandations de mise en réseau de Lakehouse Federation.

Vous pouvez également activer la prise en charge du pare-feu pour le compte de stockage de l’espace de travail afin de limiter l’accès au compte à partir de réseaux et de connexions autorisés. Consultez Activer la prise en charge du pare-feu pour votre compte de stockage d’espace de travail.

La connectivité entre le plan de contrôle et le plan de calcul serverless est toujours sur le réseau principal Azure et non sur l’Internet public.