Partager via


Configurer l'accès aux données pour l'ingestion

Cet article décrit comment les utilisateurs administrateurs peuvent configurer l'accès aux données dans un conteneur dans Azure Data Lake Storage Gen2 (ADLS Gen2) afin que les utilisateurs d'Azure Databricks puissent charger des données d'ADLS Gen2 dans une table dans Azure Databricks.

Cet article décrit les méthodes suivantes pour configurer un accès sécurisé aux données sources :

  • (Recommandé) Créez un volume Unity Catalog.

  • Créez un emplacement externe Unity Catalog avec des informations d'identification de stockage.

  • Lancez une ressource de calcul qui utilise un principal de service.

  • Générez des informations d'identification temporaires (un jeton SAS Blob).

Avant de commencer

Avant de configurer l'accès aux données dans ADLS Gen2, assurez-vous de disposer des éléments suivants :

  • Données dans un conteneur dans votre compte de stockage Azure. Pour créer un conteneur, consultez Créer un conteneur dans la documentation du stockage Azure.

  • Pour accéder aux données à l'aide d'un volume Unity Catalog (recommandé), le privilège READ VOLUME sur le volume. Pour plus d'informations, consultez Que sont les volumes et Privilèges et objets sécurisables du catalogue Unity.

  • Pour accéder aux données à l'aide d'un emplacement externe Unity Catalog, le privilège READ FILES sur l'emplacement externe. Pour plus d’informations, consultez Créer un emplacement externe pour connecter le stockage cloud à Azure Databricks.

  • Pour accéder aux données à l’aide d’une ressource de calcul avec un principal de service, autorisations d’administrateur de l’espace de travail Azure Databricks.

  • Pour accéder aux données à l'aide d'informations d'identification temporaires :

    • Autorisations d’administrateur de l’espace de travail Azure Databricks.
    • Autorisations dans votre compte Azure pour créer des jetons Blob SAS. Cela vous permet de générer des informations d'identification temporaires.
  • Un entrepôt Databricks SQL. Pour créer un entrepôt SQL, consultez Créer un entrepôt SQL.

  • Bonne connaissance de l’interface utilisateur de Databricks SQL.

Configurer l’accès au stockage cloud

Utilisez l’une des méthodes suivantes pour configurer l’accès à ADLS Gen2 :

Nettoyage

Vous pouvez nettoyer les ressources associées dans votre compte cloud et Azure Databricks si vous ne souhaitez plus les conserver.

Supprimer le compte de stockage ADLS Gen2

  1. Ouvrez le portail Azure pour votre compte Azure, généralement à l’adresse https://portal.azure.com.
  2. Recherchez et ouvrez votre compte de stockage.
  3. Cliquez sur Supprimer.
  4. Entrez le nom du compte de stockage, puis cliquez sur Supprimer.

Arrêtez l'entrepôt SQL

Si vous n’utilisez pas l’entrepôt SQL pour d’autres tâches, vous devez l’arrêter afin d’éviter d’encourir des coûts supplémentaires.

  1. Dans le personnage SQL, dans la barre latérale, cliquez sur Entrepôts SQL.
  2. En regard du nom de l’entrepôt SQL, cliquez sur Arrêter.
  3. Lorsque vous y êtes invité, cliquez à nouveau sur Arrêter.

Étapes suivantes

Une fois les étapes décrites dans cet article terminées, les utilisateurs peuvent exécuter la commande COPY INTO pour charger les données du conteneur ADLS Gen2 dans votre espace de travail Azure Databricks.