Partager via


Utiliser Azure Synapse Analytics avec l’analytique à l’échelle du cloud

Azure Synapse Analytics est le service d’analytique intégré et provisionné qui accélère le temps nécessaire à la découverte dans les entrepôts de données et les systèmes big data. Azure Synapse Analytics réunit les éléments suivants :

  • Les meilleures technologies SQL utilisées dans l’entreposage de données d’entreprise.
  • Technologies Spark utilisées pour le Big Data.
  • Des pipelines pour l’application des données (alignée à la source) et l’extraction, la transformation et le chargement (ETL) ou l’extraction, le chargement et la transformation (ELT).

Azure Synapse Studio est un outil dans Azure Synapse qui offre une expérience unifiée pour la gestion, la supervision, le codage et la sécurité. Synapse Studio a une intégration approfondie avec d’autres services Azure tels que Power BI, Azure Cosmos DB et Azure Machine Learning.

Remarque

Cette section vise à décrire les configurations prescrites spécifiques à l’analytique à l’échelle du cloud. Elle complète la documentation Azure Synapse Analytics officielle.

Aperçu

Pendant la configuration initiale d’une zone d’atterrissage de données , vous pouvez déployer un espace de travail Azure Synapse Analytics unique à utiliser par tous les analystes et scientifiques des données. Vous pouvez créer d’autres espaces de travail pour des intégrations de données ou des produits de données spécifiques.

Vous aurez peut-être besoin d’espaces de travail Azure Synapse Analytics supplémentaires si votre produit de données doit fournir l’accès aux données standardisées avec une sécurité au niveau des lignes et des colonnes. Vous pouvez fournir ces espaces de travail avec des pools Azure Synapse. Les équipes de produits de données peuvent nécessiter leur propre espace de travail pour créer des produits de données et un espace de travail distinct uniquement pour les équipes de produits disposant d’un accès au développement étendu.

Configuration d’Azure Synapse Analytics

La première étape du déploiement d’Azure Synapse Analytics consiste à configurer un espace de travail Azure Synapse qui est connecté à un compte Microsoft Purview.

Mise en réseau Azure Synapse Analytics

Une zone d’atterrissage des données crée des espaces de travail avec un réseau virtuel managé Azure Synapse Analytics. La communication avec Azure Synapse se produit via les trois points de terminaison qu’il expose : pool SQL, SQL à la demande et point de terminaison de développement.

Au niveau du réseau, l’analyse à l’échelle du cloud utilise des points de terminaison privés managés Synapse. Ces points de terminaison garantissent que tout le trafic entre le réseau virtuel de la zone d'accueil des données et les espaces de travail Azure Synapse passe entièrement par le réseau dorsal de Microsoft.

Contrôle d’accès aux données Azure Synapse

Utilisez des listes de contrôle d’accès avec la méthode Pass-through de Microsoft Entra dans Azure Synapse Analytics pour gérer l’accès aux fichiers dans le lac de données.

Pour les données où vous devez restreindre les colonnes et les lignes retournées, nous vous recommandons d'appliquer la sécurité au niveau des lignes et des colonnes pour restreindre l'accès aux données sur les tables dans le pool dédié ou sans serveur d'Azure Synapse SQL. La sécurité au niveau des lignes et la sécurité au niveau des colonnes sont implémentées au niveau de la base de données et en plus des rôles de base de données.

Par exemple, la sécurité au niveau des lignes garantit que les utilisateurs d’une application de données spécifique (alignées sur la source) ou d’un produit de données voient uniquement leurs propres données. Même si la table contient des données pour l’ensemble de l’entreprise.

Vous pouvez combiner la sécurité au niveau des lignes avec la sécurité au niveau des colonnes pour restreindre l’accès aux colonnes avec des données sensibles. De cette façon, la sécurité au niveau des lignes et la sécurité au niveau des colonnes appliquent la logique de restriction d’accès au niveau de la base de données plutôt que la couche Application. L’autorisation est évaluée chaque fois que l’accès aux données est tenté à partir de n’importe quel niveau.

Remarque

Le pool SQL serverless Azure Synapse prend en charge la sécurité au niveau des colonnes pour les vues et non pour les tables externes. En cas de tables externes, vous pouvez créer une vue logique en haut de la table externe et appliquer la sécurité au niveau des colonnes. En cas de sécurité au niveau des lignes, les vues personnalisées peuvent être utilisées comme solution de contournement.

Pour plus d’informations, consultez le contrôle d’accès aux données de Azure Synapse Analytics .

Contrôle d’accès aux données Azure Synapse dans Azure Data Lake

Lors du déploiement d’un espace de travail Azure Synapse Analytics, vous avez besoin d’un compte Azure Data Lake Storage à partir de l’abonnement ou manuellement à l’aide de l’URL du compte de stockage. Le compte de stockage spécifié est défini comme principal pour l’espace de travail Azure Synapse déployé pour stocker ses données. Azure Synapse stocke des données dans un conteneur qui inclut des tables Apache Spark et des journaux d’application Spark dans un dossier appelé /synapse/{workspaceName}. Il dispose également d’un conteneur pour gérer les bibliothèques que vous choisissez d’installer.

Conseil

Nous vous recommandons d’utiliser un conteneur dédié sur la couche de développement ou le compte data lake trois. Ce conteneur est utilisé comme stockage principal pour stocker les métadonnées Spark.

Reportez-vous à Contrôle d’accès aux données Azure Synapse Analytics pour obtenir des recommandations sur la configuration de l’accès aux données.