Partage via


Qu’est-ce que l’entreposage de données dans Microsoft Fabric ?

S’applique à :✅ point de terminaison d’analytique SQL et entrepôt dans Microsoft Fabric

Fabric Data Warehouse est une solution d’entreposage de données de nouvelle génération dans Microsoft Fabric.

L’entrepôt centré sur le lac basé sur un moteur de traitement distribué de niveau entreprise qui permet des performances de pointe à grande échelle tout en minimisant le besoin de configuration et de gestion. Se trouvant dans le lac de données et conçu pour prendre en charge en mode natif les formats de données ouverts, l’entrepôt de données Fabric permet une collaboration transparente entre les ingénieurs de données et les utilisateurs professionnels sans compromettre la sécurité ou la gouvernance.

De plus, l’expérience SaaS facile à utiliser est étroitement intégrée à Power BI pour faciliter l’analyse et la création de rapports, faisant ainsi converger le monde des lacs de données et des entrepôts et simplifiant considérablement l’investissement des organisations dans leur patrimoine analytique. 

Les clients de l’entrepôt de données bénéficient des avantages suivants :

  • Les données stockées au format Delta Parquet activent les transactions ACID et l’interopérabilité avec d’autres charges de travail Fabric, ce qui signifie que vous n’avez pas besoin de plusieurs copies de données.
  • Les requêtes entre bases de données permettent aux clients d’utiliser plusieurs sources de données pour obtenir des insights rapides et sans duplication de données.
  • Ingérer, charger et transformer facilement des données à grande échelle par le biais de pipelines, de flux de données, d’une requête entre bases de données ou de la commande COPY INTO.
  • La gestion autonome des charges de travail avec le moteur de traitement des requêtes distribués de pointe signifie qu’il n’y a aucun paramètre à définir pour obtenir les meilleures performances.
  • Une mise à l’échelle presque instantanée pour répondre aux besoins de votre entreprise. Le stockage et le calcul sont séparés.
  • Réduction du temps d’obtention d’insights grâce à un modèle sémantique facilement consommable et toujours connecté qui est intégré à Power BI en mode Direct Lake. Les rapports disposent toujours des données les plus récentes pour l’analyse et la création de rapports.
  • Conçu pour n’importe quel niveau de compétence, du développeur citoyen à l’ingénieur DBA ou à l’ingénieur données.

Éléments d’entrepôt de données

L’entrepôt de données Fabric n’est pas un entrepôt de données d’entreprise traditionnel, il s’agit d’un entrepôt de lac qui prend en charge deux éléments d’entreposage distincts : l’entrepôt de données Fabric et le point de terminaison d’analytique SQL. Les deux éléments sont conçus pour répondre aux besoins métier des clients tout en offrant des performances optimales, en minimisant les coûts et en réduisant les frais administratifs.

Entrepôt de données Fabric

Dans un espace de travail Microsoft Fabric, un entrepôt Fabric est étiqueté en tant qu’entrepôt dans la colonne Type. Lorsque vous avez besoin d’exploiter pleinement la puissance et les capacités transactionnelles (prise en charge des requêtes DDL et DML) d’un entrepôt de données, il s’agit d’une solution rapide et simple.

Capture d’écran montrant le type Entrepôt dans l’espace de travail.

L’entrepôt peut être rempli par l’une des méthodes d’ingestion de données prises en charge telles que COPY INTO, les pipelines, les flux de données ou les options d’ingestion de bases de données croisées telles que CREATE TABLE AS SELECT (CTAS), INSERT..SELECT ou SELECT INTO.

Pour commencer à utiliser l’entrepôt, consultez :

Point de terminaison d’analytique SQL de Lakehouse

Dans un espace de travail Microsoft Fabric, chaque Lakehouse dispose d’un « point de terminaison d’analytique SQL » généré automatiquement, qui peut être utilisé pour passer de la vue « Lake » du Lakehouse (qui prend en charge l’ingénierie des données et Apache Spark) à la vue « SQL » du même Lakehouse pour créer des vues, des fonctions, des procédures stockées et appliquer la sécurité SQL.

Capture d’écran montrant le type Point de terminaison d'analytique SQL dans l’espace de travail.

Grâce au point de terminaison d’analytique SQL de Lakehouse, les commandes T-SQL permettent de définir et d’interroger des objets de données, mais elles ne permettent pas de manipuler ou de modifier les données. Vous pouvez effectuer les actions suivantes dans le point de terminaison d’analytique SQL :

  • Interroger les tables qui référencent des données dans vos dossiers Delta Lake dans le lac.
  • Créer des vues, des fonctions à valeurs de tables (TVF) en ligne et des procédures pour encapsuler votre sémantique et votre logique métier dans T-SQL.
  • Gérer les autorisations sur les objets.

Pour commencer à utiliser le point de terminaison d’analytique SQL, consultez :

Entrepôt ou lakehouse

Au moment de choisir entre un entrepôt ou un lakehouse, il est important de prendre en compte vos besoins spécifiques, le contexte de votre gestion des données et vos exigences analytiques. Il est tout aussi important de savoir qu’il ne s’agit pas d’une décision unidirectionnelle !

Vous avez toujours la possibilité d’ajouter ultérieurement l’un ou l’autre si vos besoins métier changent et quel que soit l’endroit à partir duquel vous commencez, l’entrepôt et le lakehouse utilisent le même moteur SQL puissant pour toutes les requêtes T-SQL.

Voici quelques indications à prendre en compte pour vous aider à choisir :

  • Choisissez un entrepôt de données lorsque vous avez besoin d’une solution à l’échelle de l’entreprise avec un format standard ouvert, aucune performance à définir et une configuration minimale.  Idéal pour les formats de données semi-structurés et structurés, l’entrepôt de données est adapté aux professionnels des données débutants et expérimentés, offrant des expériences simples et intuitives.

  • Choisissez un lakehouse lorsque vous avez besoin d’un grand référentiel de données hautement non structurées à partir de sources hétérogènes en tirant parti du stockage d’objets à faible coût, et si vous souhaitez utiliser SPARK comme outil de développement principal. Agissant comme un entrepôt de données « léger », vous avez toujours la possibilité d’utiliser le point de terminaison SQL et les outils T-SQL pour fournir des scénarios de création de rapports et d’intelligence des données dans votre lakehouse.

Pour obtenir des conseils de décision plus détaillés, consultez Guide de décision Microsoft Fabric : choisir entre l’entrepôt de données et le lakehouse.