Introduction

Effectué

De nombreuses organisations ont passé les 20 dernières années à générer des entrepôts de données et des solutions décisionnelles (BI, Business Intelligence) basées sur des systèmes de bases de données relationnelles. De nombreuses solutions BI n’ont pas su saisir les opportunités de stocker des données non structurées en raison des coûts et de la complexité de ces types de données dans les bases de données.

Les lacs de données constituent aujourd’hui une solution courante à ce problème. Les lacs de données fournissent un stockage basé sur des fichiers, généralement dans un système de fichiers distribué qui prend en charge une scalabilité élevée pour de grands volumes de données. Les organisations peuvent stocker des fichiers structurés, semi-structurés et non structurés dans le lac de données, puis les consommer dans des technologies de traitement du Big Data, comme Apache Spark.

Azure Data Lake Storage Gen2 fournit une solution cloud pour le stockage de lac de données dans Microsoft Azure et soutient de nombreuses solutions d’analytique à grande échelle basées sur Azure.