Introdução
Muitas organizações têm passado as últimas duas décadas a criar armazéns de dados e soluções de business intelligence (BI) com base em sistemas de bases de dados relacionais. Muitas soluções de BI perderam oportunidades de armazenar dados não estruturados devido ao custo e à complexidade desses tipos de dados em bancos de dados.
Os data lakes tornaram-se uma solução comum para este problema. Um data lake fornece armazenamento baseado em arquivos, geralmente em um sistema de arquivos distribuído que suporta alta escalabilidade para grandes volumes de dados. As organizações podem armazenar arquivos estruturados, semiestruturados e não estruturados no data lake e, em seguida, consumi-los a partir daí em tecnologias de processamento de big data, como o Apache Spark.
O Azure Data Lake Storage Gen2 fornece uma solução baseada na nuvem para armazenamento de data lake no Microsoft Azure e sustenta muitas soluções de análise de grande escala criadas no Azure.