Inleiding

Voltooid

Veel organisaties hebben de afgelopen twee decennia tijd gestoken in het ontwikkelen van datawarehouses en oplossingen voor business intelligence (BI) op basis van relationele databasesystemen. Veel BI-oplossingen hebben geen mogelijkheden meer om ongestructureerde gegevens op te slaan vanwege kosten en complexiteit in deze typen gegevens in databases.

Data lakes zijn een veelvoorkomende oplossing voor dit probleem geworden. Een data lake biedt opslag op basis van bestanden, meestal in een gedistribueerd bestandssysteem dat ondersteuning biedt voor hoge schaalbaarheid voor grote hoeveelheden gegevens. Organisaties kunnen gestructureerde, semi-gestructureerde en ongestructureerde bestanden opslaan in de data lake en ze vervolgens gebruiken in big data-verwerkingstechnologieën, zoals Apache Spark.

Azure Data Lake Storage Gen2 biedt een cloudoplossing voor Data Lake Storage in Microsoft Azure en ondersteunt veel grootschalige analyseoplossingen die zijn gebouwd op Azure.