Wprowadzenie
W wielu organizacjach w ostatnim dwudziestoleciu koncentrowano się na tworzeniu magazynów danych i rozwiązań do analizy biznesowej opartych na systemach relacyjnych baz danych. Wiele rozwiązań analizy biznesowej straciło możliwości przechowywania danych bez struktury ze względu na koszty i złożoność tych typów danych w bazach danych.
Usługa Data Lake stała się typowym rozwiązaniem tego problemu. Usługa Data Lake zapewnia magazyn oparty na plikach, zwykle w rozproszonym systemie plików, który obsługuje wysoką skalowalność dla ogromnych ilości danych. Organizacje mogą przechowywać pliki ustrukturyzowane, częściowo ustrukturyzowane i nieustrukturyzowane w usłudze Data Lake, a następnie korzystać z nich w technologiach przetwarzania danych big data, takich jak Apache Spark.
Usługa Azure Data Lake Storage Gen2 udostępnia oparte na chmurze rozwiązanie magazynu typu data lake na platformie Microsoft Azure i stanowi podstawę wielu rozwiązań analitycznych na dużą skalę opartych na platformie Azure.