はじめに
多くの組織は、この 20 年間を、リレーショナル データベース システムに基づいたデータ ウェアハウスやビジネス インテリジェンス (BI) ソリューションを構築することに費やしてきました。 多くの BI ソリューションは、コストと、データベース内のこの種のデータの複雑さのために、非構造化データを格納できませんでした。
データ レイクは、この問題の一般的な解決策になっています。 データ レイクは、通常は大量のデータに対する高いスケーラビリティをサポートする分散ファイル システムで、ファイル ベースのストレージを提供します。 組織は、構造化、半構造化、非構造化のファイルをデータ レイクに格納して、Apache Spark などのビッグ データ処理テクノロジで使用できます。
Azure Data Lake Storage Gen2 は、Microsoft Azure でのデータ レイク ストレージ用にクラウドベースのソリューションを提供し、Azure で構築される多くの大規模な分析ソリューションを支えています。