はじめに

完了

大規模なデータ分析ソリューションは、ビジネス インテリジェンス (BI) をサポートするために使われる従来のデータ ウェアハウスと、いわゆる "ビッグ データ" 分析に使われる手法を組み合わせたものです。 従来のデータ ウェアハウス ソリューションでは、通常、多次元モデルのクエリと構築に最適化されたスキーマを使って、トランザクション データ ストアからリレーショナル データベースにデータがコピーされます。 ただし、ビッグ データ処理ソリューションは、複数の形式になっている大量のデータで使われます。データは、バッチで読み込まれるか、リアルタイム ストリームでキャプチャされ、"データ レイク" に格納された後、Apache Spark などの分散処理エンジンを使って処理されます。 柔軟なデータ レイク ストレージ分析とデータ ウェアハウス SQL 分析の組み合わせにより、通称 "データ レイクハウス" と呼ばれる大規模な分析設計が登場しました。