Úvod

Dokončeno

Řešení pro analýzu velkých objemů dat kombinují konvenční datové sklady používané k podpoře business intelligence (BI) s technikami používanými pro tzv. analýzy velkých objemů dat. Řešení konvenčních datových skladů obvykle zahrnuje kopírování dat z transakčních úložišť dat do relační databáze se schématem optimalizovaným pro dotazování a vytváření multidimenzionálních modelů. Řešení pro zpracování velkých objemů dat se ale používají s velkými objemy dat ve více formátech, které se dávkově načítají nebo zaznamenávají v datových proudech v reálném čase a ukládají se do datového jezera , ze kterého se používají distribuované procesory, jako je Apache Spark. Kombinace flexibilního úložiště Data Lake Storage a analýzy SQL datového skladu vedla ke vzniku rozsáhlého analytického návrhu, který se často označuje jako datové jezero.