Úvod
Mnoho organizací dnes pracuje s velkými objemy dat. Obrovský objem a rozmanitost dat a rychlost generování dat vyžadují systémy, které vám pomůžou spravovat a řídit je. V minulosti organizace používaly systémy pro správu relačních databází k řízení dat. Organizace ale nyní chtějí funkce opensourcového softwaru v kombinaci s výhodami hostovaných platforem. Azure HDInsight je dokonalým příkladem tohoto partnerství. HDInsight umožňuje zpracovávat velké objemy dat v mnoha scénářích pomocí historických nebo dat v reálném čase.
Následující obrázek znázorňuje přehled toho, jak můžete hdInsight používat. Znázorňuje několik zdrojů dat, včetně senzorů Internetu věcí (IoT), databází a několika úložišť dat Azure. HDInsight zpracovává data z těchto umístění. Pak ho zpřístupní v dlouhodobém úložišti pro aplikace v reálném čase a další analýzu.
Ukázkový scénář
Představme si, že pracujete pro organizaci, která vytváří úlohy, které ingestují data pro historické sestavy a pokročilou analýzu. Možná máte také streamovaná data, která vyžadují analýzu. V této situaci můžete zvážit použití SLUŽBY HDInsight. Umožňuje příjem všech dat do jednoho umístění Data Lake. Pak ho můžete použít ke správě následujících úloh:
- Dávkové zpracování
- Datové sklady
- Operace datových věd
- Streamování
Co budeme dělat?
Na konci tohoto modulu budete schopni vyhodnotit, jestli může hdInsight pomoct vaší organizaci zpracovávat velké objemy dat. Budete také schopni popsat, jak HDInsight používá oblíbené opensourcové architektury, které podporují mnoho scénářů dat.
Jaký je hlavní cíl?
Hlavním cílem je určit, jestli je HDInsight vhodnou volbou pro vaše požadavky na zpracování velkých objemů dat.