Začínáme s Azure Databricks
Azure Databricks je cloudová platforma pro analýzu dat, která poskytuje jednotné prostředí pro přípravu dat, strojové učení a analýzu. Služba Azure Databricks byla navržena ve spolupráci s Databricks, jejíž vedení vytvořilo Apache Spark. Azure Databricks nabízí rychlou, snadnou a společnou analytickou službu založenou na Apache Sparku. Tato platforma se hluboce integruje s dalšími službami Azure a poskytuje uživatelům bezproblémové prostředí s vylepšeným zabezpečením, výkonem a škálovatelností. Umožňuje úlohy řízené daty, jako je příprava dat, strojové učení a pracovní postupy datových věd, což organizacím, které chtějí využít sílu velkých objemů dat, je univerzálním nástrojem.
Mezi klíčové funkce Azure Databricks patří nativní integrace s ID Microsoft Entra a její schopnost používat další služby Azure, jako je Azure Storage, Azure Data Lake Storage a Azure Cosmos DB. Platforma také nabízí interaktivní pracovní prostor, který usnadňuje spolupráci mezi datovými vědci, datovými inženýry a obchodními analytiky. Tato spolupráce podpora prostředí různé programovací jazyky, jako je Python, Scala, R a SQL, a umožňuje týmům efektivně vyvíjet a iterovat v jejich datových modelech. Kromě toho je Služba Azure Databricks navržená tak, aby se dala snadno škálovat a spravovat výpočetní požadavky algoritmů strojového učení i požadavky na zpracování velkých datových sad.
Vytvoření pracovního prostoru Azure Databricks
Pokud chcete používat Azure Databricks, musíte ve svém předplatném Azure vytvořit pracovní prostor Azure Databricks. Můžete toho dosáhnout takto:
- Použití uživatelského rozhraní webu Azure Portal
- Použití šablony Azure Resource Manageru (ARM) nebo Bicep
- Použití rutiny New-AzDatabricksWorkspace Azure PowerShellu
- Použití příkazu az databricks workspace create Azure command line interface (CLI)
Při vytváření pracovního prostoru musíte zadat jednu z následujících cenových úrovní.
- Standard – Základní funkce Apache Sparku s integrací Microsoft Entra ID
- Premium – Řízení přístupu na základě role a další funkce na podnikové úrovni
- Zkušební verze – 14denní bezplatná zkušební verze pracovního prostoru na úrovni Premium
Použití portálu Azure Databricks
Po zřízení pracovního prostoru Azure Databricks můžete pomocí portálu Azure Databricks pracovat s daty a výpočetními prostředky. Portál Azure Databricks je webové uživatelské rozhraní, ve kterém můžete vytvářet a spravovat prostředky pracovního prostoru, jako jsou clustery Spark, a používat poznámkové bloky a dotazy k práci s daty v souborech a tabulkách.