Začínáme s Azure Databricks

Dokončeno

Azure Databricks je cloudová platforma pro analýzu dat, která poskytuje jednotné prostředí pro přípravu dat, strojové učení a analýzu. Služba Azure Databricks byla navržena ve spolupráci s Databricks, jejíž vedení vytvořilo Apache Spark. Azure Databricks nabízí rychlou, snadnou a společnou analytickou službu založenou na Apache Sparku. Tato platforma se hluboce integruje s dalšími službami Azure a poskytuje uživatelům bezproblémové prostředí s vylepšeným zabezpečením, výkonem a škálovatelností. Umožňuje úlohy řízené daty, jako je příprava dat, strojové učení a pracovní postupy datových věd, což organizacím, které chtějí využít sílu velkých objemů dat, je univerzálním nástrojem.

Mezi klíčové funkce Azure Databricks patří nativní integrace s ID Microsoft Entra a její schopnost používat další služby Azure, jako je Azure Storage, Azure Data Lake Storage a Azure Cosmos DB. Platforma také nabízí interaktivní pracovní prostor, který usnadňuje spolupráci mezi datovými vědci, datovými inženýry a obchodními analytiky. Tato spolupráce podpora prostředí různé programovací jazyky, jako je Python, Scala, R a SQL, a umožňuje týmům efektivně vyvíjet a iterovat v jejich datových modelech. Kromě toho je Služba Azure Databricks navržená tak, aby se dala snadno škálovat a spravovat výpočetní požadavky algoritmů strojového učení i požadavky na zpracování velkých datových sad.

Vytvoření pracovního prostoru Azure Databricks

Pokud chcete používat Azure Databricks, musíte ve svém předplatném Azure vytvořit pracovní prostor Azure Databricks. Můžete toho dosáhnout takto:

  • Použití uživatelského rozhraní webu Azure Portal
  • Použití šablony Azure Resource Manageru (ARM) nebo Bicep
  • Použití rutiny New-AzDatabricksWorkspace Azure PowerShellu
  • Použití příkazu az databricks workspace create Azure command line interface (CLI)

Při vytváření pracovního prostoru musíte zadat jednu z následujících cenových úrovní.

  • Standard – Základní funkce Apache Sparku s integrací Microsoft Entra ID
  • Premium – Řízení přístupu na základě role a další funkce na podnikové úrovni
  • Zkušební verze – 14denní bezplatná zkušební verze pracovního prostoru na úrovni Premium

Azure Databricks

Použití portálu Azure Databricks

Po zřízení pracovního prostoru Azure Databricks můžete pomocí portálu Azure Databricks pracovat s daty a výpočetními prostředky. Portál Azure Databricks je webové uživatelské rozhraní, ve kterém můžete vytvářet a spravovat prostředky pracovního prostoru, jako jsou clustery Spark, a používat poznámkové bloky a dotazy k práci s daty v souborech a tabulkách.

Portál Azure Databricks