Použití Sparku v poznámkových blocích
Ve Sparku můžete spouštět mnoho různých druhů aplikací, včetně kódu ve skriptech Pythonu nebo Scala, kódu Java zkompilovaného jako Java Archive (JAR) a dalších. Spark se běžně používá ve dvou typech úloh:
- Úlohy dávkového zpracování nebo zpracování datových proudů za účelem ingestování, čištění a transformace dat – často běží jako součást automatizovaného kanálu.
- Interaktivní analytické relace pro zkoumání, analýzu a vizualizaci dat
Spouštění kódu Sparku v poznámkových blocích
Azure Databricks obsahuje integrované rozhraní poznámkového bloku pro práci se Sparkem. Poznámkové bloky poskytují intuitivní způsob kombinování kódu s poznámkami Markdownu, které běžně používají datoví vědci a datoví analytici. Vzhled a chování integrovaného prostředí poznámkového bloku v Azure Databricks je podobné jako u poznámkových bloků Jupyter – oblíbené opensourcové platformy poznámkových bloků.
Poznámkové bloky se skládají z jedné nebo více buněk, z nichž každá obsahuje kód nebo markdown. Buňky kódu v poznámkových blocích mají některé funkce, které vám můžou pomoct zvýšit produktivitu, včetně těchto:
- Podpora zvýrazňování syntaxe a chyb
- Automatické dokončování kódu
- Interaktivní vizualizace dat
- Možnost exportu výsledků
Tip
Další informace o práci s poznámkovými bloky v Azure Databricks najdete v článku Poznámkové bloky v dokumentaci k Azure Databricks.