Použití Sparku v poznámkových blocích

Dokončeno

Ve Sparku můžete spouštět mnoho různých druhů aplikací, včetně kódu ve skriptech Pythonu nebo Scala, kódu Java zkompilovaného jako Java Archive (JAR) a dalších. Spark se běžně používá ve dvou typech úloh:

  • Úlohy dávkového zpracování nebo zpracování datových proudů za účelem ingestování, čištění a transformace dat – často běží jako součást automatizovaného kanálu.
  • Interaktivní analytické relace pro zkoumání, analýzu a vizualizaci dat

Spouštění kódu Sparku v poznámkových blocích

Azure Databricks obsahuje integrované rozhraní poznámkového bloku pro práci se Sparkem. Poznámkové bloky poskytují intuitivní způsob kombinování kódu s poznámkami Markdownu, které běžně používají datoví vědci a datoví analytici. Vzhled a chování integrovaného prostředí poznámkového bloku v Azure Databricks je podobné jako u poznámkových bloků Jupyter – oblíbené opensourcové platformy poznámkových bloků.

Snímek obrazovky s poznámkovým blokem v Azure Databricks

Poznámkové bloky se skládají z jedné nebo více buněk, z nichž každá obsahuje kód nebo markdown. Buňky kódu v poznámkových blocích mají některé funkce, které vám můžou pomoct zvýšit produktivitu, včetně těchto:

  • Podpora zvýrazňování syntaxe a chyb
  • Automatické dokončování kódu
  • Interaktivní vizualizace dat
  • Možnost exportu výsledků

Tip

Další informace o práci s poznámkovými bloky v Azure Databricks najdete v článku Poznámkové bloky v dokumentaci k Azure Databricks.