Sdílet prostřednictvím


místních vývojových nástrojů

Databricks poskytuje ekosystém nástrojů, které vám pomůžou vyvíjet aplikace a řešení, které se integrují s Azure Databricks a programově spravují prostředky a data Databricks.

Tento článek obsahuje přehled těchto nástrojů a doporučení pro nejlepší nástroje pro běžné scénáře vývojářů.

Jaké nástroje databricks nabízí pro místní vývoj?

Následující tabulka obsahuje seznam vývojářských nástrojů, které poskytuje Databricks.

Nástroj Popis
Ověřování a autorizace Nakonfigurujte ověřování a autorizaci pro vaše nástroje, skripty a aplikace pro práci s Azure Databricks.
Databricks Connect Připojte se k Azure Databricks pomocí oblíbených integrovaných vývojových prostředí (IDE), jako jsou PyCharm, IntelliJ IDEA, Eclipse, RStudio a JupyterLab.
Pokud používáte Visual Studio Code, Databricks doporučuje rozšíření Databricks pro Visual Studio Code, které je postavené na databricks Connect, protože poskytuje další funkce, které umožňují snadnější konfiguraci.
Rozšíření Databricks pro Visual Studio Code Připojte se ke vzdáleným pracovním prostorům Azure Databricks z integrovaného vývojového prostředí (IDE) editoru Visual Studio Code .
Zásuvný modul PyCharm Databricks Nakonfigurujte připojení ke vzdálenému pracovnímu prostoru Databricks a spusťte soubory v clusterech Databricks z PyCharm. Tento modul plug-in je vyvinut a poskytován JetBrains ve spolupráci s Databricks.
Databricks SDK Automatizujte Azure Databricks z knihoven kódu napsaných pro oblíbené jazyky, jako jsou Python, Java, Go a R. Místo přímého odesílání volání rozhraní REST API pomocí nástroje curl/ Postman můžete použít sadu SDK k interakci s Databricks pomocí programovacího jazyka podle vašeho výběru. Sady SDK Databricks podporují kompletní rozhraní REST API a poskytují další funkce, včetně sjednoceného ověřování a stránkování, které usnadňují jejich použití a rozšíření tak, aby zahrnovaly celou řadu scénářů.
Ovladače a nástroje SQL Připojte se k Azure Databricks, abyste mohli spouštět příkazy a skripty SQL, pracovat programově s Azure Databricks a integrovat funkce SQL Azure Databricks do aplikací psaných v oblíbených jazycích, jako je Python, Go, JavaScript a TypeScript.
Databricks CLI Přístup k funkcím Azure Databricks pomocí rozhraní příkazového řádku Databricks (CLI). Rozhraní příkazového řádku zabalí rozhraní REST API Databricks, takže místo odesílání volání rozhraní REST API přímo pomocí nástroje curl nebo Postman můžete k interakci s Databricks použít rozhraní příkazového řádku Databricks.
Balíčky prostředků Databricks Implementujte osvědčené postupy pro vývoj, testování a nasazení (CI/CD) pro vaše datové a AI projekty Azure Databricks s využitím Databricks Asset Bundles (DABs).
Poskytovatel Terraform pro Databricks a Terraform CDKTF pro Databricks Zřiďte infrastrukturu a prostředky Azure Databricks pomocí Terraformu.
Nástroje CI/CD Integrujte oblíbené systémy a frameworky CI/CD, jako GitHub Actions, Jenkins a Apache Airflow.

Tip

K clusterům a skladům SQL pro přístup k datům v Azure Databricks můžete také připojit mnoho dalších oblíbených nástrojů třetích stran. Podívejte se na technologické partnery.

Který vývojářský nástroj mám použít?

Následující tabulka popisuje doporučení nástrojů Databricks pro běžné scénáře vývojářů.

Nástroj Doporučení k používání
Rozšíření Databricks pro Visual Studio Code
Plug-in PyCharm Databricks
Pro jiná IDE použijte Databricks CLI s Databricks Connect.
  • Interaktivní vývoj a ladění z místního integrovaného vývojového prostředí (IDE)
Databricks CLI
  • Přímá interakce s Databricks z příkazového řádku
  • Skriptování prostředí
  • Experimentování
  • Přímé vyvolání rozhraní REST API
  • Správa místních profilů ověřování
  • Synchronizace kódu z integrovaného vývojového prostředí (IDE) do pracovního prostoru Databricks
Balíčky prostředků Databricks (funkce příkazového řádku)
  • Správa pracovních postupů a nasazení projektů do Databricks
  • Použití osvědčených postupů CI/CD
  • Spolu verze, spoluautor, spolunasazení vašich zdrojů a prostředků jako jednolitá jednotka
  • Podporuje nejběžnější zdroje.
Poskytovatel Terraformu pro Databricks
  • Infrastruktura jako kód, CI/CD
  • Správa a vytváření pracovních prostorů, katalogů, metastorů a vynucení oprávnění
  • Záruka přenositelnosti prostředí a zotavení po havárii
  • Mnoho podporovaných prostředků
Databricks Python SDK
Databricks Java SDK
Databricks Go SDK
Databricks R SDK
  • Vývoj aplikací
  • Integrace se stávajícími systémy nasazení
  • Vytváření vlastních pracovních postupů Databricks a nových webových služeb
Databricks REST API
  • Automatizace procesů, kdy sada SDK ve vašem preferovaném programovacím jazyce není dostupná
  • Pouze pokročilé scénáře
  • Téměř všechny prostředky Databricks jsou k dispozici.