Sdílet prostřednictvím


místních vývojových nástrojů

Databricks poskytuje ekosystém nástrojů, které vám pomůžou vyvíjet aplikace a řešení, které se integrují s Azure Databricks a programově spravují prostředky a data Databricks.

Tento článek obsahuje přehled těchto nástrojů a doporučení pro nejlepší nástroje pro běžné scénáře vývojářů.

Jaké nástroje databricks nabízí pro místní vývoj?

Následující tabulka obsahuje seznam vývojářských nástrojů, které poskytuje Databricks.

Nástroj Popis
Ověřování a autorizace Nakonfigurujte ověřování a autorizaci pro vaše nástroje, skripty a aplikace pro práci s Azure Databricks.
Databricks Connect Připojte se k Azure Databricks pomocí oblíbených integrovaných vývojových prostředí (IDE), jako jsou PyCharm, IntelliJ IDEA, Eclipse, RStudio a JupyterLab.

Pokud používáte Visual Studio Code, Databricks doporučuje rozšíření Databricks pro Visual Studio Code, které je postavené na databricks Connect, protože poskytuje další funkce, které umožňují snadnější konfiguraci.
Rozšíření Databricks pro Visual Studio Code Připojte se ke vzdáleným pracovním prostorům Azure Databricks z integrovaného vývojového prostředí (IDE) editoru Visual Studio Code .
Modul plug-in PyCharm Databricks Nakonfigurujte připojení ke vzdálenému pracovnímu prostoru Databricks a spusťte soubory v clusterech Databricks z PyCharm. Tento modul plug-in je vyvinut a poskytován JetBrains ve spolupráci s Databricks.
Sady SDK Databricks Automatizujte Azure Databricks z knihoven kódu napsaných pro oblíbené jazyky, jako jsou Python, Java, Go a R. Místo přímého odesílání volání rozhraní REST API pomocí nástroje curl/ Postman můžete použít sadu SDK k interakci s Databricks pomocí programovacího jazyka podle vašeho výběru. Sady SDK Databricks podporují kompletní rozhraní REST API a poskytují další funkce, včetně sjednoceného ověřování a stránkování, které usnadňují jejich použití a rozšíření tak, aby zahrnovaly celou řadu scénářů.
Ovladače a nástroje SQL Připojte se k Azure Databricks, abyste mohli spouštět příkazy a skripty SQL, pracovat programově s Azure Databricks a integrovat funkce SQL Azure Databricks do aplikací psaných v oblíbených jazycích, jako je Python, Go, JavaScript a TypeScript.
Databricks CLI Přístup k funkcím Azure Databricks pomocí rozhraní příkazového řádku Databricks (CLI). Rozhraní příkazového řádku zabalí rozhraní REST API Databricks, takže místo odesílání volání rozhraní REST API přímo pomocí nástroje curl nebo Postman můžete k interakci s Databricks použít rozhraní příkazového řádku Databricks.
Sady prostředků Databricks Implementace osvědčených postupů pro vývoj, testování a nasazení (CI/CD) pro vaše projekty Azure Databricks a AI s využitím sad prostředků Databricks
Zprostředkovatel Terraformu Databricks a Terraform CDKTF pro Databricks Zřiďte infrastrukturu a prostředky Azure Databricks pomocí Terraformu.
Nástroje CI/CD Integrujte oblíbené systémy a architektury CI/CD, jako jsou GitHub Actions, Jenkins a Apache Airflow.

Tip

K clusterům a skladům SQL pro přístup k datům v Azure Databricks můžete také připojit mnoho dalších oblíbených nástrojů třetích stran. Podívejte se na technologické partnery.

Který vývojářský nástroj mám použít?

Následující tabulka popisuje doporučení nástrojů Databricks pro běžné scénáře vývojářů.

Nástroj Doporučení k používání
Rozšíření Databricks pro Visual Studio Code

Modul plug-in PyCharm Databricks

V případě jiných prostředí ID použijte rozhraní příkazového řádku Databricks s Databricks Connect.
– Interaktivní vývoj a ladění z místního integrovaného vývojového prostředí (IDE)
Databricks CLI – Přímá interakce s Databricks z příkazového řádku
– Skriptování prostředí
-Experimentování
– Přímé vyvolání rozhraní REST API
– Správa místních ověřovacích profilů
– Synchronizace kódu z integrovaného vývojového prostředí (IDE) do pracovního prostoru Databricks
Sady prostředků Databricks (funkce rozhraní příkazového řádku) – Správa pracovních postupů a nasazení projektů do Databricks
– Použití osvědčených postupů CI/CD
– Spoluvlastník, spoluvytáč, spoluvytáčujte prostředky a prostředky jako jednu jednotku.
- Podporuje nejběžnější prostředky.
Poskytovatel Terraformu pro Databricks – Infrastruktura jako kód, CI/CD
– Správa a vytváření pracovních prostorů, katalogů, metastorů a vynucení oprávnění
- Záruka přenositelnosti prostředí a zotavení po havárii
– Mnoho podporovaných prostředků
Databricks Python SDK

Databricks Java SDK

Databricks Go SDK

Databricks R SDK
- Vývoj aplikací
- Integrace se stávajícími systémy nasazení
– Vytváření vlastních pracovních postupů Databricks a nových webových služeb
Databricks REST API – Automatizace procesů, kdy sada SDK ve vašem preferovaném programovacím jazyce není k dispozici
– Pouze pokročilé scénáře
– Téměř všechny prostředky Databricks jsou k dispozici.