Narzędzia programistyczne
Usługa Databricks udostępnia ekosystem narzędzi ułatwiających opracowywanie aplikacji i rozwiązań integrujących się z usługą Azure Databricks oraz programowo zarządzać zasobami i danymi usługi Databricks.
Ten artykuł zawiera omówienie tych narzędzi i zaleceń dotyczących najlepszych narzędzi dla typowych scenariuszy deweloperskich.
Jakie narzędzia zapewnia usługa Databricks deweloperom?
Poniższa tabela zawiera listę narzędzi deweloperskich udostępnianych przez usługę Databricks.
Narzędzie | opis |
---|---|
Uwierzytelnianie i autoryzacja | Skonfiguruj uwierzytelnianie i autoryzację dla narzędzi, skryptów i aplikacji do pracy z usługą Azure Databricks. |
Databricks Connect | Nawiąż połączenie z usługą Azure Databricks przy użyciu popularnych zintegrowanych środowisk projektowych (IDE), takich jak PyCharm, IntelliJ IDEA, Eclipse, RStudio i JupyterLab. Jeśli używasz programu Visual Studio Code, usługa Databricks zaleca rozszerzenie databricks dla programu Visual Studio Code, które jest oparte na programie Databricks Connect, ponieważ udostępnia dodatkowe funkcje umożliwiające łatwiejsze konfigurowanie. |
Rozszerzenie usługi Databricks dla programu Visual Studio Code | Połącz się ze zdalnymi obszarami roboczymi usługi Azure Databricks z zintegrowanego środowiska projektowego (IDE) programu Visual Studio Code . |
Wtyczka PyCharm Databricks | Skonfiguruj połączenie ze zdalnym obszarem roboczym usługi Databricks i uruchom pliki w klastrach usługi Databricks z poziomu rozwiązania PyCharm. Ta wtyczka jest opracowywana i dostarczana przez firmę JetBrains we współpracy z usługą Databricks. |
Zestawy SDK usługi Databricks | Automatyzowanie usługi Azure Databricks z bibliotek kodu napisanych dla popularnych języków, takich jak Python, Java, Go i R. Zamiast wysyłać wywołania interfejsu API REST bezpośrednio przy użyciu narzędzia curl/Postman, możesz użyć zestawu SDK do interakcji z usługą Databricks przy użyciu wybranego języka programowania. |
Sterowniki i narzędzia SQL | Połącz się z usługą Azure Databricks, aby uruchamiać polecenia i skrypty SQL, programowo korzystać z usługi Azure Databricks i integrować funkcje SQL usługi Azure Databricks z aplikacjami napisanymi w popularnych językach, takich jak Python, Go, JavaScript i TypeScript. |
Interfejs wiersza polecenia usługi Databricks | Uzyskaj dostęp do funkcji usługi Azure Databricks przy użyciu interfejsu wiersza polecenia usługi Databricks. Interfejs wiersza polecenia opakowuje interfejs API REST usługi Databricks, więc zamiast wysyłać wywołania interfejsu API REST bezpośrednio przy użyciu narzędzia curl lub Postman, możesz użyć interfejsu wiersza polecenia usługi Databricks do interakcji z usługą Databricks. |
Pakiety zasobów usługi Databricks | Implementowanie standardowych rozwiązań dotyczących programowania, testowania i wdrażania (CI/CD) dla danych usługi Azure Databricks i projektów sztucznej inteligencji przy użyciu pakietów zasobów usługi Databricks (DABs). |
Dostawca narzędzia Terraform usługi Databricks i narzędzie Terraform CDKTF dla usługi Databricks | Aprowizuj infrastrukturę i zasoby usługi Azure Databricks przy użyciu narzędzia Terraform. |
Dostawca zasobów usługi Pulumi Databricks | Aprowizowanie infrastruktury i zasobów usługi Azure Databricks przy użyciu infrastruktury jako kodu (IaC) pulumi. |
Narzędzia ciągłej integracji/ciągłego wdrażania | Integrowanie popularnych systemów ciągłej integracji/ciągłego wdrażania i struktur, takich jak GitHub Actions, Jenkins i Apache Airflow. |
Napiwek
Możesz również połączyć wiele dodatkowych popularnych narzędzi innych firm z klastrami i magazynami SQL w celu uzyskania dostępu do danych w usłudze Azure Databricks. Zobacz Partnerów technologicznych.
Którego narzędzia dewelopera należy używać?
W poniższej tabeli przedstawiono zalecenia dotyczące narzędzi usługi Databricks dla typowych scenariuszy deweloperskich.
Scenariusze | Zalecenie |
---|---|
- Interaktywne programowanie i debugowanie z lokalnego środowiska IDE | Rozszerzenie usługi Databricks dla programu Visual Studio Code Wtyczka PyCharm Databricks W przypadku innych środowisk IDE użyj interfejsu wiersza polecenia usługi Databricks z usługą Databricks Connect |
- Bezpośrednia interakcja z usługą Databricks z wiersza polecenia - Skrypty powłoki -Eksperymentów — Bezpośrednie wywoływanie interfejsu API REST - Zarządzanie profilami uwierzytelniania lokalnego — Synchronizowanie kodu ze środowiska IDE do obszaru roboczego usługi Databricks |
Interfejs wiersza polecenia usługi Databricks |
— Zarządzanie przepływami pracy i wdrażanie projektów w usłudze Databricks - Stosowanie najlepszych rozwiązań dotyczących ciągłej integracji/ciągłego wdrażania - Wspólna wersja, współautor, współtworzenie, współdróżnienie zasobów i zasobów jako jedna lekcja — Obsługuje najbardziej typowe zasoby |
Pakiety zasobów usługi Databricks (funkcja interfejsu wiersza polecenia) |
- Infrastruktura jako kod, ciągła integracja/ciągłe wdrażanie — Administrowanie obszarami roboczymi, wykazami, magazynami metadanych i wymuszanie uprawnień - Gwarancja przenośności środowiska i odzyskiwania po awarii — Wiele obsługiwanych zasobów |
Dostawca narzędzia Terraform dla usługi Databricks |
— Tworzenie aplikacji - Integracja z istniejącymi systemami wdrażania — Tworzenie niestandardowych przepływów pracy usługi Databricks i nowych usług internetowych |
Databricks Python SDK Databricks Java SDK Databricks Go SDK Databricks R SDK |
— Tylko scenariusze zaawansowane — Prawie wszystkie zasoby usługi Databricks są dostępne |
Interfejs API REST usługi Databricks |