Rozpoczynanie pracy z usługą Azure Databricks
Azure Databricks to oparta na chmurze platforma do analizy danych, która zapewnia ujednolicone środowisko do inżynierii danych, uczenia maszynowego i analizy. Usługa Azure Databricks została zaprojektowana we współpracy z usługą Databricks, której kierownictwo stworzyło platformę Apache Spark. Usługa Azure Databricks oferuje szybką, łatwą i wspólną usługę analizy opartą na platformie Apache Spark. Ta platforma integruje się głęboko z innymi usługami platformy Azure, zapewniając bezproblemowe środowisko dla użytkowników z zwiększonymi zabezpieczeniami, wydajnością i skalowalnością. Umożliwia wykonywanie zadań opartych na danych, takich jak przygotowywanie danych, uczenie maszynowe i przepływy pracy nauki o danych, dzięki czemu jest to uniwersalne narzędzie dla organizacji chcących wykorzystać możliwości danych big data.
Najważniejsze funkcje usługi Azure Databricks obejmują natywną integrację z identyfikatorem Entra firmy Microsoft oraz możliwość korzystania z innych usług platformy Azure, takich jak Azure Storage, Azure Data Lake Storage i Azure Cosmos DB. Platforma oferuje również interaktywny obszar roboczy, który ułatwia współpracę między analitykami danych, inżynierami danych i analitykami biznesowymi. Ta współpraca wsparcie środowiska różnych języków programowania, takich jak Python, Scala, R i SQL, dzięki czemu zespoły mogą wydajnie opracowywać i iterować modele danych. Ponadto usługa Azure Databricks jest przeznaczona do łatwego skalowania, zarządzania zarówno wymaganiami obliczeniowymi algorytmów uczenia maszynowego, jak i potrzebami przetwarzania dużych zestawów danych.
Tworzenie obszaru roboczego usługi Azure Databricks
Aby korzystać z usługi Azure Databricks, musisz utworzyć obszar roboczy usługi Azure Databricks w ramach subskrypcji platformy Azure. Można to zrobić, wykonując następujące czynności:
- Korzystanie z interfejsu użytkownika witryny Azure Portal
- Korzystanie z szablonu usługi Azure Resource Manager (ARM) lub Bicep
- Za pomocą polecenia cmdlet New-AzDatabricksWorkspace programu Azure PowerShell
- Za pomocą polecenia az databricks workspace create Interfejs wiersza polecenia platformy Azure
Podczas tworzenia obszaru roboczego należy określić jedną z następujących warstw cenowych.
- Standardowa — podstawowe możliwości platformy Apache Spark z integracją identyfikatora Entra firmy Microsoft.
- Premium — kontrola dostępu oparta na rolach i inne funkcje na poziomie przedsiębiorstwa.
- Wersja próbna — 14-dniowa bezpłatna wersja próbna obszaru roboczego na poziomie premium
Korzystanie z portalu usługi Azure Databricks
Po aprowizacji obszaru roboczego usługi Azure Databricks możesz użyć portalu usługi Azure Databricks do pracy z danymi i zasobami obliczeniowymi. Portal usługi Azure Databricks to internetowy interfejs użytkownika, w którym można tworzyć zasoby obszaru roboczego i zarządzać nimi, takie jak klastry Spark, oraz używać notesów i zapytań do pracy z danymi w plikach i tabelach.