Komma igång med Azure Databricks

Slutförd

Azure Databricks är en molnbaserad dataanalysplattform som tillhandahåller en enhetlig miljö för datateknik, maskininlärning och analys. Azure Databricks har utformats i samarbete med Databricks, vars ledarskap skapade Apache Spark. Azure Databricks erbjuder en snabb, enkel och samarbetsbaserad Apache Spark-baserad analystjänst. Den här plattformen integreras djupt med Azures andra tjänster, vilket ger en sömlös upplevelse för användare med förbättrad säkerhet, prestanda och skalbarhet. Det möjliggör datadrivna uppgifter som förberedelse av data, maskininlärning och arbetsflöden för datavetenskap, vilket gör det till ett mångsidigt verktyg för organisationer som vill utnyttja stordatakraften.

Viktiga funktioner i Azure Databricks är den interna integreringen med Microsoft Entra ID och dess förmåga att använda andra Azure-tjänster som Azure Storage, Azure Data Lake Storage och Azure Cosmos DB. Plattformen erbjuder också en interaktiv arbetsyta som underlättar samarbete mellan dataforskare, datatekniker och affärsanalytiker. Det här samarbetet omgivningsstöd olika programmeringsspråk som Python, Scala, R och SQL, så att teamen kan utveckla och iterera sina datamodeller effektivt. Dessutom är Azure Databricks utformat för att skala enkelt och hantera både beräkningskraven för maskininlärningsalgoritmer och bearbetningsbehoven för stora datamängder.

Skapa en Azure Databricks-arbetsyta

Om du vill använda Azure Databricks måste du skapa en Azure Databricks-arbetsyta i din Azure-prenumeration. Du kan göra detta genom att:

  • Använda användargränssnittet för Azure Portal
  • Använda en Azure Resource Manager -mall (ARM) eller Bicep
  • Använda Azure PowerShell-cmdleten New-AzDatabricksWorkspace
  • Med kommandot az databricks workspace create Azure command line interface (CLI)

När du skapar en arbetsyta måste du ange någon av följande prisnivåer.

  • Standard – Apache Spark-kärnfunktioner med Microsoft Entra ID-integrering.
  • Premium – Rollbaserade åtkomstkontroller och andra funktioner på företagsnivå.
  • Utvärdering – En 14-dagars kostnadsfri utvärderingsversion av en arbetsyta på premiumnivå

Azure Databricks

Använda Azure Databricks-portalen

När du har etablerat en Azure Databricks-arbetsyta kan du använda Azure Databricks-portalen för att arbeta med data- och beräkningsresurser. Azure Databricks-portalen är ett webbaserat användargränssnitt där du kan skapa och hantera arbetsyteresurser, till exempel Spark-kluster, och använda notebook-filer och frågor för att arbeta med data i filer och tabeller.

Azure Databricks-portalen