Aan de slag met Azure Databricks

Voltooid

Azure Databricks is een cloudplatform voor gegevensanalyse dat een geïntegreerde omgeving biedt voor data engineering, machine learning en analyses. Azure Databricks is ontworpen in samenwerking met Databricks, waarvan het leiderschap Apache Spark heeft gemaakt. Azure Databricks biedt een snelle, eenvoudige en gezamenlijke analyseservice op basis van Apache Spark. Dit platform integreert diep met de andere services van Azure en biedt gebruikers een naadloze ervaring met verbeterde beveiliging, prestaties en schaalbaarheid. Het maakt gegevensgestuurde taken mogelijk, zoals gegevensvoorbereiding, machine learning en data science-werkstromen, waardoor het een veelzijdig hulpmiddel is voor organisaties die de kracht van big data willen benutten.

Belangrijke functies van Azure Databricks omvatten de systeemeigen integratie met Microsoft Entra ID en de mogelijkheid om andere Azure-services te gebruiken, zoals Azure Storage, Azure Data Lake Storage en Azure Cosmos DB. Het platform biedt ook een interactieve werkruimte die samenwerking tussen gegevenswetenschappers, data engineers en bedrijfsanalisten mogelijk maakt. Deze samenwerking omgevingsondersteuning verschillende programmeertalen zoals Python, Scala, R en SQL, zodat teams hun gegevensmodellen efficiënt kunnen ontwikkelen en herhalen. Bovendien is Azure Databricks ontworpen om eenvoudig te schalen, om zowel de rekenvereisten van machine learning-algoritmen als de verwerkingsbehoeften van grote gegevenssets te beheren.

Een Azure Databricks-werkruimte maken

Als u Azure Databricks wilt gebruiken, moet u een Azure Databricks-werkruimte maken in uw Azure-abonnement. U kunt dit doen door:

  • De gebruikersinterface van Azure Portal gebruiken
  • Een Arm-sjabloon (Azure Resource Manager) of Bicep gebruiken
  • De Cmdlet New-AzDatabricksWorkspace Azure PowerShell gebruiken
  • De opdracht az databricks workspace create Azure command line interface (CLI)

Wanneer u een werkruimte maakt, moet u een van de volgende prijscategorieën opgeven.

  • Standard - Core Apache Spark-mogelijkheden met Microsoft Entra ID-integratie.
  • Premium: op rollen gebaseerd toegangsbeheer en andere functies op ondernemingsniveau.
  • Proefversie - Een gratis proefversie van 14 dagen van een werkruimte op premiumniveau

Azure Databricks

De Azure Databricks-portal gebruiken

Nadat u een Azure Databricks-werkruimte hebt ingericht, kunt u de Azure Databricks-portal gebruiken om te werken met gegevens en rekenresources. De Azure Databricks-portal is een webgebruikersinterface waarin u werkruimtebronnen, zoals Spark-clusters, kunt maken en beheren, en notebooks en query's kunt gebruiken om met gegevens in bestanden en tabellen te werken.

Azure Databricks-portal