Dela via


Snabbstart: Skapa en Azure Databricks-arbetsyta i ditt eget virtuella nätverk

Standarddistributionen av Azure Databricks skapar ett nytt virtuellt nätverk som hanteras av Databricks. Den här snabbstarten visar hur du skapar en Azure Databricks-arbetsyta i ditt eget virtuella nätverk i stället. Du kan också skapa ett Apache Spark-kluster på den arbetsytan.

Mer information om varför du kan välja att skapa en Azure Databricks-arbetsyta i ditt eget virtuella nätverk finns i Distribuera Azure Databricks i ditt Virtuella Azure-nätverk (VNet-inmatning).

Förutsättningar

  • Om du inte har någon Azure-prenumeration kan du skapa ett kostnadsfritt konto. Den här självstudien kan inte utföras med en kostnadsfri utvärderingsprenumeration i Azure. Om du har ett kostnadsfritt konto går du till din profil och ändrar prenumerationen till Betala per användning. Mer information finns i Kostnadsfritt Azure-konto. Sedan ta bort utgiftsgränsenoch begära en kvotökning för virtuella processorer i din region. När du skapar din Azure Databricks-arbetsyta kan du välja utvärderingsversion (Premium – 14 dagars kostnadsfria DBUs) prisnivå för att ge arbetsytan åtkomst till kostnadsfria Premium Azure Databricks DBUs i 14 dagar.

  • Du måste vara Azure-deltagare eller ägare, eller så måste resursprovidern Microsoft.ManagedIdentity vara registrerad i din prenumeration. Anvisningar finns i Registrera resursprovider.

Logga in på Azure-portalen

Logga in på Azure-portalen.

Kommentar

Om du vill skapa en Azure Databricks-arbetsyta i Azure Commercial Cloud som innehåller amerikanska myndighetsefterlevnadscertifieringar som FedRAMP High kontaktar du ditt Microsoft- eller Databricks-kontoteam för att få åtkomst till den här upplevelsen.

Skapa ett virtuellt nätverk

  1. På menyn i Azure-portalen väljer du Skapa en resurs. Välj sedan Nätverk > Virtuellt nätverk.

    Skapa ett virtuellt nätverk på Azure Portal

  2. Under Skapa virtuellt nätverk använder du följande inställningar:

    Inställning Föreslaget värde beskrivning
    Prenumeration <Din prenumeration> Välj den Azure-prenumeration som du vill använda.
    Resursgrupp databricks-snabbstart Välj Skapa ny och ange ett nytt resursgruppnamn för ditt konto.
    Name databricks-snabbstart Välj ett namn för det virtuella nätverket.
    Region <Välj den region som är närmast användarna> Välj en geografisk plats där du kan vara värd för ditt virtuella nätverk. Använd den plats som är närmast dina användare.

    Grunderna för ett virtuellt nätverk på Azure Portal

  3. Välj Nästa: IP-adresser > och tillämpa följande inställningar. Välj sedan Granska + skapa.

    Inställning Föreslaget värde beskrivning
    IPv4-adressutrymme 10.2.0.0/16 Det virtuella nätverkets adressintervall i CIDR-notation. CIDR-intervallet måste vara mellan /16 och /24
    Namn på undernät standard Välj ett namn för standardundernätet i det virtuella nätverket.
    Undernätsadressintervall 10.2.0.0/24 Undernätets adressintervall i CIDR-notation. Den måste finnas i adressutrymmet för det virtuella nätverket. Adressintervallet för ett undernät som används kan inte redigeras.

    Ange IP-konfigurationer för ett virtuellt nätverk på Azure-portalen

  4. På fliken Granska + skapa väljer du Skapa för att distribuera det virtuella nätverket. När distributionen är klar navigerar du till det virtuella nätverket och väljer Adressutrymme under Inställningar. I rutan Lägg till ytterligare adressintervallinfogar du 10.179.0.0/16 och väljer Spara.

    Adressutrymme för virtuellt Azure-nätverk

Skapa en Azure Databricks-arbetsyta

  1. På menyn i Azure-portalen väljer du Skapa en resurs. Välj sedan Analytics > Databricks.

    Skapa en Azure Databricks-arbetsyta på Azure Portal

  2. Under Azure Databricks Service använder du följande inställningar:

    Inställning Föreslaget värde beskrivning
    Namn på arbetsyta databricks-snabbstart Välj ett namn för din Azure Databricks-arbetsyta.
    Prenumeration <Din prenumeration> Välj den Azure-prenumeration som du vill använda.
    Resursgrupp databricks-snabbstart Välj samma resursgrupp som du använde för det virtuella nätverket.
    Plats <Välj den region som är närmast användarna> Välj samma plats som det virtuella nätverket.
    Prisnivå Välj mellan Standard och Premium. Mer information om prisnivåer finns på prissättningssidan för Databricks.

    Skapa grunderna för en Azure Databricks-arbetsyta

  3. När du har angett inställningar på sidan Grundläggande väljer du Nästa: Nätverk > och tillämpar följande inställningar:

    Inställning Föreslaget värde beskrivning
    Distribuera Azure Databricks-arbetsytan i ditt virtuella nätverk (VNet) Ja Med den här inställningen kan du distribuera en Azure Databricks-arbetsyta i ditt virtuella nätverk.
    Virtual Network databricks-snabbstart Välj det virtuella nätverk som du skapade i föregående avsnitt.
    Namn på offentligt undernät public-subnet Använd standardnamnet för det offentliga undernätet.
    CIDR-intervall för offentligt undernät 10.179.64.0/18 Använd ett CIDR-intervall upp till och med /26.
    Namn på privat undernät privat undernät Använd standardnamnet för det privata undernätet.
    CIDR-intervall för privat undernät 10.179.0.0/18 Använd ett CIDR-intervall upp till och med /26.

    Lägga till VNet-information i Azure Databricks-arbetsytan på Azure Portal

  4. När distributionen är klar går du till Azure Databricks-resursen. Observera att peering för virtuella nätverk är inaktiverat. Observera även resursgruppen och den hanterade resursgruppen på översiktssidan.

    Översikt över Azure Databricks i Azure Portal

    Den hanterade resursgruppen kan inte ändras och används inte för att skapa virtuella datorer. Du kan bara skapa virtuella datorer i den resursgrupp som du hanterar.

    Azure Databricks-hanterad resursgrupp

    När en arbetsytedistribution misslyckas skapas arbetsytan fortfarande i ett misslyckat tillstånd. Ta bort den misslyckade arbetsytan och skapa en ny arbetsyta som löser distributionsfelen. När du tar bort den misslyckade arbetsytan tas även den hanterade resursgruppen och eventuella distribuerade resurser bort.

Skapa ett kluster

Kommentar

Om du vill använda ett kostnadsfritt konto för att skapa Azure Databricks-klustret ska du innan du skapar klustret gå till din profil och ändra prenumerationen till betala per användning. Mer information finns i Kostnadsfritt Azure-konto.

  1. Gå tillbaka till Azure Databricks-tjänsten och välj Starta arbetsyta på sidan Översikt.

  2. Välj kluster>+ Skapa kluster. Skapa sedan ett klusternamn, till exempel databricks-quickstart-cluster, och acceptera de återstående standardinställningarna. Välj Skapa kluster.

    Skapa Azure Databricks-kluster

  3. När klustret körs återgår du till den hanterade resursgruppen i Azure Portal. Observera de nya virtuella datorerna, diskarna, IP-adressen och nätverksgränssnitten. Ett nätverksgränssnitt skapas i vart och ett av de offentliga och privata undernäten med IP-adresser.

  4. Gå tillbaka till din Azure Databricks-arbetsyta och välj det kluster som du skapade. Gå sedan till fliken Köresidan Spark-användargränssnitt . Observera att adresserna för drivrutinen och körarna finns i det privata undernätsintervallet. I det här exemplet är drivrutinen 10.179.0.6 och köre är 10.179.0.4 och 10.179.0.5. Dina IP-adresser kan vara olika.

    Azure Databricks Spark UI-utförare

Rensa resurser

När du är klar med artikeln kan du avsluta klustret. Det gör du genom att välja Klusteri den vänstra rutan från Arbetsytan Azure Databricks. För klustret som du vill avsluta flyttar du markören över ellipsen under kolumnen Actions och väljer ikonen Avsluta. Detta stoppar klustret.

Om du inte manuellt avslutar klustret kommer det att stoppas automatiskt, förutsatt att du har markerat kryssrutan Avsluta efter ___ minuters inaktivitet när klustret skapades. I sådant fall stoppas klustret automatiskt om det har varit inaktivt under den angivna tiden.

Om du inte vill återanvända klustret kan du ta bort resursgruppen som du skapade i Azure Portal.

Nästa steg

I den här artikeln skapade du ett Spark-kluster i Azure Databricks som du distribuerade till ett virtuellt nätverk. Gå vidare till nästa artikel för att lära dig hur du frågar en SQL Server Linux Docker-container i det virtuella nätverket med hjälp av JDBC från en Azure Databricks-notebook-fil.

Fråga en SQL Server Linux Docker-container i ett virtuellt nätverk från en Azure Databricks-notebook-fil