Delen via


Shell-opdrachten uitvoeren in azure Databricks-webterminal

De Azure Databricks-webterminal biedt een handige en zeer interactieve manier om shell-opdrachten uit te voeren in een opdrachtregelinterface (CLI), waaronder Databricks CLI-opdrachten, om programmatisch acties uit te voeren op Databricks-objecten. Het is vooral handig voor geavanceerde gebruiksvoorbeelden, zoals batchbewerkingen op meerdere bestanden, die bestaande gebruikersinterfaces (UIS's) mogelijk niet volledig ondersteunen.

Meerdere gebruikers kunnen de webterminal op één rekenproces gebruiken.

U kunt de webterminal gebruiken om het volgende te doen:

  • Maak snelle bestandsbewerkingen met behulp van Vim of Emacs.
  • Bewaak het resourcegebruik met opdrachten zoals htop (clustergebruik) of nvidia-smi (GPU-gebruik).
  • Voer niet-Spark Python-scripts uit.
  • Voer bestandsbewerkingen uit met shell-opdrachten zoals mv en mkdir.
  • Bibliotheken installeren en beheren op rekenkracht.
  • Gebruik de Databricks CLI om verschillende aspecten van Azure Databricks te automatiseren.

Vereisten

Waarschuwing

Azure Databricks proxyt de webterminalservice vanaf poort 7681 op het Spark-stuurprogramma van de rekenkracht. Deze webproxy is alleen bedoeld voor gebruik met de webterminal. Als de poort bezet is wanneer de berekening wordt gestart of er een conflict is, werkt de webterminal mogelijk niet zoals verwacht. Als andere webservices worden gestart op poort 7681, kunnen rekengebruikers worden blootgesteld aan mogelijke beveiligingsexplots. Databricks en Microsoft zijn niet verantwoordelijk voor problemen die het gevolg zijn van de installatie van niet-ondersteunde software op een rekenproces.

  • Webterminal is standaard uitgeschakeld voor alle werkruimtegebruikers. Zie De webterminal inschakelen om deze in te schakelen.
  • KAN BIJVOEGEN AAN machtiging voor een berekening.
  • De berekening moet gebruikmaken van een toegangsmodus voor één gebruiker of geen isolatie gedeeld. Voor Databricks Runtime 15.1 en hoger wordt een toegangsmodus die is ingesteld op Gedeelde ook ondersteund.

De webterminal starten

U kunt de webterminal starten vanaf de pagina met rekengegevens of vanuit een notebook.

Vanuit een notitieblok

De webterminal starten vanuit een notebook:

  1. Verbind het notebook om te berekenen.
  2. Klik onder aan de rechterzijbalk van het notitieblok op het pictogram van het Open bottom panel in notebookonderste deelvenster openen.
  3. U kunt ook op de gekoppelde vervolgkeuzelijst voor berekeningen klikken, de muisaanwijzer op de gekoppelde rekenkracht bewegen en vervolgens op Web Terminal klikken.

De webterminal wordt geopend in een paneel onderaan het scherm. Met de knoppen in de rechterbovenhoek van het deelvenster kunt u het volgende doen:

  • Open een nieuwe terminalsessie op een nieuw tabblad een nieuwe terminalsessie openen.
  • Een terminalsessie terminalsessie opnieuw ladenopnieuw laden.
  • Sluit het onderste paneel onderste paneel sluiten. Als u het deelvenster opnieuw wilt openen, klikt u onderste paneel opnieuw openen onderaan de rechterzijbalk.

Op de pagina rekengegevens

De webterminal starten vanaf de pagina met rekengegevens:

  1. Klik in de zijbalk van de werkruimte op Compute.
  2. Klik op het tabblad Alles berekenen op de naam van de berekening.
  3. Klik op Start om het rekenproces te starten.
  4. Klik op het tabblad Apps op Web Terminal.

Er wordt een nieuw tabblad geopend met de gebruikersinterface van de webterminal en de Bash-prompt.

Webterminal gebruiken

In de webterminal kunt u opdrachten uitvoeren vanuit de hoofdmap in de container van het knooppunt van het rekenstuurprogramma.

Elke gebruiker kan maximaal 100 actieve webterminalsessies (tabbladen) openen. Er kan een time-out optreden voor niet-actieve webterminalsessies en de webterminalwebtoepassing wordt opnieuw verbonden, wat resulteert in een nieuw shell-proces. Als u uw Bash-sessie wilt behouden, raadt Databricks het gebruik van tmux aan.

Databricks CLI-opdrachten uitvoeren

U kunt de webterminal ook gebruiken om Databricks CLI-opdrachten uit te voeren. De beschikbare CLI is altijd de nieuwste versie en verificatie is gebaseerd op de huidige gebruiker. De berekening moet voldoen aan de volgende vereisten:

  • Voor het cluster moet Databricks Runtime 15.0 of hoger zijn geïnstalleerd.
  • De werkruimte mag niet zijn ingeschakeld voor Private Link.

Start de webterminal en voer de volgende opdracht uit om informatie over de huidige gebruiker uit te voeren:

   databricks current-user me

Bundelopdrachten zijn ook beschikbaar, waarmee u uw Databricks Asset Bundles rechtstreeks vanuit de webterminal in de Databricks-werkruimte kunt maken en beheren. Als u bijvoorbeeld een eenvoudige bundel wilt maken, implementeren en uitvoeren met behulp van de standaardsjabloon:

  1. Navigeer vanuit de hoofdmap van de webterminal naar de startpagina van uw werkruimte en voer het volgende uit bundle init:

    cd /Workspace/Users/someone@example.com
    databricks bundle init
    
  2. Accepteer de standaardsjabloonprompts en ga vervolgens naar de bundelmap en implementeer deze:

    cd my_project
    databricks bundle deploy
    

    U kunt de geïmplementeerde my_project bundel bekijken in de gebruikersinterface van de Databricks-werkruimte.

  3. Voer ten slotte de standaardtaak uit in de bundel:

    databricks bundle run my_project_job
    

    Navigeer naar Taakuitvoeringen om de actieve taak te zien.

Uw webterminal configureren

U kunt permanente configuraties voor uw webterminal instellen met behulp van .bashrc-configuratiebestanden.

Databricks haalt automatisch bestanden met de naam .bashrc op uit de thuismap van het bestandssysteem van je werkruimte. Instellingen van deze bestanden worden automatisch geactiveerd telkens wanneer u een nieuwe terminalsessie start.

Als u andere bestanden (zoals .zshrc) wilt bronen voor uw webterminal-ervaring, moet u deze bron gebruiken vanuit uw bashrc-bestand om de configuratie te behouden.

Sla alle configuratiebestanden op in uw werkruimtemap, waar u ze kunt configureren met behulp van een teksteditor.

Beperkingen

  • Azure Databricks biedt geen ondersteuning voor het uitvoeren van Spark-taken vanuit de webterminal.

  • Azure Databricks-webterminal is niet beschikbaar in de volgende rekentypen:

    • Taak berekenen
    • Serverloze compute
    • Compute gestart met de DISABLE_WEB_TERMINAL=true omgevingsvariabeleset.
    • Compute gestart met -toegangsmodus ingesteld op Gedeelde op Databricks Runtime onder 15.1. De webterminal is beschikbaar op gedeelde berekeningen voor Databricks Runtime 15.1 en hoger.
    • Compute gestart met de Spark-configuratie spark.databricks.pyspark.enableProcessIsolation ingesteld op true.
  • Er is een vaste limiet van 12 uur sinds de eerste pagina wordt geladen, waarna een verbinding, zelfs als actief, wordt beëindigd. U kunt de webterminal vernieuwen om opnieuw verbinding te maken. Databricks raadt het gebruik van tmux aan om uw shell-sessie te behouden.

  • ARM-rekenresources kunnen geen webterminals gebruiken voor toegang tot werkruimtebestanden, inclusief bestanden in Git-mappen.

  • Als u Docker Container Services inschakelt, wordt de webterminal uitgeschakeld.