Delen via


Wat is de Databricks CLI?

Notitie

Deze informatie is van toepassing op Databricks CLI-versies 0.205 en hoger. De Databricks CLI bevindt zich in openbare preview.

Databricks CLI-gebruik is onderhevig aan de Databricks-licentie en de privacyverklaring van Databricks, met inbegrip van alle bepalingen voor gebruiksgegevens.

De Databricks-opdrachtregelinterface (ook wel bekend als de Databricks CLI) biedt een hulpprogramma voor het automatiseren van het Azure Databricks-platform vanuit uw terminal-, opdrachtprompt- of automatiseringsscripts. U kunt ook Databricks CLI-opdrachten uitvoeren vanuit een Databricks-werkruimte met behulp van een webterminal. Zie Shell-opdrachten uitvoeren in de Azure Databricks-webterminal.

Als u verificatie voor de Databricks CLI wilt installeren en configureren, raadpleegt u De Databricks CLI en verificatie voor de Databricks CLI installeren of bijwerken.

Informatie voor verouderde Databricks CLI-gebruikers

Hoe werkt de Databricks CLI?

De CLI verpakt de Databricks REST API, die eindpunten biedt voor het wijzigen of aanvragen van informatie over Azure Databricks-account- en werkruimteobjecten. Zie de naslaginformatie over de REST API van Azure Databricks.

Als u bijvoorbeeld informatie over een afzonderlijk cluster in een werkruimte wilt afdrukken, voert u de CLI als volgt uit:

databricks clusters get 1234-567890-a12bcde3

Met curlis de equivalente bewerking als volgt:

curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
     --header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
     --data '{ "cluster_id": "1234-567890-a12bcde3" }'

Voorbeeld: een Azure Databricks-taak maken

In het volgende voorbeeld wordt de CLI gebruikt om een Azure Databricks-taak te maken. Deze taak bevat één taak. Met deze taak wordt het opgegeven Azure Databricks-notebook uitgevoerd. Dit notebook heeft een afhankelijkheid van een specifieke versie van het PyPI-pakket met de naam wheel. Als u deze taak wilt uitvoeren, maakt de taak tijdelijk een taakcluster waarmee een omgevingsvariabele met de naam PYSPARK_PYTHONwordt geëxporteerd. Nadat de taak is uitgevoerd, wordt het cluster beëindigd.

databricks jobs create --json '{
  "name": "My hello notebook job",
  "tasks": [
    {
      "task_key": "my_hello_notebook_task",
      "notebook_task": {
        "notebook_path": "/Workspace/Users/someone@example.com/hello",
        "source": "WORKSPACE"
      },
      "libraries": [
        {
          "pypi": {
            "package": "wheel==0.41.2"
          }
        }
      ],
      "new_cluster": {
        "spark_version": "13.3.x-scala2.12",
        "node_type_id": "Standard_DS3_v2",
        "num_workers": 1,
        "spark_env_vars": {
          "PYSPARK_PYTHON": "/databricks/python3/bin/python3"
        }
      }
    }
  ]
}'

Volgende stappen