Wat is de Databricks CLI?
Notitie
Deze informatie is van toepassing op Databricks CLI-versies 0.205 en hoger. De Databricks CLI bevindt zich in openbare preview.
Databricks CLI-gebruik is onderhevig aan de Databricks-licentie en de privacyverklaring van Databricks, met inbegrip van alle bepalingen voor gebruiksgegevens.
De Databricks-opdrachtregelinterface (ook wel bekend als de Databricks CLI) biedt een hulpprogramma voor het automatiseren van het Azure Databricks-platform vanuit uw terminal-, opdrachtprompt- of automatiseringsscripts. U kunt ook Databricks CLI-opdrachten uitvoeren vanuit een Databricks-werkruimte met behulp van een webterminal. Zie Shell-opdrachten uitvoeren in de Azure Databricks-webterminal.
Als u verificatie voor de Databricks CLI wilt installeren en configureren, raadpleegt u De Databricks CLI en verificatie voor de Databricks CLI installeren of bijwerken.
Informatie voor verouderde Databricks CLI-gebruikers
- Databricks-abonnementen bieden geen ondersteuning of nieuwe functies voor de verouderde Databricks CLI.
- Zie Databricks CLI (verouderd) voor meer informatie over de verouderde Databricks CLI.
- Als u wilt migreren van Databricks CLI versie 0.18 of lager naar Databricks CLI versie 0.205 of hoger, raadpleegt u de Cli-migratie van Databricks.
Hoe werkt de Databricks CLI?
De CLI verpakt de Databricks REST API, die eindpunten biedt voor het wijzigen of aanvragen van informatie over Azure Databricks-account- en werkruimteobjecten. Zie de naslaginformatie over de REST API van Azure Databricks.
Als u bijvoorbeeld informatie over een afzonderlijk cluster in een werkruimte wilt afdrukken, voert u de CLI als volgt uit:
databricks clusters get 1234-567890-a12bcde3
Met curl
is de equivalente bewerking als volgt:
curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
--header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
--data '{ "cluster_id": "1234-567890-a12bcde3" }'
Voorbeeld: een Azure Databricks-taak maken
In het volgende voorbeeld wordt de CLI gebruikt om een Azure Databricks-taak te maken. Deze taak bevat één taak. Met deze taak wordt het opgegeven Azure Databricks-notebook uitgevoerd. Dit notebook heeft een afhankelijkheid van een specifieke versie van het PyPI-pakket met de naam wheel
. Als u deze taak wilt uitvoeren, maakt de taak tijdelijk een taakcluster waarmee een omgevingsvariabele met de naam PYSPARK_PYTHON
wordt geëxporteerd. Nadat de taak is uitgevoerd, wordt het cluster beëindigd.
databricks jobs create --json '{
"name": "My hello notebook job",
"tasks": [
{
"task_key": "my_hello_notebook_task",
"notebook_task": {
"notebook_path": "/Workspace/Users/someone@example.com/hello",
"source": "WORKSPACE"
},
"libraries": [
{
"pypi": {
"package": "wheel==0.41.2"
}
}
],
"new_cluster": {
"spark_version": "13.3.x-scala2.12",
"node_type_id": "Standard_DS3_v2",
"num_workers": 1,
"spark_env_vars": {
"PYSPARK_PYTHON": "/databricks/python3/bin/python3"
}
}
}
]
}'
Volgende stappen
- Zie de zelfstudie over Databricks CLI voor meer informatie over het installeren en gebruiken van de CLI.
- Zie De Databricks CLI installeren of bijwerken om de zelfstudie over te slaan en alleen de CLI te installeren.
- Zie Verificatie voor de Databricks CLI om verificatie in te stellen tussen de CLI en uw Azure Databricks-accounts en -werkruimten.
- Als u configuratieprofielen wilt gebruiken om snel te schakelen tussen gerelateerde groepen CLI-instellingen, raadpleegt u Configuratieprofielen voor de Databricks CLI.
- Zie Basisgebruik voor de Databricks CLI voor meer informatie over basisgebruik voor de CLI.
- Zie Databricks CLI-opdrachten voor hulp bij CLI-opdrachten.