DBFS CLI (starší verze)
Důležité
Tato dokumentace byla vyřazena a nemusí být aktualizována.
Tyto informace platí pro starší verzi Rozhraní příkazového řádku Databricks verze 0.18 a novější. Databricks doporučuje místo toho použít novější rozhraní příkazového řádku Databricks verze 0.205 nebo vyšší. Podívejte se, co je rozhraní příkazového řádku Databricks? Pokud chcete zjistit svou verzi rozhraní příkazového řádku Databricks, spusťte databricks -v
příkaz .
Pokud chcete migrovat z Rozhraní příkazového řádku Databricks verze 0.18 nebo novější na Databricks CLI verze 0.205 nebo novější, přečtěte si téma Migrace rozhraní příkazového řádku Databricks.
Spustíte podpříkazy rozhraní příkazového řádku DBFS Databricks, které je připojí k databricks fs
(nebo aliasu dbfs
), předponou všech cest DBFS pomocí dbfs:/
. Tyto dílčí příkazy volají rozhraní DBFS API.
databricks fs -h
Usage: databricks fs [OPTIONS] COMMAND [ARGS]...
Utility to interact with DBFS. DBFS paths are all prefixed
with dbfs:/. Local paths can be absolute or local.
Options:
-v, --version
-h, --help Show this message and exit.
Commands:
cat Shows the contents of a file. Does not work for directories.
configure
cp Copies files to and from DBFS.
Options:
-r, --recursive
--overwrite Overwrites files that exist already.
ls Lists files in DBFS.
Options:
--absolute Displays absolute paths.
-l Displays full information including size and file type.
mkdirs Makes directories in DBFS.
mv Moves a file between two DBFS paths.
rm Removes files from DBFS.
Options:
-r, --recursive
U operací, které vypisují, přesunují nebo odstraňují více než 10 tisíc souborů, důrazně nedoporučujeme používat rozhraní příkazového řádku DBFS.
- Operace
list
(databricks fs ls
) vyprší po přibližně 60s. - Operace
move
(databricks fs mv
) vyprší po přibližně 60 sekundách, což může mít za následek částečně přesunutá data. - Operace
delete
(databricks fs rm
) postupně odstraní dávky souborů.
Tyto operace doporučujeme provádět v kontextu clusteru pomocí nástroje systému souborů (dbutils.fs). dbutils.fs
pokrývá funkční rozsah rozhraní REST API DBFS, ale z poznámkových bloků. Spouštění takových operací pomocí poznámkových bloků poskytuje lepší kontrolu, jako jsou selektivní odstranění, možnosti správy a možnost automatizovat pravidelné úlohy.
Omezení
Použití rozhraní příkazového řádku DBFS Databricks s kontejnery úložiště s podporou brány firewall se nepodporuje. Služba Databricks doporučuje použít Databricks Connect nebo az storage.
Výpis obsahu souboru
Pokud chcete zobrazit dokumentaci k použití, spusťte databricks fs cat --help
příkaz .
databricks fs cat dbfs:/tmp/my-file.txt
Apache Spark is awesome!
Kopírování souboru
Pokud chcete zobrazit dokumentaci k použití, spusťte databricks fs cp --help
příkaz .
databricks fs cp dbfs:/tmp/your_file.txt dbfs:/parent/child/grandchild/my_file.txt --overwrite
Při úspěchu tento příkaz nezobrazí nic.
Výpis informací o souborech a adresářích
Pokud chcete zobrazit dokumentaci k použití, spusťte databricks fs ls --help
příkaz .
databricks fs ls dbfs:/tmp --absolute -l
file 42408084 dbfs:/tmp/LoanStats.csv 1590005159000
file 40 dbfs:/tmp/file_b.txt 1603991038000
dir 0 dbfs:/tmp/hive 0
dir 0 dbfs:/tmp/mlflow 0
file 385 dbfs:/tmp/multi-line.json 1597770632000
dir 0 dbfs:/tmp/new 0
dir 0 dbfs:/tmp/parent 0
file 243 dbfs:/tmp/test.json 1597770628000
file 40 dbfs:/tmp/test_dbfs.txt 1603989162000
Vytvoření adresáře
Pokud chcete zobrazit dokumentaci k použití, spusťte databricks fs mkdirs --help
příkaz .
databricks fs mkdirs dbfs:/tmp/new-dir
Při úspěchu tento příkaz nezobrazí nic.
Přesunutí souboru
Pokud chcete zobrazit dokumentaci k použití, spusťte databricks fs mv --help
příkaz .
databricks fs mv dbfs:/tmp/my-file.txt dbfs:/parent/child/grandchild/my-file.txt
Při úspěchu tento příkaz nezobrazí nic.
Odstranění souboru
Pokud chcete zobrazit dokumentaci k použití, spusťte databricks fs rm --help
příkaz .
databricks fs rm dbfs:/tmp/parent/child/grandchild/my-file.txt
Delete finished successfully.