fs
opdrachtgroep
Notitie
Deze informatie is van toepassing op Databricks CLI-versies 0.205 en hoger. De Databricks CLI bevindt zich in openbare preview.
Databricks CLI-gebruik is onderhevig aan de Databricks-licentie en de privacyverklaring van Databricks, met inbegrip van alle bepalingen voor gebruiksgegevens.
Met de fs
opdrachtgroep in de Databricks CLI kunt u volumes automatiseren in Unity Catalog en DBFS--objecten (Databricks File System) automatiseren.
U voert opdrachten uit fs
door ze toe te voegen aan databricks fs
. Als u help voor de fs
opdracht wilt weergeven, voert u het volgende uit databricks fs -h
.
fs
voor opdrachten moeten volumepaden beginnen met dbfs:/Volumes
en moeten map- en bestandspaden in DBFS beginnen dbfs:/
.
Belangrijk
Het gebruik van de Databricks CLI of REST API's met firewall-ingeschakelde opslagcontainers wordt niet ondersteund. Databricks raadt u aan om Databricks Connect of az storagete gebruiken.
De inhoud van een map weergeven
Als u de inhoud van een map in een volume of in DBFS wilt weergeven, gebruikt u de opdracht ls
. Geef het pad naar de map op. De volgende voorbeelden bevatten de namen van de objecten die zijn gevonden in de hoofdmap van het opgegeven volume of in de DBFS-hoofdmap:
databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/
Als u volledige informatie wilt weergeven, zoals objecttypen, grootten, wijzigingstijden sinds Epoch in milliseconden, evenals de namen van de objecten, gebruikt u de --long
of -l
optie. In de volgende voorbeelden wordt een lijst gegeven van de volledige informatie van de objecten in de hoofdmap van het opgegeven volume of in een tmp
directory binnen de DBFS-hoofdmap.
databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l
Als u volledige objectpaden wilt weergeven, gebruikt u de --absolute
optie. In de volgende voorbeelden ziet u de volledige informatie van de objecten en de volledige paden van de objecten, gevonden in de hoofdmap van het opgegeven volume of in een tmp
map in de DBFS-hoofdmap:
databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute
De inhoud van een bestand uitvoeren
Gebruik de cat
opdracht om de inhoud van een bestand uit te voeren. Geef het pad op naar het bestand in DBFS. In de volgende voorbeelden wordt de inhoud van het bestand met de naam weergegeven babynames.csv
in de hoofdmap van het opgegeven volume of in een tmp
map in de DBFS-hoofdmap:
databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv
In de volgende voorbeelden worden fouten geretourneerd, omdat ze proberen de inhoud van een map uit te voeren in plaats van een bestand:
databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp
Een map maken
Gebruik de mkdir
opdracht om een map te maken. Geef het pad op naar de map die moet worden gemaakt in een volume of in DBFS. Als de map al bestaat, gebeurt er niets. In de volgende voorbeelden wordt een map gemaakt met de naam squirrel-data
binnen de hoofdmap van het opgegeven volume of in een map met de tmp
naam in de DBFS-hoofdmap:
databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data
Een map of bestand kopiëren
Als u een map of bestand wilt kopiëren, gebruikt u de cp
opdracht. Geef de paden op naar de bronmap of het bronbestand die u wilt kopiëren en de bestemming ervan. U kunt mappen en bestanden kopiëren tussen het lokale bestandssysteem en DBFS en u kunt mappen en bestanden tussen DBFS-paden kopiëren. Als u bestaande bestanden wilt overschrijven, gebruikt u de --overwrite
optie. Als u recursief bestanden in een map wilt kopiëren, gebruikt u de --recursive
of -r
optie.
Bij het weglaten van de cp
opdracht wordt ervan uitgegaanfile:/
file:/
.
In de volgende voorbeelden kopieert u een map met de naam squirrel-data
en de inhoud, van een lokaal bestandssysteempad naar een squirrels
map in de hoofdmap van het opgegeven volume of de DBFS-hoofdmap.
databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r
In het volgende voorbeeld wordt een bestand met de naam squirrels.csv
gekopieerd van een lokaal bestandssysteempad naar een map met de squirrel-data
naam in de hoofdmap van het opgegeven volume of de DBFS-hoofdmap. Als het bestand al in de bestemming bestaat, wordt het overschreven.
databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite
Een map verwijderen
Als u een map wilt verwijderen, gebruikt u de opdracht rm
. Geef het pad op naar de bestaande map in DBFS. In de volgende voorbeelden wordt een map met de naam squirrel-data
verwijderd uit de hoofdmap van het opgegeven volume of uit een tmp
map in de DBFS-hoofdmap:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data
Als de map niet bestaat, gebeurt er niets en wordt er geen fout geretourneerd.
Als de map bestaat maar niet leeg is, wordt er een fout geretourneerd. Als u een niet-lege map en alle inhoud ervan wilt verwijderen, gebruikt u de optie --recursive
of -r
. In de volgende voorbeelden verwijdert u een niet-lege map met de naam squirrel-data
uit de hoofdmap van het opgegeven volume of uit een tmp
map in de DBFS-hoofdmap:
databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r