다음을 통해 공유


fs 명령 그룹

참고 항목

이 정보는 Databricks CLI 버전 0.205 이상에 적용됩니다. Databricks CLI는 공개 미리 보기제공됩니다.

Databricks CLI 사용은 사용량 현황 데이터 프로비저닝을 포함하여 Databricks 라이선스Databricks 개인 정보 보호 고지의 적용을 받습니다.

Databricks CLI 내의 명령 그룹을 사용하면 Unity 카탈로그에서 볼륨을 자동화하고 DBFS(Databricks File System) 개체를 자동화할 수 있습니다.

fs 명령을 databricks fs에 추가하여 실행합니다. fs 명령에 대한 도움말을 표시하려면 databricks fs -h를 실행합니다.

fs 명령을 사용하려면 볼륨 경로가 필요하며 dbfs:/Volumes DBFS의 디렉터리 및 파일 경로로 시작해야 dbfs:/합니다.

중요하다

방화벽 사용 스토리지 컨테이너와 함께 Databricks CLI 또는 REST API를 사용하는 것은 지원되지 않습니다. Databricks는 Databricks Connect 또는 az storage사용하는 것이 좋습니다.

디렉터리의 내용 나열

볼륨 또는 DBFS에서 디렉터리의 내용을 나열하려면 ls 명령을 사용합니다. 디렉터리의 경로를 지정합니다. 다음 예제에서는 지정된 볼륨의 루트 또는 DBFS 루트에 있는 개체의 이름을 나열합니다.

databricks fs ls dbfs:/Volumes/main/default/my-volume
databricks fs ls dbfs:/

개체 유형, 크기, Epoch 이후의 수정 시간(밀리초) 및 개체 이름을 비롯한 전체 정보를 표시하려면 해당 또는 --long 옵션을 사용합니다-l. 다음 예제에서는 지정된 볼륨의 루트 또는 DBFS 루트 내의 tmp 디렉터리에 있는 개체의 전체 정보를 나열합니다.

databricks fs ls dbfs:/Volumes/main/default/my-volume -l
databricks fs ls dbfs:/tmp -l

전체 개체 경로를 표시하려면 이 --absolute 옵션을 사용합니다. 다음 예제에서는 지정된 볼륨의 루트 또는 DBFS 루트 내의 tmp 디렉터리에 있는 개체의 전체 정보와 개체의 전체 경로를 나열합니다.

databricks fs ls dbfs:/Volumes/main/default/my-volume -l --absolute
databricks fs ls dbfs:/tmp -l --absolute

파일의 내용을 출력합니다.

파일의 내용을 출력하려면 명령을 사용합니다 cat . DBFS에서 파일 경로를 지정합니다. 다음 예제에서는 지정된 볼륨의 루트 또는 babynames.csv DBFS 루트 내의 디렉터리에 있는 파일의 내용을 tmp 출력합니다.

databricks fs cat dbfs:/Volumes/main/default/my-volume/babynames.csv
databricks fs cat dbfs:/tmp/babynames.csv

다음 예제에서는 파일 대신 디렉터리의 내용을 출력하려고 할 때 오류를 반환합니다.

databricks fs cat dbfs:/Volumes/main/default/my-volume
databricks fs cat dbfs:/tmp

디렉터리 만들기

디렉터리를 만들려면 명령을 사용합니다 mkdir . 볼륨 또는 DBFS에서 만들 디렉터리의 경로를 지정합니다. 디렉터리가 이미 있는 경우 아무 일도 발생하지 않습니다. 다음 예제에서는 지정된 볼륨의 루트 내에서 또는 DBFS 루트 내에 명명된 디렉터리에 이름이 지정된 squirrel-datatmp 디렉터리를 만듭니다.

databricks fs mkdir dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs mkdir dbfs:/tmp/squirrel-data

디렉터리 또는 파일 복사

디렉터리 또는 파일을 복사하려면 이 명령을 사용합니다 cp . 복사할 원본 디렉터리 또는 파일의 경로와 대상을 지정합니다. 로컬 파일 시스템 및 DBFS 간에 디렉터리와 파일을 복사할 수 있으며 DBFS 경로 간에 디렉터리와 파일을 복사할 수 있습니다. 기존 파일을 덮어쓰려면 이 --overwrite 옵션을 사용합니다. 디렉터리 내에서 파일을 재귀적으로 복사하려면 해당 또는 --recursive 옵션을 사용합니다-r.

cp 명령은 생략된 경우 file://>를 가정file:/합니다.

다음 예제에서는 로컬 파일 시스템 경로 squirrel-data 에서 지정된 볼륨의 루트 또는 DBFS 루트 내의 디렉터리로 명명 squirrels 된 디렉터리와 해당 내용을 복사합니다.

databricks fs cp /Users/<username>/squirrel-data dbfs:/Volumes/main/default/my-volume/squirrels -r
databricks fs cp /Users/<username>/squirrel-data dbfs:/squirrels -r

다음 예제에서는 로컬 파일 시스템 경로에서 지정된 볼륨의 루트 또는 DBFS 루트 내에 명명된 디렉터리로 명명 squirrels.csvsquirrel-data 된 파일을 복사합니다. 파일이 대상에 이미 있는 경우 덮어씁니다.

databricks fs cp /Users/<username>/squirrels.csv dbfs:/Volumes/main/default/my-volume/squirrel-data --overwrite
databricks fs cp /Users/<username>/squirrels.csv dbfs:/squirrel-data --overwrite

디렉터리 제거

디렉터리를 제거하려면 rm 명령을 사용합니다. DBFS에서 기존 디렉터리의 경로를 지정합니다. 다음 예제에서는 지정된 볼륨의 루트 또는 DBFS 루트의 squirrel-data 디렉터리에서 tmp 디렉터리를 제거합니다.

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data
databricks fs rm dbfs:/tmp/squirrel-data

디렉터리가 없으면 아무 작업도 수행되지 않으며 오류가 반환되지 않습니다.

디렉터리가 있지만 비어 있지 않으면 오류가 반환됩니다. 비어있지 않은 디렉터리와 모든 내용을 제거하려면 --recursive 또는 -r 옵션을 사용합니다. 다음 예제에서는 지정된 볼륨의 루트 또는 DBFS 루트의 squirrel-data 디렉터리에서 tmp 이름이 비어 있지 않은 디렉터리를 제거합니다.

databricks fs rm dbfs:/Volumes/main/default/my-volume/squirrel-data -r
databricks fs rm dbfs:/tmp/squirrel-data -r