Woluminy
Dotyczy: Databricks SQL Databricks Runtime 13.3 LTS i nowszy tylko wykaz aparatu Unity
Woluminy to obiekty wykazu aparatu Unity reprezentujące wolumin logiczny magazynu w lokalizacji przechowywania obiektów w chmurze. Woluminy zapewniają możliwości uzyskiwania dostępu, przechowywania, zarządzania i organizowania plików. Podczas gdy tabele zapewniają nadzór nad tabelarycznymi zestawami danych, woluminy dodają nadzór nad zestawami danych innych niż tabelaryczne. Za pomocą woluminów można przechowywać pliki i uzyskiwać do nich dostęp w dowolnym formacie, w tym ustrukturyzowane, częściowo ustrukturyzowane i nieustrukturyzowane dane.
Woluminy są elementami równorzędnymi tabel, widoków i innych obiektów zorganizowanych w schemacie w wykazie aparatu Unity.
Wolumin może być zarządzany lub zewnętrzny.
Aby uzyskać więcej szczegółów i ograniczeń, zobacz Co to są woluminy wykazu aparatu Unity?.
Wolumin zarządzany
Wolumin zarządzany to wolumin magazynu zarządzany przez wykaz aparatu Unity utworzony w zarządzanej lokalizacji magazynu zawierającego schemat. Woluminy zarządzane umożliwiają tworzenie zarządzanego magazynu do pracy z plikami bez obciążeń związanych z lokalizacjami zewnętrznymi i poświadczeniami magazynu. Nie trzeba określać lokalizacji podczas tworzenia woluminu zarządzanego, a cały dostęp do plików dla danych w woluminach zarządzanych odbywa się za pośrednictwem ścieżek zarządzanych przez wykaz aparatu Unity.
Wolumin zewnętrzny
Wolumin zewnętrzny to wolumin magazynu zarządzany przez wykaz aparatu Unity zarejestrowany w katalogu w lokalizacji zewnętrznej.
Nazewnictwo woluminów i odwołanie
Nazwa woluminu to identyfikator, który można zakwalifikować za pomocą katalogu i nazwy schematu w poleceniach SQL.
Ścieżka dostępu do plików w woluminach ma następujący format:
/Volumes/<catalog_identifier>/<schema_identifier>/<volume_identifier>/<path>/<file_name>
Pamiętaj, że usługa Azure Databricks normalizuje identyfikatory do małych liter.
Usługa Azure Databricks obsługuje również opcjonalny dbfs:/
schemat, więc następująca ścieżka również działa:
dbfs:/Volumes/<catalog_identifier>/<schema_identifier>/<volume_identifier>/<path>/<file_name>
Uwaga
Dostęp do danych w woluminach zewnętrznych można również uzyskać przy użyciu identyfikatorów URI magazynu w chmurze.
Zarządzanie plikami w woluminach
Dotyczy: Łącznik SQL usługi Databricks
Za pomocą łącznika SQL usługi Databricks można zarządzać plikami w woluminach przy użyciu następujących poleceń:
- PUT INTO, aby skopiować plik z magazynu lokalnego do woluminu.
- POBIERZ , aby skopiować plik z woluminu do magazynu lokalnego.
- USUŃ , aby usunąć plik z woluminu.
Przykłady
--- Create an external volume under the directory “my-path”
> CREATE EXTERNAL VOLUME IF NOT EXISTS myCatalog.mySchema.myExternalVolume
COMMENT 'This is my example external volume'
LOCATION 's3://my-bucket/my-location/my-path'
OK
--- Set the current catalog
> USE CATALOG myCatalog;
OK
--- Set the current schema
> USE SCHEMA mySchema;
OK
--- Create a managed volume; it is not necessary to specify a location
> CREATE VOLUME myManagedVolume
COMMENT 'This is my example managed volume';
OK
--- List the files inside the volume, all names are lowercase
> LIST '/Volumes/mycatalog/myschema/myexternalvolume'
sample.csv
> LIST 'dbfs:/Volumes/mycatalog/myschema/mymanagedvolume'
sample.csv
--- Print the content of a csv file
> SELECT * FROM csv.`/Volumes/mycatalog/myschema/myexternalvolume/sample.csv`
20
> SELECT * FROM csv.`dbfs:/Volumes/mycatalog/myschema/mymanagedvolume/sample.csv`
20