Compartir vía


Uso del URI de Azure Data Lake Storage

El controlador Sistema de archivos de Hadoop que es compatible con Azure Data Lake Storage es conocido por su identificador de esquema abfs (Azure Blob File System). Coherente con otros controladores del sistema de archivos de Hadoop, el controlador ABFS emplea un formato de URI para direccionar archivos y directorios dentro de una cuenta habilitada para Data Lake Storage.

Sintaxis de URI

El controlador del sistema de archivos de blobs de Azure se puede usar con el punto de conexión Data Lake Storage de una cuenta, aunque esa cuenta no tenga habilitado un espacio de nombres jerárquico. Si la cuenta de almacenamiento no tiene un espacio de nombres jerárquico, la sintaxis del URI abreviado es:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Identificador de esquema: el protocolo abfs se usa como el identificador de esquema. Si agrega una s al final (abfss), el controlador cliente de Hadoop ABFS siempre usará Seguridad de la capa de transporte (TLS) independientemente del método de autenticación elegido. Si elige OAuth como método de autenticación, el controlador cliente siempre usará TLS aunque especifique abfs en lugar de abfss, porque OAuth solo se basa en la capa TLS. Por último, si decide usar el método anterior de clave de cuenta de almacenamiento, el controlador cliente interpreta abfs para indicar que no desea usar TLS.

  2. Sistema de archivos: ubicación principal que contiene los archivos y las carpetas. Es la misma que la de los contenedores del servicio de Azure Storage Blob.

  3. Nombre de cuenta: nombre dado a la cuenta de almacenamiento durante la creación.

  4. Rutas de acceso: representación de barra diagonal delimitada (/) de la estructura del directorio.

  5. Nombre de archivo: nombre del archivo individual. Este parámetro es opcional si va a dirigirse a un directorio.

Sin embargo, si la cuenta que desea dirigir tiene un espacio de nombres jerárquico, la sintaxis de URI abreviado es:

/<path>1/<file_name>2
  1. Ruta de acceso: representación de barra diagonal delimitada (/) de la estructura del directorio.

  2. Nombre de archivo: nombre del archivo individual.

Pasos siguientes