De URI van Azure Data Lake Storage gebruiken
Het hadoop-bestandssysteemstuurprogramma dat compatibel is met Azure Data Lake Storage, staat bekend met de schema-id abfs
(Azure Blob File System). In overeenstemming met andere Hadoop-bestandssysteemstuurprogramma's gebruikt het ABFS-stuurprogramma een URI-indeling om bestanden en mappen in een Data Lake Storage-account aan te pakken.
URI-syntaxis
Het stuurprogramma van het Azure Blob-bestandssysteem kan worden gebruikt met het Data Lake Storage-eindpunt van een account, zelfs als voor dat account geen hiërarchische naamruimte is ingeschakeld. Als het opslagaccount geen hiërarchische naamruimte heeft, is de syntaxis van de verkorte URI:
abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
Schema-id: het
abfs
protocol wordt gebruikt als de schema-id. Als u eens
aan het einde (abfs s) toevoegt, gebruikt het ABFS Hadoop-clientstuurprogramma altijd TLS (Transport Layer Security), ongeacht de gekozen verificatiemethode. Als u OAuth als verificatie kiest, gebruikt het clientstuurprogramma altijd TLS, zelfs als u opgeeftabfs
in plaats van omdat OAuth alleen afhankelijk is vanabfss
de TLS-laag. Als u ervoor kiest om de oudere methode van de sleutel van het opslagaccount te gebruiken, interpreteertabfs
het clientstuurprogramma dat u TLS niet wilt gebruiken.Bestandssysteem: de bovenliggende locatie met de bestanden en mappen. Dit is hetzelfde als containers in de Azure Storage Blob-service.
Accountnaam: de naam die u tijdens het maken aan uw opslagaccount hebt gegeven.
Paden: Een slash gescheiden (
/
) weergave van de mapstructuur.Bestandsnaam: de naam van het afzonderlijke bestand. Deze parameter is optioneel als u een adreslijst adresseert.
Als het account dat u wilt adres echter wel een hiërarchische naamruimte heeft, is de syntaxis van de verkorte URI:
/<path>1/<file_name>2
Pad: Een slash gescheiden (
/
) weergave van de mapstructuur.Bestandsnaam: de naam van het afzonderlijke bestand.