Udostępnij za pośrednictwem


Używanie identyfikatora URI usługi Azure Data Lake Storage

Sterownik systemu plików Hadoop zgodny z usługą Azure Data Lake Storage jest znany ze swojego identyfikatora abfs schematu (system plików obiektów blob platformy Azure). Zgodnie z innymi sterownikami systemu plików Hadoop sterownik ABFS stosuje format identyfikatora URI do adresowania plików i katalogów w ramach konta z włączoną usługą Data Lake Storage.

Składnia identyfikatora URI

Sterownik systemu plików obiektów blob platformy Azure może być używany z punktem końcowym usługi Data Lake Storage konta, nawet jeśli to konto nie ma włączonej hierarchicznej przestrzeni nazw. Jeśli konto magazynu nie ma hierarchicznej przestrzeni nazw, skrócona składnia identyfikatora URI to:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Identyfikator schematu: abfs protokół jest używany jako identyfikator schematu. Jeśli dodasz element s na końcu (abfs s), sterownik klienta usługi ABFSHadoop będzie zawsze używać protokołu Transport Layer Security (TLS) niezależnie od wybranej metody uwierzytelniania. Jeśli wybierzesz uwierzytelnianie OAuth jako uwierzytelnianie, sterownik klienta będzie zawsze używać protokołu TLS, nawet jeśli określisz abfs zamiast abfss , ponieważ uwierzytelnianie OAuth opiera się wyłącznie na warstwie PROTOKOŁU TLS. Jeśli na koniec zdecydujesz się użyć starszej metody klucza konta magazynu, sterownik klienta interpretuje abfs , aby oznaczać, że nie chcesz używać protokołu TLS.

  2. System plików: lokalizacja nadrzędna zawierająca pliki i foldery. Jest to takie samo jak kontenery w usłudze Azure Storage Blob Service.

  3. Nazwa konta: nazwa nadana kontu magazynu podczas tworzenia.

  4. Ścieżki: rozdzielany ukośnikiem (/) reprezentacja struktury katalogów.

  5. Nazwa pliku: nazwa pojedynczego pliku. Ten parametr jest opcjonalny, jeśli adresujesz katalog.

Jeśli jednak konto, którego adres ma mieć hierarchiczną przestrzeń nazw, skrócona składnia identyfikatora URI to:

/<path>1/<file_name>2
  1. Ścieżka: rozdzielana ukośnikiem (/) reprezentacja struktury katalogów.

  2. Nazwa pliku: nazwa pojedynczego pliku.

Następne kroki