Co to jest system plików DBFS?
Termin DBFS służy do opisywania dwóch części platformy:
- Katalog główny systemu plików DBFS.
- Instalowanie systemu plików DBFS
Przechowywanie i uzyskiwanie dostępu do danych przy użyciu instalacji root lub DBFS systemu plików DBFS jest przestarzałym wzorcem i nie jest zalecane przez usługę Databricks. Aby uzyskać zalecenia dotyczące pracy z plikami, zobacz Praca z plikami w usłudze Azure Databricks.
Co to jest system plików usługi Databricks?
Termin DBFS pochodzi z systemu plików usługi Databricks, który opisuje rozproszony system plików używany przez usługę Azure Databricks do interakcji z magazynem opartym na chmurze.
Podstawowa technologia skojarzona z rozwiązaniem DBFS jest nadal częścią platformy Azure Databricks. Na przykład dbfs:/
jest to opcjonalny schemat podczas interakcji z woluminami wykazu aparatu Unity.
Wcześniejsze i bieżące ostrzeżenia i zastrzeżenia dotyczące systemu plików DBFS dotyczą tylko instalacji głównego systemu plików DBFS lub DBFS.
Jak system plików DBFS działa z wykazem aparatu Unity?
Usługa Databricks zaleca używanie wykazu aparatu Unity do zarządzania dostępem do wszystkich danych.
Wykaz aparatu Unity dodaje pojęcia dotyczące lokalizacji zewnętrznych, poświadczeń magazynu i woluminów, aby pomóc organizacjom zapewnić najmniej uprzywilejowany dostęp do danych w magazynie obiektów w chmurze.
Niektóre konfiguracje zabezpieczeń zapewniają bezpośredni dostęp do zasobów zarządzanych przez wykaz aparatu Unity i systemu plików DBFS, głównie dla organizacji, które ukończyły migracje lub częściowo zmigrowane do wykazu aparatu Unity. Zobacz Najlepsze rozwiązania dotyczące systemu plików DBFS i wykazu aparatu Unity.
Co to jest katalog główny systemu plików DBFS?
Katalog główny systemu plików DBFS to lokalizacja magazynu aprowizowana podczas tworzenia obszaru roboczego w chmurze zawierającego obszar roboczy usługi Azure Databricks. Aby uzyskać szczegółowe informacje na temat konfiguracji i wdrażania głównego systemu plików DBFS, zobacz przewodnik Szybki start dotyczący usługi Azure Databricks.
Usługa Databricks nie zaleca przechowywania danych produkcyjnych, bibliotek ani skryptów w katalogu głównym systemu plików DBFS. Zobacz Zalecenia dotyczące pracy z katalogiem głównym systemu plików DBFS.
Aby skonfigurować klucze zarządzane przez klienta dla konta magazynu zawierającego główny system plików DBFS, zobacz Klucze zarządzane przez klienta dla katalogu głównego systemu plików DBFS.
Aby ograniczyć dostęp sieciowy do konta magazynu zawierającego główny system plików DBFS, zobacz Włączanie obsługi zapory dla konta magazynu obszaru roboczego.
Instalowanie magazynu obiektów
Uwaga
Instalacja systemu PLIKÓW DBFS jest przestarzała. Usługa Databricks zaleca używanie woluminów wykazu aparatu Unity. Zobacz Co to są woluminy wykazu aparatu Unity?.
Instalowanie magazynu obiektów w systemie plików DBFS umożliwia dostęp do obiektów w magazynie obiektów tak, jakby znajdowały się w lokalnym systemie plików. Instalacja przechowuje konfiguracje platformy Hadoop niezbędne do uzyskiwania dostępu do magazynu. Aby uzyskać więcej informacji, zobacz Instalowanie magazynu obiektów w chmurze w usłudze Azure Databricks.