Konfigurace přístupu k datům pro příjem dat
Tento článek popisuje, jak můžou uživatelé správy nakonfigurovat přístup k datům v kontejneru v Azure Data Lake Storage Gen2 (ADLS Gen2), aby uživatelé Azure Databricks mohli načítat data z ADLS Gen2 do tabulky v Azure Databricks.
Tento článek popisuje následující způsoby konfigurace zabezpečeného přístupu ke zdrojovým datům:
(Doporučeno) Vytvořte svazek katalogu Unity.
Vytvořte externí umístění katalogu Unity s přihlašovacími údaji úložiště.
Spusťte výpočetní prostředek, který používá instanční objekt.
Generování dočasných přihlašovacích údajů (token SAS objektu blob)
Než začnete
Než nakonfigurujete přístup k datům v ADLS Gen2, ujistěte se, že máte následující:
Data v kontejneru v účtu úložiště Azure Pokud chcete vytvořit kontejner, přečtěte si téma Vytvoření kontejneru v dokumentaci ke službě Azure Storage.
Pokud chcete získat přístup k datům pomocí svazku katalogu Unity (doporučeno),
READ VOLUME
oprávnění ke svazku. Další informace najdete v tématu Co jsou svazky katalogu Unity? a oprávnění katalogu Unity a zabezpečitelné objekty.Pokud chcete získat přístup k datům pomocí externího umístění katalogu Unity, oprávnění
READ FILES
k externímu umístění. Další informace najdete v tématu Vytvoření externího umístění pro připojení cloudového úložiště k Azure Databricks.Přístup k datům pomocí výpočetního prostředku s instančním objektem má oprávnění správce pracovního prostoru Azure Databricks.
Přístup k datům pomocí dočasných přihlašovacích údajů:
- Oprávnění správce pracovního prostoru Azure Databricks
- Oprávnění ve vašem účtu Azure k vytvoření tokenů SAS objektů blob To vám umožní vygenerovat dočasné přihlašovací údaje.
Databricks SQL Warehouse. Pokud chcete vytvořit SQL Warehouse, přečtěte si téma Vytvoření SQL Warehouse.
Znalost uživatelského rozhraní SQL databricks
Konfigurace přístupu ke cloudovému úložišti
Ke konfiguraci přístupu k ADLS Gen2 použijte jednu z následujících metod:
(Doporučeno) Vytvořte svazek katalogu Unity. Další informace najdete v tématu Co jsou svazky katalogu Unity?.
Nakonfigurujte externí umístění katalogu Unity s přihlašovacími údaji úložiště. Další informace o externích umístěních najdete v tématu Vytvoření externího umístění pro připojení cloudového úložiště k Azure Databricks.
Nakonfigurujte výpočetní prostředek tak, aby používal instanční objekt. Další informace naleznete v tématu Konfigurace instančního objektu.
Vygenerujte dočasné přihlašovací údaje (token SAS objektu blob), které chcete sdílet s ostatními uživateli Azure Databricks. Další informace najdete v tématu Generování dočasných přihlašovacích údajů pro příjem dat.
Vyčištění
Přidružené prostředky v cloudovém účtu a Azure Databricks můžete vyčistit, pokud je už nechcete uchovávat.
Odstranění účtu úložiště ADLS Gen2
- Otevřete web Azure Portal pro svůj účet Azure, obvykle na adrese https://portal.azure.com.
- Přejděte k účtu úložiště a otevřete ho.
- Klepněte na tlačítko Odstranit.
- Zadejte název účtu úložiště a klikněte na odstranit.
Zastavení SQL Warehouse
Pokud sql Warehouse nepoužíváte pro žádné jiné úlohy, měli byste zastavit SQL Warehouse, abyste se vyhnuli dalším nákladům.
- V osobě SQL na bočním panelu klikněte na SQL Warehouses.
- Vedle názvu SQL Warehouse klikněte na Zastavit.
- Po zobrazení výzvy klikněte znovu na Zastavit .
Další kroky
Po dokončení kroků v tomto článku můžou uživatelé spustit COPY INTO
příkaz pro načtení dat z kontejneru ADLS Gen2 do pracovního prostoru Azure Databricks.
Pokud chcete načíst data pomocí svazku katalogu Unity nebo externího umístění, přečtěte si téma Načtení dat pomocí funkce COPY INTO se svazky katalogu Unity nebo externími umístěními.
Pokud chcete načíst data pomocí SQL Warehouse s instančním objektem, přečtěte si téma Načtení dat pomocí příkazu COPY INTO s instančním objektem.
Pokud chcete načíst data pomocí dočasných přihlašovacích údajů (token SAS objektu blob), přečtěte si téma Načtení dat pomocí funkce COPY INTO s dočasnými přihlašovacími údaji.