Úvod do úložiště clusteru
Důležitý
Azure HDInsight v AKS byl vyřazen 31. ledna 2025. Další informace s tímto oznámením.
Abyste se vyhnuli náhlému ukončení úloh, musíte migrovat úlohy do Microsoft Fabric nebo ekvivalentního produktu Azure.
Důležitý
Tato funkce je aktuálně ve verzi Preview. Doplňující podmínky použití pro verze Preview Microsoft Azure zahrnují další právní podmínky, které se vztahují na funkce Azure v beta verzi, ve verzi Preview nebo které nebyly ještě uvolněny k obecnému použití. Informace o této konkrétní ukázce Preview najdete v tématu Azure HDInsight na AKS Preview. Pokud máte dotazy nebo návrhy funkcí, odešlete prosím žádost na AskHDInsight s podrobnostmi a sledujte nás pro další aktualizace komunity Azure HDInsight .
Azure HDInsight v AKS se může bezproblémově integrovat se službou Azure Storage, což je řešení úložiště pro obecné účely, které dobře funguje s mnoha dalšími službami Azure. Azure Data Lake Storage Gen2 (ADLS Gen2) je výchozí systém souborů pro clustery.
Účet úložiště se dá použít jako výchozí umístění pro data, protokoly clusteru a další výstupy, které se generují během operace clusteru. Může to být také výchozí úložiště pro katalog Hive, které závisí na typu clusteru.
Další informace najdete v tématu Úvod do Azure Data Lake Storage Gen2.
Spravované identity pro zabezpečený přístup k souborům
Azure HDInsight v AKS používá spravované identity (MSI) k zabezpečení přístupu ke souborům v Azure Data Lake Storage Gen2. Spravovaná identita je funkce ID Microsoft Entra, která poskytuje službám Azure sadu automaticky spravovaných přihlašovacích údajů. Tyto přihlašovací údaje se dají použít k ověření v jakékoli službě, která podporuje ověřování active directory. Spravované identity navíc nevyžadují ukládání přihlašovacích údajů do kódu nebo konfiguračních souborů.
Jakmile v Azure HDInsight ve službě AKS vyberete spravovanou identitu a úložiště během vytváření clusteru, může spravovaná identita bezproblémově pracovat s úložištěm pro správu dat za předpokladu, že vlastník dat objektu blob služby Storage role je přiřazena k MSI přiřazené uživatelem.
Následující tabulka popisuje podporované možnosti úložiště pro Azure HDInsight v AKS (Public Preview):
Typ clusteru | Podporované úložiště | Připojení | Role v úložišti |
---|---|---|---|
Trino, Apache Flink a Apache Spark | ADLS Gen2 | Spravovaná identita přiřazená uživatelem clusteru (MSI) | MSI přiřazená uživatelem musí mít roli vlastníka dat Storage Blob v účtu úložiště. |
Poznámka
Pokud chcete sdílet účet úložiště napříč několika clustery, stačí přiřadit odpovídající uživatelem přiřazené MSI objektu blob úložiště v účtu sdíleného úložiště. Zjistěte, jak přiřadit roli.
Potom můžete pro přístup k datům prostřednictvím vašich aplikací použít úplnou cestu k úložišti abfs://
.
Další informace najdete v tématu spravované identity pro prostředky Azure.
Naučte se, jak vytvořit účet ADLS Gen2.
Architektura úložiště Azure HDInsight v AKS
Následující diagram poskytuje abstraktní zobrazení služby Azure HDInsight v architektuře AKS služby Azure Storage.
Správa úložiště
Azure HDInsight v AKS v současné době nepodporuje účty úložiště s povoleným obnovitelným odstraněním, ujistěte se, že pro svůj účet úložiště zakážete obnovitelné odstranění.