Använda Hive-metaarkiv med Apache Spark-kluster™
Kommentar
Vi drar tillbaka Azure HDInsight på AKS den 31 januari 2025. Före den 31 januari 2025 måste du migrera dina arbetsbelastningar till Microsoft Fabric eller en motsvarande Azure-produkt för att undvika plötsliga uppsägningar av dina arbetsbelastningar. Återstående kluster i din prenumeration stoppas och tas bort från värden.
Endast grundläggande stöd kommer att vara tillgängligt fram till datumet för pensionering.
Viktigt!
Den här funktionen finns i förhandsgranskning. De kompletterande användningsvillkoren för Förhandsversioner av Microsoft Azure innehåller fler juridiska villkor som gäller för Azure-funktioner som är i betaversion, förhandsversion eller på annat sätt ännu inte har släppts i allmän tillgänglighet. Information om den här specifika förhandsversionen finns i Azure HDInsight på AKS-förhandsversionsinformation. Om du vill ha frågor eller funktionsförslag skickar du en begäran på AskHDInsight med informationen och följer oss för fler uppdateringar i Azure HDInsight Community.
Det är viktigt att dela data och metaarkiv över flera tjänster. Ett av de vanliga metaarkivet i HIVE-metaarkivet. HDInsight på AKS gör det möjligt för användare att ansluta till externt metaarkiv. Det här steget gör det möjligt för HDInsight-användare att sömlöst ansluta till andra tjänster i ekosystemet.
Azure HDInsight på AKS stöder anpassade metalager, som rekommenderas för produktionskluster. De viktigaste stegen är
- Skapa en Azure SQL-databas
- Skapa ett nyckelvalv för att lagra autentiseringsuppgifterna
- Konfigurera metaarkiv när du skapar en HDInsight på AKS-kluster med Apache Spark™
- Arbeta på externt metaarkiv (Visar databaser och gör en select-gräns 1).
När du skapar klustret måste HDInsight-tjänsten ansluta till det externa metaarkivet och verifiera dina autentiseringsuppgifter.
Skapa en Azure SQL-databas
Skapa eller ha en befintlig Azure SQL Database innan du konfigurerar ett anpassat Hive-metaarkiv för ett HDInsight-kluster.
Kommentar
För närvarande stöder vi endast Azure SQL Database for HIVE-metaarkiv. På grund av Hive-begränsning stöds inte "-" (bindestreck) i metaarkivdatabasens namn.
Skapa ett nyckelvalv för att lagra autentiseringsuppgifterna
Skapa ett Azure Key Vault.
Syftet med Key Vault är att du ska kunna lagra sql Server-administratörslösenordet som angavs när SQL-databasen skapades. HDInsight på AKS-plattformen hanterar inte autentiseringsuppgifterna direkt. Därför är det nödvändigt att lagra dina viktiga autentiseringsuppgifter i Azure Key Vault. Lär dig stegen för att skapa ett Azure Key Vault.
Tilldela följande roller efter skapandet av Azure Key Vault
Objekt Roll Kommentarer Användartilldelad hanterad identitet (samma UAMI som används av HDInsight-klustret) Nyckelvalvshemlighetsanvändare Lär dig hur du tilldelar rollen till UAMI Användare (som skapar hemlighet i Azure Key Vault) Key Vault-administratör Lär dig hur du tilldelar rollen till användaren. Kommentar
Utan den här rollen kan användaren inte skapa en hemlighet.
-
Med det här steget kan du behålla ditt SQL Server-administratörslösenord som en hemlighet i Azure Key Vault. Lägg till ditt lösenord (samma lösenord som anges i SQL DB för administratör) i fältet "Värde" när du lägger till en hemlighet.
Kommentar
Observera det hemliga namnet eftersom du behöver det när klustret skapas.
Konfigurera metaarkiv när du skapar ett HDInsight Spark-kluster
Gå till HDInsight i AKS-klusterpoolen för att skapa kluster.
Aktivera växlingsknappen för att lägga till externt hive-metaarkiv och fyll i följande information.
Resten av informationen ska fyllas i enligt reglerna för att skapa kluster för Apache Spark-kluster i HDInsight på AKS.
Klicka på Granska och skapa.
Kommentar
- Livscykeln för metaarkivet är inte kopplad till en klusterlivscykel, så du kan skapa och ta bort kluster utan att förlora metadata. Metadata som dina Hive-scheman bevaras även efter att du har tagit bort och återskapat HDInsight-klustret.
- Med ett anpassat metaarkiv kan du koppla flera kluster och klustertyper till metaarkivet.
Arbeta med externt metaarkiv
Skapa en tabell
>> spark.sql("CREATE TABLE sampleTable (number Int, word String)")
Lägga till data i tabellen
>> spark.sql("INSERT INTO sampleTable VALUES (123, \"HDIonAKS\")");\
Läs tabellen
>> spark.sql("select * from sampleTable").show()
Referens
- Apache, Apache Spark, Spark och associerade öppen källkod projektnamn är varumärken som tillhör Apache Software Foundation (ASF).