Konfigurera Apache Hive-principer i HDInsight med Enterprise Security Package
I den här artikeln får du lära dig hur du konfigurerar Apache Ranger-principer för Apache Hive. Du skapar två Ranger-principer för att begränsa åtkomsten hivesampletable
till . Levereras hivesampletable
med HDInsight-kluster. När du har konfigurerat principerna använder du drivrutinen Excel och Open Database Anslut ivity (ODBC) för att ansluta till Hive-tabeller i HDInsight.
Förutsättningar
- Ett HDInsight-kluster med Enterprise Security Package (ESP). Mer information finns i Konfigurera HDInsight-kluster med ESP.
- En arbetsstation med Microsoft 365-appar för företag, Office 2016, Office 2013 Professional Plus, Fristående Excel 2013 eller Office 2010 Professional Plus.
Anslut till Apache Ranger Admin-användargränssnittet
Så här ansluter du till Ranger Admin-användargränssnittet (UI):
Från en webbläsare går du till rangeradministratörsgränssnittet där
CLUSTERNAME
är namnet påhttps://CLUSTERNAME.azurehdinsight.net/Ranger/
klustret.Kommentar
Ranger använder andra autentiseringsuppgifter än Apache Hadoop-kluster. Om du vill förhindra webbläsare med cachelagrade Hadoop-autentiseringsuppgifter använder du ett nytt InPrivate-webbläsarfönster för att ansluta till rangeradministratörsgränssnittet.
Logga in med användarnamnet och lösenordet för klusteradministratörsdomänen:
För närvarande fungerar Ranger bara med Yarn och Hive.
Skapa domänanvändare
Information om hur du skapar hiveruser1
och finns i Skapa ett HDInsight-kluster med ESPhiveuser2
. Du använder de två användarkontona i den här artikeln.
Skapa Ranger-principer
I det här avsnittet skapar du två Ranger-principer för åtkomst till hivesampletable
. Du ger välj behörighet för olika uppsättningar med kolumner. Båda användarna skapades med hjälp av Skapa ett HDInsight-kluster med ESP. I nästa avsnitt testar du de två principerna i Excel.
Så här skapar du Ranger-principer:
Öppna Ranger-administratörsanvändargränssnittet. Se föregående avsnitt Anslut till Apache Ranger Admin UI.
Under Hive väljer du CLUSTERNAME_Hive. Du ser två förkonfigurerade principer.
Välj Lägg till ny princip och ange sedan följande värden:
Property Värde Principnamn read-hivesampletable-all Hive Database standard table hivesampletable Hive-kolumn * Välj användare hiveuser1 Behörigheter välj .
Kommentar
Om en domänanvändare inte är ifylld i Välj användare väntar du en stund tills Ranger synkroniserar med Microsoft Entra-ID.
Välj Lägg till för att spara principen.
Upprepa de två sista stegen för att skapa en annan princip med följande egenskaper:
Property Värde Principnamn read-hivesampletable-devicemake Hive Database standard table hivesampletable Hive-kolumn clientid, devicemake Välj användare hiveuser2 Behörigheter välj
Skapa en Hive ODBC-datakälla
Anvisningar om hur du skapar en Hive ODBC-datakälla finns i Skapa en Hive ODBC-datakälla.
Property | beskrivning |
---|---|
Namn på datakälla | Ge datakällan ett namn. |
Host | Ange CLUSTERNAME.azurehdinsight.net. Använd till exempel myHDICluster.azurehdinsight.net. |
Port | Använd 443. (Den här porten har ändrats från 563 till 443.) |
Databas | Använd Standard. |
Hive-servertyp | Välj Hive Server 2. |
Mekanism | Välj Azure HDInsight Service. |
HTTP-sökväg | Lämna tomt. |
Användarnamn | Ange hiveuser1@contoso158.onmicrosoft.com . Uppdatera domännamnet om det är annorlunda. |
Lösenord | Ange lösenordet för hiveuser1 . |
Välj Testa innan du sparar datakällan.
Importera data till Excel från HDInsight
I det sista avsnittet konfigurerade du två principer: hiveuser1
har behörigheten välj för alla kolumner och hiveuser2
har behörigheten select på två kolumner. I det här avsnittet personifierar du de två användarna för att importera data till Excel.
Öppna en ny eller befintlig arbetsbok i Excel.
På fliken Data går du till Hämta data>från andra källor>från ODBC för att öppna fönstret Från ODBC.
I listrutan väljer du det datakällnamn som du skapade i det senaste avsnittet och väljer sedan OK.
För den första användningen öppnas en ODBC-drivrutinsdialogruta . Välj Windows på den vänstra menyn. Välj sedan Anslut för att öppna fönstret Navigatör.
Vänta tills
Select Database and Table
dialogrutan har öppnats. Det här steget kan ta några sekunder.Välj hivesampletable>Nästa.
Välj Slutför.
I dialogrutan Importera data kan du ändra eller specificera frågan. Det gör du genom att välja Egenskaper. Det här steget kan ta några sekunder.
Välj fliken Definition . Kommandotexten är:
SELECT * FROM "HIVE"."default"."hivesampletable"`
Enligt de Ranger-principer som du har definierat
hiveuser1
har du valt behörighet för alla kolumner. Den här frågan fungerar med autentiseringsuppgifterna förhiveuser1
, men den här frågan fungerar inte med autentiseringsuppgifterna förhiveuser2
.Välj OK för att stänga dialogrutan egenskaper för Anslut ion.
Välj OK för att stänga dialogrutan Importera data .
Ange lösenordet igen för
hiveuser1
och välj sedan OK. Det tar några sekunder innan data importeras till Excel. När den är klar visas 11 datakolumner.
Testa den andra principen (read-hivesampletable-devicemake) som du skapade i det sista avsnittet:
Lägg till ett nytt kalkylblad i Excel.
Följ föregående procedur för att importera data. Den enda ändring du gör är att använda autentiseringsuppgifterna för i stället
hiveuser1
förhiveuser2
. Den här åtgärden misslyckas eftersomhiveuser2
den bara har behörighet att se två kolumner. Du ser följande fel:[Microsoft][HiveODBC] (35) Error from Hive: error code: '40000' error message: 'Error while compiling statement: FAILED: HiveAccessControlException Permission denied: user [hiveuser2] does not have [SELECT] privilege on [default/hivesampletable/clientid,country ...]'.
Följ samma procedur för att importera data. Den här gången använder du autentiseringsuppgifterna för
hiveuser2
och ändrar även select-instruktionen från:SELECT * FROM "HIVE"."default"."hivesampletable"
Till:
SELECT clientid, devicemake FROM "HIVE"."default"."hivesampletable"
När den är klar visas två kolumner med importerade data.
Nästa steg
- Information om hur du konfigurerar ett HDInsight-kluster med ESP finns i Konfigurera HDInsight-kluster med ESP.
- Information om hur du hanterar ett HDInsight-kluster med ESP finns i Hantera HDInsight-kluster med ESP.
- Information om hur du kör Hive-frågor med hjälp av Secure Shell (SSH) i HDInsight-kluster med ESP finns i Använda SSH med HDInsight.
- Information om hur du ansluter Hive med Hive Java Database Anslut ivity (JDBC) finns i Anslut till Apache Hive i Azure HDInsight med hive JDBC-drivrutinen.
- Information om hur du ansluter Excel till Hadoop med Hive ODBC finns i Anslut Excel till Apache Hadoop med Microsoft Hive ODBC-enheten.
- Information om hur du ansluter Excel till Hadoop med hjälp av Power Query finns i Anslut Excel till Apache Hadoop med hjälp av Power Query.