Udostępnij za pośrednictwem


Łączenie programu Excel z usługą Apache Hadoop w usłudze Azure HDInsight przy użyciu sterownika Microsoft Hive ODBC

Rozwiązanie do obsługi danych big data firmy Microsoft integruje składniki analizy biznesowej (BI) firmy Microsoft z klastrami Apache Hadoop wdrożonym w usłudze HDInsight. Przykładem jest możliwość połączenia programu Excel z magazynem danych Hive klastra Hadoop. Nawiąż połączenie przy użyciu sterownika Microsoft Hive Open Database Connectivity (ODBC).

Możesz połączyć dane skojarzone z klastrem usługi HDInsight z programu Excel za pomocą dodatku Microsoft Power Query dla programu Excel. Aby uzyskać więcej informacji, zobacz Łączenie programu Excel z usługą HDInsight przy użyciu dodatku Power Query.

Wymagania wstępne

Przed rozpoczęciem tego artykułu musisz mieć następujące elementy:

Instalowanie sterownika ODBC programu Microsoft Hive

Pobierz i zainstaluj Sterownik Microsoft Hive ODBC. Wybierz wersję zgodną z wersją aplikacji, w której będziesz używać sterownika ODBC. W tym artykule sterownik jest używany dla programu Office Excel.

Tworzenie źródła danych ODBC usługi Apache Hive

W poniższych krokach pokazano, jak utworzyć źródło danych Hive ODBC.

  1. W systemie Windows przejdź do pozycji Uruchom > źródła danych ODBC Narzędzi > administracyjnych systemu Windows (32-bitowe)/(64-bitowe). Ta akcja powoduje otwarcie okna Administrator źródła danych ODBC.

    Administrator źródła danych ODBC.

  2. Na karcie Nazwy DSN użytkownika wybierz pozycję Dodaj, aby otworzyć Create New Data Source okno.

  3. Wybierz Sterownik Microsoft Hive ODBC, a następnie wybierz przycisk Zakończ, aby otworzyć okno Sterownik Microsoft Hive ODBC Instalatora DSN.

  4. Wpisz lub wybierz poniższe wartości:

    Właściwości opis
    Nazwa źródła danych Nadaj nazwę źródła danych.
    Host(s) Wprowadź HDInsightClusterName.azurehdinsight.net. Na przykład myHDICluster.azurehdinsight.net. Uwaga: HDInsightClusterName-int.azurehdinsight.net jest obsługiwana tak długo, jak maszyna wirtualna klienta jest równorzędna z tą samą siecią wirtualną.
    Port Użyj portu 443. (Ten port został zmieniony z 563 na 443).
    baza danych Użyj wartości domyślnej.
    Mechanizm Wybieranie usługi Windows Azure HDInsight
    Nazwa użytkownika Wprowadź nazwę użytkownika HTTP klastra usługi HDInsight. Domyślna nazwa użytkownika to admin.
    Hasło Wprowadź hasło użytkownika klastra usługi HDInsight. Zaznacz pole wyboru Zapisz hasło (zaszyfrowane).
  5. Opcjonalnie: wybierz pozycję Opcje zaawansowane...

    Parametr Opis
    Korzystanie z zapytania natywnego Po wybraniu sterownika ODBC nie próbuje przekonwertować języka TSQL na hiveQL. Użyjesz go tylko wtedy, gdy masz 100% pewności, że przesyłasz czyste instrukcje HiveQL. Podczas nawiązywania połączenia z programem SQL Server lub usługą Azure SQL Database należy pozostawić je niezaznaczone.
    Wiersze pobierane na blok Podczas pobierania dużej liczby rekordów dostrajanie tego parametru może być wymagane w celu zapewnienia optymalnej wydajności.
    Domyślna długość kolumny ciągu, długość kolumny binarnej, skala kolumn dziesiętnych Długość i precyzje typów danych mogą mieć wpływ na sposób zwracania danych. Powodują one zwrócenie nieprawidłowych informacji z powodu utraty dokładności i obcinania.

    Zaawansowane opcje konfiguracji DSN.

  6. Wybierz pozycję Testuj , aby przetestować źródło danych. Po poprawnym skonfigurowaniu źródła danych wynik testu pokazuje powodzenie!

  7. Wybierz przycisk OK , aby zamknąć okno Test.

  8. Wybierz przycisk OK, aby zamknąć okno konfiguracji Sterownik Microsoft Hive ODBC DSN.

  9. Wybierz przycisk OK , aby zamknąć okno Administrator źródła danych ODBC.

Importowanie danych do programu Excel z usługi HDInsight

W poniższych krokach opisano sposób importowania danych z tabeli Programu Hive do skoroszytu programu Excel przy użyciu źródła danych ODBC utworzonego w poprzedniej sekcji.

  1. Otwórz nowy lub istniejący skoroszyt w programie Excel.

  2. Na karcie Dane przejdź do pozycji Pobierz dane>z innych źródeł>z ODBC, aby uruchomić okno OdBC.

    Otwórz kreatora połączenia danych programu Excel.

  3. Z listy rozwijanej wybierz nazwę źródła danych utworzoną w ostatniej sekcji, a następnie wybierz przycisk OK.

  4. W przypadku pierwszego użycia zostanie otwarte okno dialogowe sterownika ODBC. Wybierz pozycję Windows z menu po lewej stronie. Następnie wybierz pozycję Połącz, aby otworzyć okno Nawigator .

  5. W nawigatorze przejdź do domyślnego>programu Hiveampletable>, a następnie wybierz pozycję Załaduj. Importowanie danych do programu Excel trwa kilka chwil.

    Nawigator ODBC programu Excel Hive w usłudze HDInsight.

Następne kroki

W tym artykule przedstawiono sposób używania sterownika MICROSOFT Hive ODBC do pobierania danych z usługi HDInsight do programu Excel. Podobnie można pobrać dane z usługi HDInsight Service do usługi SQL Database. Istnieje również możliwość przekazania danych do usługi HDInsight. Aby dowiedzieć się więcej, zobacz: