Delen via


Apache Zeppelin gebruiken om Apache Phoenix-query's uit te voeren via Apache HBase in Azure HDInsight

Apache Phoenix is een open source, zeer parallelle relationele databaselaag die is gebouwd op HBase. Met Phoenix kunt u SQL gebruiken zoals query's via HBase. Phoenix gebruikt onderliggende JDBC-stuurprogramma's om u in staat te stellen SQL-tabellen, indexen, weergaven en reeksen te maken, te verwijderen, te wijzigen. U kunt Phoenix ook gebruiken om rijen afzonderlijk en bulksgewijs bij te werken. Phoenix maakt gebruik van een systeemeigen NOSQL-compilatie in plaats van MapReduce te gebruiken om query's te compileren, waardoor toepassingen met lage latentie kunnen worden gemaakt boven op HBase.

Apache Zeppelin is een opensource-webnotitieblok waarmee u gegevensgestuurde, gezamenlijke documenten kunt maken met behulp van interactieve gegevensanalyses en talen zoals SQL en Scala. Hiermee kunnen gegevensontwikkelaars en gegevenswetenschappers code ontwikkelen, organiseren, uitvoeren en delen voor gegevensmanipulatie. Hiermee kunt u resultaten visualiseren zonder naar de opdrachtregel te verwijzen of de clustergegevens nodig te hebben.

HDInsight-gebruikers kunnen Apache Zeppelin gebruiken om een query uit te voeren op Phoenix-tabellen. Apache Zeppelin is geïntegreerd met een HDInsight-cluster en er zijn geen extra stappen om het te gebruiken. Maak een Zeppelin Notebook met JDBC-interpreter en begin met het schrijven van uw Phoenix SQL-query's

Vereisten

Een Apache HBase-cluster in HDInsight. Zie Aan de slag met Apache HBase.

Een Apache Zeppelin-notitie maken

  1. Vervang CLUSTERNAME door de naam van uw cluster in de volgende URL: https://CLUSTERNAME.azurehdinsight.net/zeppelin. Voer vervolgens de URL in een webbrowser in. Voer uw gebruikersnaam en wachtwoord in om u aan te melden bij het cluster.

  2. Selecteer Op de pagina Zeppelin de optie Nieuwe notitie maken.

    HDInsight Interactive Query zeppelin.

  3. Typ of selecteer in het dialoogvenster Create new note de volgende waarden:

    • Naam van notitie: voer een naam in voor de notitie.
    • Standaard-interpreter: selecteer jdbc in de vervolgkeuzelijst.

    Selecteer Vervolgens Notitie maken.

  4. Zorg ervoor dat de koptekst van het notitieblok een verbonden status weergeeft. Het wordt aangeduid met een groene stip in de rechterbovenhoek.

    Zeppelin notebook status.

  5. Maak een HBase-tabel. Voer de volgende opdracht in en druk op Shift+Enter:

    %jdbc(phoenix)
    CREATE TABLE Company (
        company_id INTEGER PRIMARY KEY,
        name VARCHAR(225)
    );
    

    De instructie %jdbc(phoenix) in de frontlijn vertelt het notebook dat de Phoenix JDBC-interpreter moet worden gebruikt.

  6. Gemaakte tabellen weergeven.

    %jdbc(phoenix)
    SELECT DISTINCT table_name
    FROM SYSTEM.CATALOG
    WHERE table_schem is null or table_schem <> 'SYSTEM';
    
  7. Voeg waarden in de tabel in.

    %jdbc(phoenix)
    UPSERT INTO Company VALUES(1, 'Microsoft');
    UPSERT INTO Company (name, company_id) VALUES('Apache', 2);
    
  8. Voer een query op de tabel uit.

    %jdbc(phoenix)
    SELECT * FROM Company;
    
  9. Verwijder een record.

    %jdbc(phoenix)
    DELETE FROM Company WHERE COMPANY_ID=1;
    
  10. Verwijder de tabel.

    %jdbc(phoenix)
    DROP TABLE Company;
    

Volgende stappen