Usar o Apache Zeppelin para executar consultas do Apache Phoenix pelo Apache HBase no Azure HDInsight

Artigo
02/12/2024

Apache Phoenix é um banco de dados relacional livre e paralelo em massa criado em camadas em HBase. O Phoenix permite que você use consultas como SQL no HBase. O Phoenix usa drivers JDBC para permitir que você crie, exclua, altere tabelas SQL, índices, exibições e sequências. Você também pode usar o Phoenix para atualizar linhas individualmente e em massa. O Phoenix usa uma compilação nativa NOSQL, em vez de usar o MapReduce para compilar consultas, permitindo a criação de aplicativos de baixa latência sobre HBase.

O Apache Zeppelin é um notebook baseado na Web de software livre que permite que você crie documentos colaborativos controlados por dados usando análises de dados interativas e linguagens como SQL e Scala. Ele ajuda os desenvolvedores de dados e cientistas de dados a desenvolver, organizar, executar e compartilhar código para manipulação de dados. Ele permite visualizar os resultados sem referir-se à linha de comando ou precisar dos detalhes do cluster.

Os usuários do HDInsight podem usar o Apache Zeppelin para consultar tabelas Phoenix. O Apache Zeppelin é integrado ao cluster HDInsight e não há etapas adicionais para usá-lo. Crie um Notebook Zeppelin com o interpretador JDBC e começar a gravar as consultas SQL Phoenix

Pré-requisitos

Um cluster do Apache HBase no HDInsight. Veja Introdução ao Apache HBase.

Criar uma anotação do Apache Zeppelin

Substitua CLUSTERNAME pelo nome do cluster na seguinte URL https://CLUSTERNAME.azurehdinsight.net/zeppelin. Em seguida, insira a URL em um navegador da Web. Insira o nome de usuário e a senha de logon do cluster.
Na página Zeppelin, selecione Criar nova anotação.
Na caixa de diálogo Criar anotação, digite ou selecione os seguintes valores:
- Nome da anotação: digite o nome da anotação.
- Interpretador padrão: selecione jdbc na lista suspensa.
Em seguida, selecione Criar Anotação.
Verifique se o cabeçalho do notebook mostra um status conectado. Isso é indicado por um ponto verde no canto superior direito.
Crie uma tabela do HBase. Insira o comando a seguir e pressione Shift + Enter:
```
%jdbc(phoenix)
CREATE TABLE Company (
    company_id INTEGER PRIMARY KEY,
    name VARCHAR(225)
);
```
A instrução %jdbc(hive) na primeira linha informa o notebook para usar o interpretador JDBC do Phoenix.

Veja as tabelas criadas.

%jdbc(phoenix)
SELECT DISTINCT table_name
FROM SYSTEM.CATALOG
WHERE table_schem is null or table_schem <> 'SYSTEM';

Insira os valores na tabela.

%jdbc(phoenix)
UPSERT INTO Company VALUES(1, 'Microsoft');
UPSERT INTO Company (name, company_id) VALUES('Apache', 2);

Consulte a tabela.
```
%jdbc(phoenix)
SELECT * FROM Company;
```

Exclua um registro.

%jdbc(phoenix)
DELETE FROM Company WHERE COMPANY_ID=1;

Descarte a tabela.
```
%jdbc(phoenix)
DROP TABLE Company;
```

Compartilhar via

Usar o Apache Zeppelin para executar consultas do Apache Phoenix pelo Apache HBase no Azure HDInsight

Pré-requisitos

Criar uma anotação do Apache Zeppelin

Próximas etapas

Comentários

Recursos adicionais