共用方式為


Azure Blobs の NoSQL データベースとして HBase クラスターのプレビュー版が Azure HDInsight に登場

このポストは、6 月 6 日に投稿した Azure HDInsight previewing HBase clusters as a NoSQL database on Azure Blobs の翻訳です。

6 月 3 日に、マイクロソフトは HDInsight の更新を発表し、クエリの実行が 100 倍速くなった Hadoop 2.4 のサポートを開始しました。そしてこのたび、HDInsight の Apache HBase (英語) クラスターのプレビュー版をリリースしました。

HBase は低待機時間 (レイテンシ) の NoSQL データベースで、ビッグ データのオンライン トランザクション処理 (OLTP: Online Transactional Processing) が可能です。HBase は、Azure 環境に統合された、管理されたクラスターとして提供されます。クラスターは Azure の BLOB ストレージに直接データを保存するよう構成されており、待機時間 (レイテンシ) が短縮され、パフォーマンスとコストのバランスを取ることができます。これにより、大規模なデータセットを扱うインタラクティブな Web サイトを構築したり、膨大な数の拠点から送られてくる、センサーのデータやテレメトリ データを保存するサービスを構築してそのデータを Hadoop ジョブで分析したりすることが可能になります。

HBase クラスターの作成方法

プレビュー期間中に HBase を試用するには、PowerShell を利用します。

1. Windows Azure PowerShell をインストールします。

2. 環境をセットアップ (英語) します。

3. クラスターの資格情報を変数に代入します。

PS C:\> $creds = Get-Credential

4. HBase クラスターを作成します。

PS C:\> New-AzureHDInsightCluster -Name <クラスター名> -ClusterType HBase -Version 3.0 -Location “West US” `

-DefaultStorageAccountName <ストレージ アカウント名>.blob.core.windows.net -DefaultStorageAccountKey “<ストレージ アカウントのキー>” `

-DefaultStorageContainerName hbasecontainername -Credential $creds -ClusterSizeInNodes 4

 

HBase クラスターのデータ操作

アプリケーション開発者は REST API (英語)、HBase シェル、および Hive や Pig などさまざまな種類の MapReduce ジョブを通じて HBase データにアクセスできます。HBase シェルのインタラクティブなコンソールを使用すると、HBase クラスターの管理、テーブルの作成や削除、テーブル内のデータの操作を行えます。

1. HBase シェルを開くには、まずクラスターへの RDP 接続を有効にして、クラスターに接続します。

クラスターが作成されると、Azure ポータルの HDInsight サービスに表示されます。

クラスターの [CONFIGURATION] タブを開きます。

ページ下部にある [ENABLE REMOTE] ボタンをクリックして、クラスターへの RDP 接続を有効にします。

[CONFIGURATION] タブの下部の [CONNECT] ボタンをクリックします。

2. HBase シェルを開きます。

RDP セッションで、デスクトップにある Hadoop コマンド プロンプトのショートカットをクリックします。

以下を実行し、HBase シェルを開きます。

cd %HBASE_HOME%\bin

hbase shell

 

3. サンプル テーブルを作成し、1 つの行を追加し、テーブルの行を一覧表示してみましょう。それには次を実行します。

create ‘sampletable’, ‘cf1′

put ‘sampletable’, ‘row1′, ‘cf1:col1′, ‘value1′

scan ‘sampletable’

 

HBase や HDInsight の詳細については、次のサイトをご覧ください。