Azure Blobs の NoSQL データベースとして HBase クラスターのプレビュー版が Azure HDInsight に登場
このポストは、6 月 6 日に投稿した Azure HDInsight previewing HBase clusters as a NoSQL database on Azure Blobs の翻訳です。
6 月 3 日に、マイクロソフトは HDInsight の更新を発表し、クエリの実行が 100 倍速くなった Hadoop 2.4 のサポートを開始しました。そしてこのたび、HDInsight の Apache HBase (英語) クラスターのプレビュー版をリリースしました。
HBase は低待機時間 (レイテンシ) の NoSQL データベースで、ビッグ データのオンライン トランザクション処理 (OLTP: Online Transactional Processing) が可能です。HBase は、Azure 環境に統合された、管理されたクラスターとして提供されます。クラスターは Azure の BLOB ストレージに直接データを保存するよう構成されており、待機時間 (レイテンシ) が短縮され、パフォーマンスとコストのバランスを取ることができます。これにより、大規模なデータセットを扱うインタラクティブな Web サイトを構築したり、膨大な数の拠点から送られてくる、センサーのデータやテレメトリ データを保存するサービスを構築してそのデータを Hadoop ジョブで分析したりすることが可能になります。
HBase クラスターの作成方法
プレビュー期間中に HBase を試用するには、PowerShell を利用します。
1. Windows Azure PowerShell をインストールします。
2. 環境をセットアップ (英語) します。
3. クラスターの資格情報を変数に代入します。
PS C:\> $creds = Get-Credential
4. HBase クラスターを作成します。
PS C:\> New-AzureHDInsightCluster -Name <クラスター名> -ClusterType HBase -Version 3.0 -Location “West US” `
-DefaultStorageAccountName <ストレージ アカウント名>.blob.core.windows.net -DefaultStorageAccountKey “<ストレージ アカウントのキー>” `
-DefaultStorageContainerName hbasecontainername -Credential $creds -ClusterSizeInNodes 4
HBase クラスターのデータ操作
アプリケーション開発者は REST API (英語)、HBase シェル、および Hive や Pig などさまざまな種類の MapReduce ジョブを通じて HBase データにアクセスできます。HBase シェルのインタラクティブなコンソールを使用すると、HBase クラスターの管理、テーブルの作成や削除、テーブル内のデータの操作を行えます。
1. HBase シェルを開くには、まずクラスターへの RDP 接続を有効にして、クラスターに接続します。
クラスターが作成されると、Azure ポータルの HDInsight サービスに表示されます。
クラスターの [CONFIGURATION] タブを開きます。
ページ下部にある [ENABLE REMOTE] ボタンをクリックして、クラスターへの RDP 接続を有効にします。
[CONFIGURATION] タブの下部の [CONNECT] ボタンをクリックします。
2. HBase シェルを開きます。
RDP セッションで、デスクトップにある Hadoop コマンド プロンプトのショートカットをクリックします。
以下を実行し、HBase シェルを開きます。
cd %HBASE_HOME%\bin
hbase shell
3. サンプル テーブルを作成し、1 つの行を追加し、テーブルの行を一覧表示してみましょう。それには次を実行します。
create ‘sampletable’, ‘cf1′
put ‘sampletable’, ‘row1′, ‘cf1:col1′, ‘value1′
scan ‘sampletable’
HBase や HDInsight の詳細については、次のサイトをご覧ください。
- HDInsight で Hadoop の HBase を利用する (英語)
- マイクロソフトのパートナー Hortonworks の HBase に関するページ (英語)
- Azure HDInsight をお試しください。15 クリックまたは 20 分ほどで Hadoop クラスターをクラウドに作成できます。
- Azure HDInsight のチュートリアルとガイド (英語)
- Channel 9 の Windows Azure HDInsight サービスに関する動画シリーズ (英語)