Azure HDInsight で HBase (NoSQL データベース) の一般提供を開始
このポストは、8 月 25 日に投稿した Azure HDInsight makes HBase (NoSQL database) a GA Feature の翻訳です。
マイクロソフトは 6 月 6 日に Azure HDInsight の HBase をプレビューとしてリリースしたことを発表しました。また 8 月 21 日には、Azure DocumentDB と Azure Search のプレビューと並んで、HBase の一般提供 (英語) を発表しました。Apache HBase は、Apache Hadoop エコシステムを構成する単票形式の NoSQL (「Not only Structured Query Language」、つまり、SQL を使わない) 分散データベース プロジェクトです。
HBase は Hadoop エコシステムにトランザクション機能を提供し、Azure Blobs の大規模なデータセットの迅速なレコード更新や検索を可能にします。分散データベースである HBase は、負荷やパフォーマンスのニーズの増大に合わせて拡張できるよう設計されています。つまり、HBase は数百万行から十数億行にも上る膨大なデータのトランザクション処理が必要なお客様に最適だということがわかります (一般提供時には、Azure Blobs で最大 500 テラバイトをサポートする予定です)。ただし HBase には、オプティマイザー、セカンダリ インデックス、高度なクエリ言語といった機能がないため、標準的な RDBMS を完全に置換するものではありません。
HBase の一般的な使用例として、以下のようなものがあります。
- モノのインターネット (Internet of Things) – デバイス、センサー、装置/機器、あるいはソーシャル メディアからは数百万件ものリアルタイム イベントが上がってきますが、こうしたデータを処理するためのストレージとして HBase が利用できます。これにより、Azure Blobs に格納されたデータを HDInsight の Hadoop で一括分析することができます。
- Web のログ – HBase を使用して、Web のログとクリックストリーム データの格納やインデックス化を行うことができます。これにより、こうしたデータを HDInsight の Hadoop で一括分析することが可能です。
- ソーシャルセンチメント – HBase を使用して、Twitter などのソーシャル メディア上で交わされる大量のセンチメント データを書き込み、格納することができます。
HBase の詳細については、以下の HDInsight のドキュメントや入門ガイドでご確認いただけます。ぜひご覧ください。
- HBase の概要: https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview (英語)
- HBase の使用方法: https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-get-started (英語)
- HBase を使用したリアルタイムのソーシャル センチメント分析: https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-analyze-twitter-sentiment (英語)
- その他の HDInsight 関連ドキュメント: https://azure.microsoft.com/ja-jp/documentation/services/hdinsight/
また、以下の Hadoop と HDInsight の関連資料もぜひご確認ください。
- Azure HDInsight (Hadoop) の関連資料: https://azure.microsoft.com/ja-jp/services/hdinsight/
- Channel 9 の HDInsight 入門ガイドのビデオ シリーズ: https://channel9.msdn.com/Series/Getting-started-with-Windows-Azure-HDInsight-Service (英語)