Azure HDInsight 中的 HBase 正式營運
原文發表於 Azure HDInsight makes HBase (NoSQL database) a GA Feature
在 2014 年 6 月,我們在 Azure HDInsight 中提供了 HBase 的預覽服務,而在 8 月 21 號,我們正式推出 HBase 的服務(同時也釋出了包含了像是 Azure DocumentDB、Azure Search 等服務)。Apache HBase 是 Apache Hadoop 生態系中,一個基於行式(columnar)的 NoSQL(Not only Structured Query Language)分散式資料庫的專案。
HBase 在 Apache Hadoop 生態系中提供了資料交易操作的功能,讓用戶能夠迅速地在 Azure Blob 儲存體中儲存資料,以及從大筆的資料中進行查詢。由於是分散式的資料庫架構,HBase 能夠依據負載及效能的需求來延展,所以 HBase 非常適合需要處理數以幾百萬或幾十億資料量的用戶(正式營運後,Azure HDInsight 中的 HBase 能支援 Azure Blob 儲存體中 500 TB 的資料),當然,HBase 缺乏了一些像是優化功能、第二層索引、以及進階的查詢語法,所以無法取代現有的關聯式資料庫管理系統(RDBMS)。
關於 HBase 一些常見的應用包括了:
- 物聯網(IoT, Internet-of-Things) — HBase 能夠儲存由各式各樣的裝置、感測器、設備及社交網路來的大量即時資料,資料儲存在 Azure Blob 儲存體中,而 Azure HDInsight 及 HBase 則可以進行一些批次運算,來處理或分析這些大量的資料。
- Web 記錄(Logs) — 可以用來處理網站的記錄檔(logs)或是一些點擊追蹤(clickstream)的資料,一樣由 Azure HDInsight 來處理及分析資料。
- 社交網路資料 — 用來儲存從社交網路來的大量資料。
我們在 Azure 的官方網站上提供了許多關於 HBase 的學習資料,歡迎您多加利用:
- Overview of HBase: https://azure.microsoft.com/zh-tw/documentation/articles/hdinsight-hbase-overview
- Get started with HBase: https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-get-started
- Real-time social sentiment analysis using HBase: https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-analyze-twitter-sentiment
- 更多關於 HDInsight 的文件: https://azure.microsoft.com/en-us/documentation/services/hdinsight/
另外,如果您想瞭解關於 Hadoop 以及 HDInsight 可以參考下列資料:
- 認識 Azure HDInsight (Hadoop) https://azure.microsoft.com/en-us/services/hdinsight/
- 觀看 Channel 9 上關於立即上手 HDInsight 的系列影片: https://channel9.msdn.com/Series/Getting-started-with-Windows-Azure-HDInsight-Service