HDInsight
HDInsight 概要
HDInsight は、Microsoft Azure で利用できる Hadoop サービスです。
HDInsight では、Hortonworks 社 の Hadoop ディストリビューションである Hortonworks Data Platform (以下、 HDP )を使用することが出来ます。
クラウドサービスなので、分散処理基盤の煩雑な物理サーバーの管理を気にすることなく、Hadoop のコンポーネント群を利用することが出来ます。
HDInsight では、既に Hadoop コンポーネントがインストールされたクラスターをデプロイすることが出来ます。HDInsight のクラスタータイプ
目的に応じてクラスターを選択し、デプロイしてください。
HDInsight のクラスタータイプ一覧
- Hadoop
- Spark
- HBase
- Storm
- Interactive Hive(Preview)
- R server
- Kafka(Prview)
それぞのクラスターの詳細については、こちらをご覧ください。
HDInsight クラスターに含まれるコンポーネントとユーティリティ
いずれの HDInsight クラスターをデプロイした場合でも、次のコンポーネントはインストールされています。
- Ambari
- Avro
- Hive
- HCatalog
- Mahout
- MapReduce
- Oozie
- Phoenix
- Pig
- Sqoop
- Tez
- YARN
- ZooKeeper
それぞれのコンポーネントの詳細については、こちらをご覧ください。
次回は、実際にクラスターのデプロイをご紹介します。