Azure HDInsight: クラスターのカスタマイズ機能の一般提供開始と、Spark、R、Giraph、Solr などの Hadoop プロジェクト用テンプレートの追加の発表
このポストは、12 月 18 日に投稿された Azure HDInsight Makes Cluster Customization Generally Available And Provide more Templates for Hadoop projects including Spark, R, Giraph, and Solr の翻訳です。
11 月にパブリック プレビューを発表した Script Action は、Apache Hadoop エコシステムで提供されている各種プロジェクトを使用して HDInsight クラスターをカスタマイズできる機能です。新しい Hadoop プロジェクトが使用可能になると、すぐに追加することができます。プロジェクトの追加は、強力かつ柔軟に Hadoop クラスターをカスタマイズできる PowerShell のスクリプトで行います。このカスタマイズ オプションは、Hadoop、HBase、Storm などのあらゆる種類の HDInsight クラスターで使用可能です。
このたびこの Script Action の一般提供が開始され、クラスターのカスタマイズが完全にサポートされるようになりました。これにより、今後は上記のようなカスタマイズ操作を、PowerShell だけでなく GUI でも実施することができます。つまり、Script Action のユーザー インターフェイスから、スクリプトの URI、実行を許可するノードの種類、スクリプトのパラメーターを指定することができます。
また、パブリック プレビューの Spark (英語) と R (英語) に加えて、Giraph (英語) と Solr (英語) にもサンプル ドキュメントを追加しました。エンティティどうしの関係をモデル化する際にはグラフと呼ばれるデータ構造を使用します。Giraph (英語) は Hadoop ベースのグラフ処理システムです。エンティティである Web ページと、関係をマッピングするハイパーリンクの構造から構成される Web グラフがその例です。Solr は一般的なオープン ソースの検索プラットフォームで、おなじみの Web サイトやアプリケーションでも広く使用されています。これらの機能を HDInsight に統合することで、ユーザーが Hadoop の HDFS に格納されているデータを検索し、全文検索を実行したり、表やテキスト、地理位置情報、センサーなどのさまざまな種類のデータでインデックスを作成したりすることができます。
クラスターのカスタマイズ機能を使用すると、HDInsight ユーザーは、Hadoop エコシステムで入手可能なさまざまなコンポーネントやランタイムのデプロイやテストができます。今回リリースされた新機能をぜひお試しください。使用方法の詳細については、下記のリンク先の資料をご参照ください。