Azure HDInsight を使用する場合
HDInsight を使用すると、履歴またはリアルタイムのデータを使って、さまざまなシナリオでビッグ データを処理できます。でも、そうすべきなのでしょうか。 HDInsight の最大の強みは、幅広い構成が提供されることです。 このユニットでは、HDInsight がご自分の組織に適した選択肢であるかどうかを検討します。 次の基準を分析して、決定に役立てます。
- ワークロードの範囲
- スケーラビリティ
- フォールト トレランス
- セキュリティ
意思決定の基準
HDInsight が組織のビッグデータのニーズを満たすことができるかどうかを判断するには、次の表に示す基準を使用します。
条件 | 分析 |
---|---|
ワークロードの範囲 | さまざまなワークロードをサポートする必要がある場合は、それらの要件をサポートできるプラットフォームが必要になります。 |
スケーラビリティ | 組織は、データ量とデータ速度の増加に合わせて拡張する必要がありますか。 自動的にスケーリングでき、コンピューティングとストレージのスケーリングを個別にサポートできるプラットフォームを選択することが重要です。 |
フォールト トレランス | コンポーネントに障害が発生してもデータ分析を続ける必要がある場合は、フォールトトレラント プラットフォームを選択する必要があります。 |
Security | ほとんどの組織は、扱うデータが保存時および転送中にセキュリティで保護されることを期待しています。 ほぼすべての組織にとって、政府のコンプライアンス基準を満たすことも重要です。 |
基準を適用する
組織でビッグ データをどのように処理したいかを検討します。 次に、意思決定の基準を適用して、HDInsight が適切な選択であるかどうかを判断します。
ワークロードの範囲: HDInsight を使用して、さまざまなワークロードをサポートできます。 これらのワークロードには、バッチ データ処理、ストリーミング データの処理、データウェアハウスやデータ サイエンス ワークロードの管理などがあります。 この機能により、特にビジネスプロセスに複数のワークロードが含まれている場合に、HDInsight は魅力的な選択肢となります。
スケーラビリティ: HDInsight は、独立したスケーラブルなコンピューティングとストレージをサポートしています。 また、ワーカー ノードで、ワークロードまたはスケジュールに基づいて自動スケールできます。
ヒント
コンピューティングとストレージを分離し、クラスターの自動スケーリングを行うことで、コストを大幅に最適化できます。
フォールト トレランス: HDInsight のヘッド ノードは障害に対する回復力があり、フォールトトレラントな VM によって支えられています。 これにより、SLA 99.9% の高可用性サービスとなります。
セキュリティ: Microsoft Entra 統合には、エンタープライズ セキュリティの認証と認可が備わっています。 暗号化および仮想ネットワークのサポートに加えて、これらの機能を使用することで、データにアクセスできるユーザーをきめ細かく制御できます。
要約すると、次の場合に HDInsight を使用することを検討します。
大量のデータを大規模に収集して、次のことを行いたい場合。
- リアルタイムの分析情報を得る。
- 最適化されたコスト、最小限の労力、および強力なセキュリティを使用してデータを処理する。
移行:
- オンプレミスのオープンソース ソフトウェアでベンダーがパッケージ化した Hadoopディストリビューションを可能な限りコストと労力を抑えながら移行する。
- オープンソース ソフトウェアのビッグデータ サービスを競合他社のクラウド オファリングから Azure に移行する。