クラウド管理のインベントリと可視性
運用管理は、データに明確に依存しています。 一貫した管理には、管理対象のもの (インベントリ) とそれらの管理対象のワークロードと資産の経時変化 (可視性) を理解することが必要です。 インベントリと可視性に関する明確な分析情報があれば、チームは環境を効果的に管理できるようになります。 その他のすべての運用管理アクティビティとプロセスは、これら 2 つの分野に基づいています。
測定の重要性に関する昔ながらの表現を使って、この記事の方向性を示します。
- それは、"重要なものを管理すること" です。
- 管理できるのは、測定できるものだけです。
- 測定できない場合、問題にならない可能性があります。
インベントリと可視性の規範は、このような時代を超越したフレーズに基づいています。 運用管理プロセスを効率的に確立するには、その前にデータを収集し、適切なチームに適切なレベルの可視性を作成することが重要です。
一般的なお客様の課題
インベントリと可視性のプロセスが一貫して適用されない場合、運用管理チームは、ビジネスの中断量が多くなり、復旧までの時間が長くなり、問題のトラブルシューティングとトリアージに必要な作業が多くなる可能性があります。 変更は優先度の高いアプリケーションと多数の資産に悪影響を与えるため、このようなメトリックはさらに速く増加します。
こうした課題は、次のような一貫したデータとテレメトリの読み取りによってのみ答えが得られるいくつかの質問から生じています。
- 現在の状態のパフォーマンスは、標準の運用パフォーマンス テレメトリからどのくらい逸脱していますか。
- ワークロード レベルでビジネスの中断を引き起こしているのはどの資産ですか。
- このワークロードやビジネス プロセスの許容可能なパフォーマンスに戻すには、どの資産を修復する必要がありますか。
- 逸脱はいつ始まりましたか。 トリガーは何でしたか。
- 基の資産にどのような変更が加えられましたか。 誰が行いましたか。
- 変更は意図的に行われましたか。 悪意はありましたか。
- 変更がパフォーマンス テレメトリに与えた影響はどのくらいですか。
ログとテレメトリ データの豊富で一元化されたソースなしでは、このような質問に答えることは不可能ではありませんが、困難です。 データを一元管理するために必要な一貫した構成を確保してクラウド管理を実現するには、最初にプロセスを定義してベースライン サービスを開始する必要があります。 well-defined なプロセスは、一貫した構成がどのようにデータ収集を実施しているかをキャプチャし、インベントリのコンポーネントと次のセクションで列挙する可視性をサポートします。
インベントリと可視性のコンポーネント
クラウド プラットフォームで可視性を構築するには、いくつかの重要なコンポーネントが必要です。
- 責任と可視性
- インベントリ
- 一元的なログ記録
- 変更の追跡
- パフォーマンス テレメトリ
責任と可視性
各ワークロードのコミットメントを確立する際には、管理責任が重要な要素になります。 責任が委任されている場合は、委任の可視性が必要になります。 インベントリと可視性に向けた最初のステップは、責任者が適切なデータにアクセスできるようにすることです。 何らかの可視化用クラウドネイティブ ツールを実装する前に、各監視ツールが各運用チームの適切なアクセスとスコープを持っていることを確認します。
インベントリ
資産が存在することを知っている人がいなければ、資産の管理は困難です。 資産またはワークロードを管理する前に、インベントリを作成し、分類する必要があります。 安定した運用に向けた最初の技術的なステップは、インベントリの検証とインベントリの分類です。
一元的なログ記録
一元的なログ記録は、運用管理チームが日々必要とする可視性にとって重要です。 クラウドにデプロイされるすべてのアセットがログを中央の場所に記録することをお勧めします。 Azure では、その中央の場所とは Log Analytics です。 中央でのログ記録によって、変更管理、サービス正常性、構成、および IT 運用の他のほとんどの側面に関するレポートが推進されます。
一元的なログ記録を一貫して使用することは、反復可能な運用を確立するための最初の手順です。 強制は、企業のポリシーによって実現できます。 ただし、一貫性を確保するために、可能なかぎり実施を自動化する必要があります。
変更の追跡
変更は、テクノロジ環境における定数の 1 つです。 信頼性の高い運用には、複数のワークロードにわたる変更の認識と理解が不可欠です。 クラウド管理ソリューションには、技術的な変更の "タイミング、方法、理由" を理解する手段が含まれている必要があります。 そのようなデータ ポイントがないと、修復作業が妨げられます。
パフォーマンス テレメトリ
データはクラウド管理に関するビジネスのコミットメントを推進します。 コミットメントを適切に維持するには、クラウド運用チームがワークロードの安定性、パフォーマンス、運用に関するテレメトリを理解する必要があります。 クラウド運用チームは、ワークロードをサポートするアセットも理解する必要があります。
ネットワーク、DNS、オペレーティング システム、および環境のその他の基本的な側面の継続的な正常性と運用は、あらゆるワークロードの全体的な正常性を考慮する上で重要なデータ ポイントです。
処理
クラウド管理プラットフォームの機能と比較すると、クラウド管理プロセスは、考慮事項の中でより重要になる場合があります。これによってビジネスにおける運用コミットメントが実現されるためです。 クラウド管理の方法論には、少なくとも次のプロセスが含まれている必要があります。
- 事後対応型の監視: 業務に悪影響を及ぼす逸脱に対処するのは誰ですか? 逸脱を修復するためにどのような措置が取られますか。
- 事前対応型の監視: 逸脱が検出されたが業務は影響を受けていない場合、そのような逸脱には、誰がどのように対処しますか?
- コミットメント レポート: ビジネス コミットメントの準拠は、業務の利害関係者にどのように伝えられますか。
- 予算の確認: 予算に計上されたコストに対して、そのコミットメントを確認するプロセスはどのようなものですか。 展開されたソリューションを調整するプロセス、または配置を作成するコミットメントはどのようなものですか。
- エスカレーション パス: 上記のプロセスのいずれかがビジネスのニーズを満たすことができない場合、どのエスカレーション パスを使用できますか。
インベントリと可視性に関連するプロセスは複数あります。 上記のリストは、運用チーム内の思考を促すように設計されています。 質問の一覧に回答すると、いくつかの必要なプロセスを開発するのに役立ち、新しくより深い質問が引き出される可能性があります。
役割
運用監視のプロセスを開発する場合、毎日の運用と各プロセスの定期的なサポートの責任を決定することも同様に重要です。
一元化された IT 組織では、IT が運用の専門知識を提供します。 問題に修復が必要な場合、ビジネスは相談的な性質を帯びます。
優れた組織のクラウド センターにおいては、業務とは専門知識を提供し、このようなプロセスの管理に責任を持つものです。 IT は、チームが環境を運用する際のチームのオートメーションとサポートに焦点を当てます。
上記のリスト項目は、一般的な責任の例です。 多くの場合、ビジネス コミットメントを満たすには、組織にさまざまな役割が必要です。
インベントリと可視性に基づいて行動する
クラウド プラットフォームに関係なく、インベントリと可視性の 5 つのコンポーネントは、ほとんどの運用プロセスを促進するために使用されます。 後続のすべての規範は、キャプチャされているデータに基礎を置きます。 このシリーズの次の記事では、そのデータに基づいて行動し、他のデータ ソースを統合する方法について説明します。
共有の可視性
アクションのないデータから得られるものはほとんどありません。 クラウド管理は、クラウドネイティブのツールとプロセス以外にも拡大する可能性があります。 より広範なプロセスに対応するには、クラウド管理ベースラインを拡張して、レポート、IT サービス マネジメントの統合、またはデータの一元化を含める必要があります。 運用の成熟度のさまざまな段階に応じて、クラウド管理には、以下の規範を 1 つ以上含める必要がある場合があります。
レポート
多くの場合、ビジネス上の関係者へのコミットメントに関するオフライン プロセスとコミュニケーションには、レポートが必要です。 セルフサービス レポートまたは定期的なレポートは、強化された管理ベースラインの必須のコンポーネントです。
IT サービスマネジメント (ITSM) の統合
ITSM の統合は、多くの場合、インベントリと可視性に基づいた行動の最初の例です。 想定されるパフォーマンス パターンからの逸脱が発生すると、ITSM 統合はクラウド プラットフォームからのアラートを使用して、個別の ITSM ツールの修復アクティビティをトリガーするためのチケットをトリガーします。 一部の運用モデルでは、強化された管理ベースラインの一部として ITSM の統合が必要になる場合があります。
データの一元化
企業が 1 つのクラウド プロバイダー内で複数のテナントを必要とするのにはさまざまな理由があります。 このようなシナリオでは、こうしたテナントまたは環境全体の可視性を実現するために、データの一元化は強化された管理ベースラインの必須のコンポーネントです。
次のステップ
運用のコンプライアンスは、管理のオートメーションと制御を適用することにより、インベントリの機能に基づいて構築されます。 運用のコンプライアンスがプロセスにどのようにマップされるかを確認してください。