診断テストについて
Microsoft HPC Pack には、一般的に使用される一連の診断テストが用意されています。 これらのテストを使用すると、デプロイの検証、エラーのトラブルシューティング、パフォーマンスの低下の検出に役立ちます。 このトピックでは、HPC Pack のインストール時に既定で含まれる System テストについて説明します。 HPC Services for Excel テスト、新しく利用可能なテスト、カスタム診断の作成については、オンライン診断リソース を参照してください。
システム 診断テストは概念的にスイート別にグループ化されます。 このトピックの次のセクションでは、各スイートのテストと、該当する場合は、テストの構成可能なパラメーターについて説明します。
Deployment Environment Validator (HPC Pack 2008 R2 Service Pack 1 で追加されたテスト)
SOA の
Windows Azure (HPC Pack 2008 R2 Service Pack 2 で追加されたスイート)
配置環境検証コントロール
このスイートのテストは、ベア メタル ノードのデプロイに影響する可能性がある一般的な問題を見つけるのに役立ちます。 詳細については、「ノードをデプロイする前に環境を検証する」を参照してください。
手記
フェールオーバー クラスターとして構成されているヘッド ノードの場合、デプロイ環境検証コントロールはアクティブなヘッド ノードのみをチェックします。 追加のチェックのために、もう一方のヘッド ノードでテストをフェールオーバーして実行することが必要になる場合があります。 通常、同様の構成を持つフェールオーバー クラスター内のヘッド ノードと、2 つのヘッド ノード間の異なる問題は一般的ではありませんが、(致命的な障害が発生した後に新しく回復/復元されたヘッド ノードで) 復旧後にテストを実行することをお勧めします。
診断 | 形容 |
---|---|
展開: DHCP テスト | すべてのネットワークの DHCP サーバーの可用性を確認します。 |
デプロイ: DNS テスト | すべてのネットワークの DNS サーバーの可用性を確認し、DNS サーバーの IP アドレスを報告します。 |
デプロイ: 資格情報テスト | インストール資格情報が有効な HPC ユーザーの資格情報であることを確認します。 詳細については、「インストール資格情報 |
展開: Active Directory 接続テスト | ドメイン コントローラーへの接続を確認し、応答時間を報告します。 |
展開: IPsec テスト | エンタープライズ ネットワークでインターネット プロトコル セキュリティ (IPsec) が有効になっているかどうかを確認します。 グループ ポリシーを使用してドメインに IPsec が適用されている場合は、展開中に問題が発生する可能性があります。 たとえば、IPsec では、ポートをブロックすることで、コンピューティング ノードがヘッド ノードと通信できないようにすることができます。 |
展開: Windows Deployment Services テスト | Windows 展開トランスポート サービスが有効になっていて、展開サーバーがインストールされていないことを確認します。 Windows 展開サービスを使用すると、PXE 対応コンピューターへのリモート Windows インストールが可能になります。 HPC Pack では、Windows 展開サービス ロールのトランスポート サーバー ロール サービスのみが使用されます。 展開サーバーの役割サービスをインストールする必要はありません。 |
展開: Windows イメージと共有テストのインストール | 各ノード テンプレートのインストール イメージと、展開に使用される Windows プレインストール環境 (Windows PE) イメージが見つからないか、破損しているか、または別のプロセスによってロックされていないこと、および Windows PE イメージのサイズが 300 MB を超えていないことを確認します。 インストールに使用する共有フォルダーが存在し、適切なアクセス許可を持っていることを確認します。 「ノード テンプレート について」も参照してください。 Windows PE は、Windows インストール用のコンピューターの準備、ネットワーク ファイル サーバーからのディスク イメージのコピー、Windows セットアップの開始、ノードのイメージのキャプチャに使用されます。 |
デプロイ: NAT テスト | コンピューティング ノードが一部のトポロジでエンタープライズ ネットワークと通信できるように、ヘッド ノードでネットワーク アドレス変換 (NAT) が正しく構成されていることを確認します。 |
デプロイ: ファイアウォール テスト |
テストが HPC Pack 2008 R2 Service Pack 1 に追加されました。 プライベート およびアプリケーション クラスター ネットワーク内のネットワーク アダプターのファイアウォールがオフになっていることを確認します (つまり、これらのネットワーク アダプターが Windows ファイアウォールから除外されていることを確認します)。 また、ヘッド ノードで必要な受信ファイアウォール規則と送信ファイアウォール規則が正しく構成されていることも確認します。 詳細については、「HPC クラスター ネットワーク」の「Windows ファイアウォールの構成」セクションを参照してください。 |
展開: ポートオープン テスト |
Service Pack 1 を使用して HPC Pack 2008 R2 に追加されたテスト。 次の TCP ポートが Windows ファイアウォールで開かれていることを確認します。 - 1856 - 6729 - 6730 - 9094 - 9095 - 9096 - 9794 - 9892 - 9893 - 9894 ヘッド ノード上のクラスター サービスとクラスター内の他のノードとの間の通信に HPC Pack で必要なポートについては、「HPC クラスター ネットワークの Windows ファイアウォール構成」セクションを参照してください。 |
デプロイ: バインド順序テスト |
Service Pack 1 を使用して HPC Pack 2008 R2 に追加されたテスト。 エンタープライズ ネットワークが、既定のネットワーク ゲートウェイのバインド順序の最初のネットワークとして設定されていることを確認します。 エンタープライズ ネットワークの前にプライベート ネットワークが表示されている場合は、エンタープライズ ネットワーク上の Active Directory ドメイン コントローラーとの通信に問題が発生する可能性があります。 |
デプロイ: HA 仮想ネットワーク リソース テスト |
Service Pack 1 を使用して HPC Pack 2008 R2 に追加されたテスト。 高可用性のためにヘッド ノードがフェールオーバー クラスターで構成されている場合は、フェールオーバー クラスターの仮想ネットワーク リソースが正しく構成されていることを確認します。 フェールオーバー クラスターでヘッド ノードを構成した後、フェールオーバー クラスターは 1 つの物理サーバーに関連付けられていないため、物理サーバーの名前と IP アドレスを持つことはできません。 フェールオーバー クラスターには、仮想ヘッド ノード名と、フェールオーバー クラスター内の 2 つのヘッド ノードの物理名と IP アドレスとは異なる対応する仮想 IP アドレスが必要です。 これにより、エンタープライズ ネットワークとプライベート ネットワーク上の通信は、仮想名と IP アドレスによって任意の時点で現在アクティブなヘッド ノードに接続でき、アクティブなヘッド ノードが失敗し、機能がパッシブ ヘッド ノードに切り替わった場合に通信が中断されないようにします。 詳細については、「ヘッド ノードの高可用性のための Microsoft HPC Pack の構成」を参照してください。 |
MPI パフォーマンス
Message Passing Interface (MPI) ping-pong テストは、ペアになっているノード間でデータのパケットを繰り返し送信することで、クラスター上のノード間のネットワーク待機時間とスループットを測定します。 待機時間は、パケットが 1 対のノード間でラウンド トリップを行うのにかかる時間の半分 (マイクロ秒単位) の平均です。 スループットは、ノードのペア間のデータ転送の平均速度 (MB/秒) です。 MPI ping-pong テストを実行するときに、実行モードと使用するネットワークを指定できます。
大事な
MPI ping-pong テストで正確な結果を得るには、シリアル モード (使用可能な場合) でテストを実行し、ノードでジョブが実行されていないことを確認します。 ノードがジョブを実行している場合、テストは待機時間とスループットの正確な測定値を返しません。
実行中のモード パラメーターには、次の値があります。
リング: リング テスト (最近隣テストとも呼ばれます) では、ノードはリング パターンで一度に 1 組ずつパケットを送信します。 1 組のノードがテストを実行している間、他のすべてのノードはアイドル状態のままになります。 最初のノードは、その隣接ノードとペアになります。 最初のペアのテストが完了すると、次のノードも同様に近隣ノードとペアになります。 この順次ペアリングとテストは、テストが HPC クラスター内のすべてのノードをカバーし、各ノードが 2 つの近隣ノード (リングの周りの各方向に 1 つずつ) とペアになるまで続行されます。
リング モードを使用すると、最小限の時間で HPC クラスターのパフォーマンスを適切に示すことができます。 各ノードはクラスター内のすべてのノードではなく、2 つの近隣ノードのみでテストされるため、リング テストはシリアルまたはトーナメント スタイルのテストよりも時間がかかります。
シリアル: シリアル モードでは、一度に 1 つのノード ペアで MPI ping-pong テストが実行されます。 1 組のノードがテストを実行している間、他のすべてのノードはアイドル状態のままになります。 1 組のノードがテストを完了すると、別のノード ペアに対してテストが実行され、個々のペアのこのテストは、可能なすべてのノード ペアがテストされるまで順次実行されます。
シリアル モードを使用すると、HPC クラスターに少数のノードがある場合に、ノード間のすべての個々のネットワーク リンクを徹底的にテストできます。 このモードでは、待機時間またはスループットを最も正確に測定できます。 シリアル テストでは、一度に 1 つのペアのノードのすべての可能なペアで MPI ping-pong テストが実行されるため、多数のノードに対して長い時間がかかる場合があります。
トーナメント: トーナメント モードでは、トーナメントと同様に、MPI ping-pong テストが複数のラウンドで実行されます。 各ラウンドで、HPC クラスター内のすべてのノードがペアになります。 各ペアの 2 つのノードは互いにパケットを送信し、すべてのペアが並列でパケットを交換します。 1 つのラウンドが完了すると、前のラウンドで使用されていたのとは異なるノード ペアリングセットを使用して、別のラウンドが開始されます。 可能なすべてのノード ペアがテストされるまで、ラウンドは続行されます。 このモードのテストは最速で完了し、ネットワーク スイッチは最も負荷が高い。
トーナメント モードを使用して、指定したネットワークのインフラストラクチャと、読み込まれたときに実行される方法をテストできます。 測定された待機時間とスループットは、読み込まれたクラスターの待機時間とスループットであるため、ネットワーク ハードウェアの製造元の仕様と好ましく比較されない場合があります。
手記
mpipingpong コマンドを使用して、追加の引数を使用してテストを実行し、追加の出力を取得できます。
診断 | 形容 |
---|---|
MPI Ping Pong: 待機時間 | このテストでは、ノード間通信の帯域幅と待機時間を測定します。 これはパフォーマンス テストであるため、正確な結果を得るには、オフラインで他のジョブを実行していないノードでこのテストを実行します。 パラメーター: テストおよび実行モードに使用するネットワークを指定できます。 既定では、このテストは Tournament モードで実行されます。 トーナメント モードを使用して待機時間を測定すると、パケットが小さく、過剰にサブスクライブされたネットワーク スイッチであってもパケットが妨げられないため、テストでは各ラウンドの同時待機時間測定にノイズがほとんど発生しません。 より正確な待機時間の測定を得るために、必要に応じて、シリアル モードを使用して、すべてのペアを直列にテストします。 |
MPI Ping Pong: スループット | クラスター上の隣接するノード間のネットワーク スループットを測定します。 パラメーター: テストと実行モードに使用するネットワークを指定できます (シリアル または トーナメント)。 既定では、このテストはシリアル モード |
MPI Ping Pong: 単純なスループット | クラスター上の隣接するノード間のネットワーク スループットを測定します。 パラメーター: テストに使用するネットワークを指定できます。 リング モードを使用して、クラスター内の隣接するノードのペア間でのみスループットを測定します。 これにより、指定されたネットワーク間の接続を適切に検証できます。 より正確なスループット測定を行う場合は、MPI Ping Pong: Throughput テストを実行します。 |
ネットワークの状態
このスイートのテストは、クラスター ネットワークの構成を確認するのに役立ちます。 これらのテスト用に構成できるパラメーターはありません。
診断 | 形容 |
---|---|
ファイアウォール構成レポート | 選択したノードのファイアウォールの状態 (有効または無効) を報告します。 このテストでは、ファイアウォール経由でアクセスが許可されているアプリケーションまたはサービス (ファイアウォールの例外) も報告されます。これには、使用しているポート番号も含まれます。 HPC Networksのファイアウォール構成について |
ネットワーク構成レポート | 選択した各ノードのネットワーク アダプターの構成を報告します。 |
ネットワークのトラブルシューティング
このスイートのテストは、クラスター ノードのネットワーク接続を確認するのに役立ちます。
診断 | 形容 |
---|---|
DNS テスト | 選択したノード間のドメイン ネーム システム (DNS) の名前解決を検証します。 |
ドメイン接続テスト | 選択したノードと各ドメイン コントローラー間の接続を確認します。 |
Ping テスト | 各ノードと選択したグループ内の他のすべてのノードの間で ping テストを実行して、選択したノード間のネットワーク接続を確認します。 パラメーター: テストに使用するネットワークとノードごとの ping の数を指定できます。 |
手記
HPC Pack ツール パックには、ネットワークの問題のトラブルシューティングに役立つ、HPC Pack ベースのクラスター内のネットワーク情報を収集して分析する追加の診断テストであるネットワークトラブルシューティング レポートが含まれています。 InfiniBand ネットワークがある場合、レポートには、そのネットワーク内のホスト チャネル アダプター (HCA) カードの状態と機能も含まれます。 詳細については、「ネットワークトラブルシューティングレポート診断テストをインストールして使用する」を参照してください。
サービス
このスイートのテストとレポートは、選択したノードで必要な HPC サービスが実行されていることを確認し、サービス エラーのトラブルシューティングを行うのに役立ちます。
診断 | 形容 |
---|---|
サービス構成レポート | 選択したノードにインストールされているすべての実行中のサービスとそのスタートアップ構成設定を報告します。 |
サービスの状態レポート | 選択したノードのイベント ログ内の HPC イベントを報告します。 パラメーター: イベント ログを確認する距離を示す 時間数 を指定できます (1 から 50 時間前)。 Log count パラメーター (1 から 100) を設定して、レポートするイベントの数を制限することもできます。 |
テストを実行しているサービス | 選択したノードで HPC サービスが実行されていることを確認します。 想定されるサービスは、ターゲット ノード (ヘッド ノード、コンピューティング ノード、または WCF ブローカー ノード) の役割によって決まります。 このテストでは、省略可能なサービスが存在する場合は状態を報告できますが、必要なサービスに対してのみ検証されます。 |
SOA
SOA サービス読み込みテスト は、指定したサービスの DLL を指定したノードに読み込むことができることを確認し、DLL の依存関係が検出された場合はノードに存在することを確認します。 既定では、このテストでは、組み込みの CcpEchoSvc サービスを使用して、クラスター上の SOA 機能を検証します。
特定のサービスを読み込むことができることを確認するには、テスト パラメーターでサービスの名前を指定します。
システム構成
このスイートのレポートでは、選択したノードのアプリケーション構成とソフトウェア更新プログラムに関する情報が提供されます。
診断 | 形容 |
---|---|
アクティブな電源スキーム レポート |
テストが HPC Pack 2012 に追加されました。 アクティブな電源スキーム (プラン) をレポートし、選択したノードのオペレーティング システムで構成されているすべての既存の電源スキームを一覧表示します。 |
アプリケーション構成レポート | 選択したノードにインストールされているアプリケーション (バージョン番号を含む) を報告します。 結果には、インストールされているすべてのアプリケーションを一覧表示するテーブルと、そのアプリケーションがインストールされているノードの数が含まれます。 ノードごとに結果を表示することもできます。 |
ノード レポートで使用可能なソフトウェア更新プログラム | 選択したノードで使用できるソフトウェア更新プログラムを報告します。 テストでは、Windows Server Update Services (WSUS) または Microsoft Update によって重要と識別された更新プログラムが報告されます。 診断は Microsoft Update クライアントと通信し、ノードに関連する更新プログラムのみが診断に報告されるように更新プログラムをフィルター処理します。 winhttp プロキシがコンピューティング ノードに設定されていない場合、このテストは失敗します。 netsh winhttp show proxy コマンドを実行して、ノードにプロキシ サーバーが設定されているかどうかを確認します。エンタープライズ WSUS サーバーを使用して、またはノード テンプレートを使用して更新プログラムを適用する方法の詳細については、「更新ノードのステップバイステップ ガイドのベスト プラクティス」トピックを参照してください。 |
HPC ソフト カード KSP テスト |
Service Pack 2 を使用して HPC Pack 2008 R2 に追加されたテスト。 選択したクラスター ノードに HPC ソフト カード キー ストレージ プロバイダー (KSP) がインストールされているかどうかを報告します。 この設定により、ノードでタスクを実行するときにソフト カード認証が有効になります。 KSP は、ヘッド ノードとコンピューティング ノードにのみインストールされる個別のインストールです。 クライアント ノードにインストールする必要はありません。 KSP コンポーネントは、コンピューティング ノードで実行されるタスクのスマート カード ログオンを実行するために使用されます。 KSP は、タスクが実行されているマシン上で使用されます。 テストが失敗した場合: HPC ソフト カード KSP はこのコンピューターにインストールされていません。ソフト カード認証を有効にするためにインストールする方法については、Microsoft HPC Pack のリリース ノートを参照してください。 テストに合格した場合: HPC ソフト カード KSP がこのコンピューターにインストールされます。 |
テンプレート レポートのソフトウェア更新プログラムが見つからない/必要な場合 | 選択したノードにインストールされているソフトウェア更新プログラムを、ノード テンプレートの 更新プログラムの適用 タスクで指定された更新プログラムと比較します。 レポートは、コンピューティング ノードが必要な更新レベル (None、Critical、All) を満たさなかったか、またはノード テンプレートで定義されている特定の更新プログラムがないかどうかを示します。 この診断で必要な更新プログラムが見つからないことが報告された場合は、指定されたノードをオフラインにして、 管理アクションを実行します。 ノードでメンテナンス タスクを実行する このテストを実行するには、ノード テンプレートに Apply Updates タスクが含まれている必要があります。 ノード テンプレートにこのタスクが含まれていない場合は、ノード レポート |
ノードにインストールされているソフトウェア更新プログラムレポート | 選択したノードにインストールされている更新プログラムを報告します。 |
Windows Azure
Suite が HPC Pack 2008 R2 Service Pack 2 に追加されました。
このスイートのテストは、クラスター内の Windows Azure ノードにジョブをデプロイして実行できることを確認するのに役立ちます。
診断 | 形容 |
---|---|
Windows Azure Firewall ポート テスト | 既存の内部ファイアウォールと外部ファイアウォールを介して、ヘッド ノードから Windows Azure への通信を検証する簡単なテストを実行します。 このテストは、常に既定の診断テスト資格情報を使用して実行されます。 このテストは、Windows Azure ノードをデプロイする前に実行して、ヘッド ノードと Windows Azure 間のデプロイ、スケジューラ、ブローカー通信を許可するように既存のファイアウォールが構成されていることを確認できます。 このテストでは、選択した TCP ポートの送信通信をヘッド ノードから Windows Azure の hpcazureportcheck.cloudapp.net サービスにチェックします。 hpcazureportcheck.cloudapp.net サービスは、このテストの通信エンドポイントを提供するために Microsoft によってホストされています。 重要: hpcazureportcheck.cloudapp.net は、Windows Azure ノードのデプロイに使用する Windows Azure ホスト型サービスとは関係ありません。 クラスターに Windows Azure ノードをデプロイする必要はありません。これは、Windows Azure Firewall ポート テストでのみ使用されるためです。 テストで確認するファイアウォール ポートは、ヘッド ノードにインストールされている HPC Pack のバージョンで必要なポートです (HPC Pack 2008 R2 SP2 以降)。 HPC Pack 2008 R2 SP2 をインストールしている場合は、次の TCP ポートでの通信がテストされます。 - 80 - 443 - 3389 - 5901 - 5902 - 7998 - 7999 少なくとも HPC Pack 2008 R2 SP3 をインストールしている場合、次の TCP ポートでの通信が既定でテストされます。 - 443 - 3389 重要:
Windows Azure のファイアウォール ポートの詳細については、「Microsoft HPC Packの Windows Azure ノードの |
Windows Azure MPI 通信テスト | MPI 通信が正常に動作していることを確認するために、Windows Azure ノードのペア間で簡単な ping-pong テストを実行します。 このテストは、Windows Azure ノードと同じデプロイ内のノードでのみ実行されます。 |
Windows Azure レポート | デプロイされた Windows Azure ノードのロール インスタンスの名前をレポートします。
重要: HPC Pack 2008 R2 SP3 のインストール後、このテストでは Windows Azure ノードのロール インスタンスの名前が提供されなくなります。 この問題を回避するには、名前を表示する各ノードで次のコマンドを実行します。Set COMPUTERNAME clusrun コマンドを使用するか、新しい診断テストを作成して、ノードのグループでこのコマンドを実行することもできます。 |
Windows Azure サービス接続テスト | ヘッド ノードで実行されているサービスが、Windows Azure ノード テンプレートで指定されたサブスクリプション ID と証明書を使用して Windows Azure に接続できることを確認します。 このテストは、常に既定の診断テスト資格情報を使用して実行されます。 パラメーター: テストに使用するノード テンプレートを指定できます。 既定では、このテストではすべてのノード テンプレートが使用されます。 |
Windows Azure Virtual Network テスト |
テストが HPC Pack 2012 に追加されました。 テストを実行して、すべての Windows Azure ノード テンプレートで構成された Windows Azure Virtual Network サイトが有効であることを確認します。 このテスト用に構成できるパラメーターはありません。 |
その他の参照
診断テストとレポートの実行 の