シングル コピー クラスタの回復動作
適用先: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007
トピックの最終更新日: 2007-10-26
シングル コピー クラスタ (SCC) は、データ アクセスを提供するサービスのために、冗長性を提供しています。サービスの冗長性によって、ホスト ノードに障害が発生した場合にデータ損失を引き起こすことなく、迅速に回復することができます。SCC は、データベースを含む記憶域をフェールオーバー サービスの一部として新しいノードに渡すので、データを失うことなく復元されます。
ただし、SCC では、記憶域サブシステムが単一障害点となります。記憶域サブシステムに全面的な障害が発生すると通常は、1 日停止し、平均 12 時間分のデータが失われます。これは、毎日完全バックアップを行っていることを前提としています。さらに、SCC ソリューションの記憶域構成は通常、Exchange クラスタ ソリューションのその他の種類であるクラスタ連続レプリケーション (CCR) ソリューションに必要な記憶域構成よりも、インストールおよび運用が複雑になります。CCR の詳細については、「クラスタ連続レプリケーション」を参照してください。
SCC の回復動作は、2 種類の停止に分けることができます。
- スケジュールされた停止 スケジュールされた停止は管理者によって開始されます。スケジュールされた停止は、監視システムによって検出された障害から回復するとき、あるいはハードウェアの保守や、ソフトウェアまたはソフトウェア更新プログラムのインストールなどの管理タスクを実行するときに利用できます。
- 計画されていないダウンタイム 計画されていないダウンタイムは、検出された障害に対する回復処理として、システムによって開始されます。計画されていないダウンタイムの検出、および計画されていないダウンタイムからの回復の開始は、Windows クラスタ サービスによって行われます。
次の表では、さまざまな障害の際に予期される回復処理について説明します。障害の中には、管理者が回復を開始する必要のある障害もありますが、それ以外の障害は、Windows クラスタ サービスによって自動的に処理されます。
トリガされる方法は異なりますが、スケジュールされた停止もスケジュールされていない停止も、共有ディスクが正常に移行したという前提で、結果的にパッシブ ノードがアクティブ化され、データベースがマウントされます。構成エラーの可能性によって共有ディスクが正しく移行できない場合も、動作は同じです。影響を受けるデータベースはマウントされません。
注 : |
---|
特定の時点でパッシブ ノードでアクティブ化できるクラスタ化メールボックス サーバーは 1 つだけです。ノードが既にアクティブ クラスタ化メールボックス サーバーをホストしている場合、別のサーバーをオンラインにすることはできません。 |
注 : |
---|
以前のバージョンの Exchange とは異なり、Microsoft Exchange Server 2007 は、データベースにエラーが発生した結果として、SCC のスケジュールされていない自動停止 (フェールオーバー) をトリガしません。 |
障害に対する回復処理
障害の説明 | 処理 | コメント |
---|---|---|
オペレーティング システムの停止エラー、オペレーティング システムの応答停止、ノードの全面的な電源障害、プロセッサ チップ、マザーボード、またはバックプレーンの回復不能な障害、あるいはノードの全面的な通信障害 |
可能な場合はパッシブ ノードへの自動フェールオーバーを利用します。記憶域がオンラインになると、データベースがマウントされます。 |
パッシブ ノードを使用できるようにするためには、障害後にクォーラムを確立できる必要があります。これは、残りのノードがクォーラムにアクセスできるようにする必要があることを意味します。 |
アクティブ ノード全体のストレージ エラー |
ストレージ エラーは、監視システムを通じて報告されます。管理者は、記憶域を回復できますが、回復にバックアップを使用する必要がある場合もあります。 可能な場合はパッシブ ノードへの自動フェールオーバーを利用します。記憶域がオンラインになると、データベースがマウントされます。 |
パッシブ ノードを使用できるようにするためには、障害後にクォーラムを確立できる必要があります。これは、残りのノードがクォーラムにアクセスできるようにする必要があることを意味します。 |
全体のストレージ エラー |
ストレージ エラーは、監視システムを通じて報告されます。管理者は、記憶域を回復できますが、回復にバックアップを使用する必要がある場合もあります。 |
クォーラムおよびデータベースにはアクセスできないため、このエラーは、クラスタ (およびそのすべてのリソース) のエラーとして報告されます。 |
データ センターの障害 |
自動フェールオーバーは、サード パーティのレプリケーション ソリューション以外はサポートされていません。 |
ライブ データからレプリケートしている場合、レプリケーションは同期させる必要があります。 |
オペレーティング システム ドライブの障害 |
自動回復処理は行われません。オペレーティング システム障害が発生しない限り、Exchange では検出されません。根本的な原因ではなく、表面的な障害に基づいて検出されます。 |
オペレーティング システム ドライブの障害は、オペレーティング システムの監視サービスによって報告されますが、この障害によってオペレーティング システムに障害が発生している可能性があります。 |
オペレーティング システム ドライブの容量不足 |
可能な場合はパッシブ ノードへの自動フェールオーバーを利用します。記憶域がオンラインになると、データベースがマウントされます。 |
この障害は、監視サービスを通して報告されます。自動フェールオーバーが行われない、または行うことができない場合は、このシナリオの回復処理については管理者が判断します。 |
アクティブ ノードでのクラスタのパブリック ネットワークのエラー |
全面的な電源障害のシナリオと同じ回復処理が行われます。 |
アクティブ ノードとパッシブ ノードとの間の通信に使用されるハードウェアとソフトウェア以外について、パブリック ネットワークの状態の検出は行われません。実際のクライアント接続の検証は、Exchange 2007 では提供されません。 |
クラスタのパブリック ネットワークの全面的な障害 |
自動回復処理は行われません。 |
パブリック ネットワークが失われた場合、IP アドレス リソースはエラー状態になります。パブリック ネットワークの問題が解決された後で、リソースをオンラインに戻すことができます。 |
クラスタ クォーラムの消失 |
クラスタ化メールボックス サーバーおよびクラスタ クォーラムがオフラインです。 |
このシナリオでは、クォーラムが形成できない場合はサービスが提供されません。 |
インフォメーション ストアの障害 |
インフォメーション ストアのリソースが自動的に再起動されます。 |
エラーが繰り返し発生する場合、管理者は、オンライン状態にするためにクラスタ化メールボックス サーバーの手動でのパッシブ ノードへの移動を試すことができます。 |
アプリケーション (バイナリ ファイル) ドライブの障害 |
自動回復処理は行われません。 |
通常、このシナリオでは別の障害が発生し、その障害が監視サービスを通して報告され、管理者によって回復処理が行われます。このシナリオの回復処理については、管理者が判断します。 |
アプリケーション (バイナリ ファイル) ドライブの容量不足 |
自動回復処理は行われません。 |
監視サービスによってこの状態が報告されます。このシナリオの回復処理については、管理者が判断します。 |
データベースやストレージ グループの完全な損失、またはデータベースの全面的な障害 |
影響を受けたデータベースの再マウントが自動的に試行されます。この試行が失敗した場合、データベースはエラー状態のままとなりますが、クラスタ化メールボックス サーバーのフェールオーバーは行われません。 |
ストレージ グループまたはデータベースが、ソフトウェアの障害または破損によってマウントを解除されたか、ハードウェアの障害のために失敗しました。たとえば、ストレージ グループは、ログ ディレクトリを使用できない場合はすべてのデータベースのマウントを強制的に解除します。管理者が修正処理を決定します。パッシブ ノードをアクティブ化するために、回復はスケジュールされた停止になる可能性があります。 |
ストレージ グループやデータベースの部分的な障害、使用できないデータの存在、またはデータベースの初期マウント エラー |
自動回復処理は行われません。 |
部分的な障害とは、多少の破損が報告されていても、破損のためにストレージ グループやデータベースのマウントが強制的に解除されなかった状況を指します。データベースが起動時にマウントされなかった場合、処理は行われず、監視サービスによって障害が報告されます。この状態が検出されると、メールボックス サーバーによって、監視サービスで報告可能なイベントが生成されます。監視機能も、マウント解除されたデータベースを検出して報告します。 |
ストレージ グループの破損したログの検出 |
自動回復処理は行われません。 |
監視サービスによってこの状態が報告されます。 |
データベースまたはトランザクション ログ ドライブの空き容量の不足 |
自動回復処理は行われません。ストレージ グループのデータベースがマウント解除されます。 |
ドライブの空き領域が不足している状態が、監視システムによって報告されます。管理者が修正処理を決定します。 |
参照している情報が最新であることを確認したり、他の Exchange Server 2007 ドキュメントを見つけたりするには、Exchange Server TechCenter を参照してください。