Virtual Machines の信頼性
この記事には、可用性ゾーンと、リージョン間のディザスター リカバリーおよび事業継続による VM のリージョンの回復性に関する詳細情報が含まれています。
可用性ゾーンのサポート
Azure 可用性ゾーンとは、各 Azure リージョン内にある、3 つ以上に物理的に分離されたデータセンターのグループです。 各ゾーン内のデータセンターには、独立した電源、冷却手段、ネットワーク インフラストラクチャが備わっています。 ローカル ゾーンの障害が発生した場合、可用性ゾーンは、1 つのゾーンが影響を受けたときに、リージョンのサービス、容量、高可用性が残りの 2 つのゾーンによってサポートされるように設計されています。
障害の範囲は、ソフトウェアやハードウェアの障害から、地震、水害、火災などの事象に至る可能性があります。 Azure サービスの冗長と論理的な分離により、障害に対するトレランスが実現されます。 Azure の可用性ゾーンの詳細については、リージョンと可用性ゾーンに関する記事を参照してください。
Azure の可用性ゾーン対応サービスは、適切なレベルの信頼性と柔軟性を提供するように設計されています。 それらは 2 つの方法で構成できます。 それらは、ゾーン間の自動レプリケーションによるゾーン冗長、またはインスタンスを特定のゾーンにピン留めするゾーンベースのいずれかになります。 これらのアプローチを組み合わせることもできます。 ゾーン ベースとゾーン冗長のアーキテクチャを比較した詳細については、「可用性ゾーンとリージョンの使用に関する推奨事項」を参照してください。
仮想マシンは、サポートされている Azure リージョンごとに 3 つの可用性ゾーンを持つ可用性ゾーンをサポートし、ゾーン冗長およびゾーンにも対応しています。 詳細については、可用性ゾーンのサポートに関するページをご覧ください。 可用性のために仮想マシンを構成および移行する責任はお客様が負います。
可用性ゾーンの対応オプションの詳細については、次を参照してください。
- VM の可用性オプションを確認する
- サービスとリージョンの可用性ゾーンのサポートをレビューする
- 既存の VM を 可用性ゾーンに移行する
前提条件
仮想マシン SKU は、リージョンのゾーン間で使用できる必要があります。 可用性ゾーンをサポートしているリージョンを確認するには、サポートされているリージョンの一覧を参照してください。
VM SKU は、リージョンのゾーン間で使用できる必要があります。 提供されている VM SKU を確認するには、以下のいずれかの方法を使用します。
- PowerShell を使用して、提供されている VM SKU を確認します。
- Azure CLI を使用して、提供されている VM SKU を確認します。
- [基礎となるサービス] に進みます。
SLA の機能強化
可用性ゾーンは物理的に分離されており、電源、ネットワーク、冷却を個別に提供するため、SLA (サービス レベル アグリーメント) が向上します。 詳細については、「 Virtual Machines の SLA」を参照してください。
可用性ゾーンが有効になっているリソースを作成する
次のデプロイ オプションから、可用性ゾーンが有効になっている仮想マシン (VM) の作成を開始します。
ゾーン フェールオーバーのサポート
お客様は、Site Recovery サービスを使用して別のゾーンにフェールオーバーするように仮想マシンを設定できます。 詳細については、Site Recovery に関する記事を参照してください。
フォールト トレランス
仮想マシンはクラスター内の別のサーバーにフェールオーバーでき、VM のオペレーティング システムは新しいサーバーで再起動されます。 お客様は、ディザスター リカバリー、復旧計画での仮想マシンの集約、ディザスター リカバリー訓練の実行に関するフェールオーバー プロセスを参照して、フォールト トレランス ソリューションが成功することを確認する必要があります。
詳細については、サイトの回復プロセスに関するページを参照してください。
ゾーン ダウン エクスペリエンス
ゾーン全体の停止中、仮想マシン サービスの自己復旧によって基になる容量が再調整され正常なゾーンになるまで、パフォーマンスの短期間の低下を覚悟する必要があります。 自己復旧はゾーンの復元には依存しません。Microsoft が管理するサービスの自己修復状態では、他のゾーンの容量を使用して失われたゾーンを補うことが期待されます。
また、お客様は、リージョン全体が停止する可能性に備える必要があります。 リージョン全体でサービス中断が発生した場合、データのローカル冗長コピーは、一時的に使用できなくなります。 geo レプリケーションが有効になっている場合は、Azure Storage の BLOB とテーブルのコピーがさらに 3 つ、別のリージョンに格納されます。 地域的な停電や災害が発生し、プライマリ リージョンを復旧できない場合は、すべての DNS エントリが、geo レプリケートされたリージョンに再マッピングされます。
ゾーン停止の準備と復旧
Azure 仮想マシンのアプリケーションがデプロイされているリージョン全体でサービスが中断している間、Azure 仮想マシンに関する次のガイダンスが提供されています。
- VM に Azure Site Recovery を構成する
- Azure Site Recovery が構成されていない場合、Azure Service Health ダッシュボードの状態を確認する
- VM に対する Azure Backup サービスのしくみを確認する
- Azure VM バックアップのサポート マトリックスを確認する
- 環境に最適な VM 復元オプションとシナリオを決定する
低待機時間デザイン
リージョンをまたがる (セカンダリ リージョン)、クロス サブスクリプション (プレビュー)、クロス ゾーン (プレビュー) は、低待機時間の仮想マシン ソリューションを設計する際に検討すべき利用可能なオプションです。 これらのオプションの詳細については、「サポートされる復元方法」を参照してください。
重要
ゾーン対応のデプロイをオプトアウトして、基になる障害の分離からの保護は見合わせてください。 可用性ゾーンをサポートしていない SKU を使用するか、可用性ゾーン構成からオプトアウトすると、ゾーンの配置と分離に従わないリソース (これらのリソースの基になる依存関係を含む) への依存が強制されます。 これらのリソースが、ゾーンダウン シナリオで存続することは期待できません。 このようなリソースを活用するソリューションでは、ディザスター リカバリー戦略を定義し、別のリージョンでソリューションの復旧を構成する必要があります。
安全なデプロイ手法
可用性ゾーンの分離を選択する場合は、アプリケーション コードとアプリケーションのアップグレードに安全なデプロイ手法を利用する必要があります。 Azure Site Recovery の構成に加えて、VM に対する次のいずれかの実装の安全なデプロイ手法を次に示します。
Microsoft は定期的に計画メンテナンス更新を実施しているため、これらの更新により、基盤となるインフラストラクチャに必要な更新を適用する場合に、まれに仮想マシンの再起動が必要になることがあります。 詳細については、「予定メンテナンス中の可用性に関する考慮事項」を参照してください。
別のゾーン内のノードの次のセットをアップグレードする前に、次のタスクを実行する必要があります。
- Azure Service Health ダッシュボードで、想定しているリージョンの仮想マシン サービスの状態を確認します。
- VM でレプリケーションが有効になっていることを確認します。
可用性ゾーン サポートに移行する
VM を可用性ゾーンのサポートに移行する方法については、「Virtual Machines と Virtual Machine Scale Sets を可用性ゾーンのサポートに移行する」を参照してください。
- 他のサブスクリプションまたはリソース グループへ VM を移動する
- Azure Resource Mover
- Azure VM を可用性ゾーンに移動する
- リージョンのメンテナンス構成リソースを移動する
リージョン間のディザスター リカバリーおよび事業継続
ディザスター リカバリー (DR) とは、ダウンタイムやデータ損失につながるような、影響の大きいイベント (自然災害やデプロイの失敗など) から復旧することです。 原因に関係なく、災害に対する最善の解決策は、明確に定義されテストされた DR プランと、DR を積極的にサポートするアプリケーション設計です。 ディザスター リカバリー計画の作成を検討する前に、「ディザスター リカバリー戦略の設計に関する推奨事項」を参照してください。
DR に関しては、Microsoft は共有責任モデルを使用します。 共有責任モデルでは、ベースライン インフラストラクチャとプラットフォーム サービスの可用性が Microsoft によって保証されます。 同時に、多くの Azure サービスでは、データのレプリケート、または障害が発生したリージョンから別の有効なリージョンにクロスレプリケートするフォールバックは、自動的には行われません。 それらのサービスについては、お客様がワークロードに適したディザスター リカバリー計画を設定する必要があります。 Azure PaaS (サービスとしてのプラットフォーム) オファリング上で実行されるほとんどのサービスには、DR をサポートするための機能とガイダンスが用意されており、お客様はサービス固有の機能を使って迅速な復旧をサポートでき、DR 計画の開発に役立ちます。
"リージョンをまたがる" 復元を使用して、ペアになっているリージョン経由で Azure VM を復元できます。 "リージョンをまたがる" 復元では、セカンダリ リージョンにバックアップが実行されている場合は、選択されている回復ポイントのすべての Azure VM を復元できます。 リージョンをまたがる復元の詳細については、「復元オプション」の表で「リージョンをまたがる」行のエントリを参照してください。
複数リージョンの地域でのディザスター リカバリー
リージョン全体のサービス中断が発生した場合、Microsoft は仮想マシン サービスの復元に全力で取り組みます。 ただし、最高レベルの可用性を実現するには、アプリケーション固有の他のバックアップ戦略も利用する必要があります。 詳細については、 ディザスター リカバリーのためのデータ戦略に関するセクションをご覧ください。
停止の検出、通知、管理
仮想マシンのハードウェアまたは物理インフラストラクチャで予期しない障害が発生する可能性があります。 予期しない障害に含まれるのは、ローカル ネットワーク障害、ローカル ディスク障害、その他のラック レベルでの障害などです。 障害が検知されると、Azure プラットフォームは、同じデータセンター内の正常な物理マシンに仮想マシンを自動的に移行 (復旧) します。 復旧中に、仮想マシンでダウンタイム (再起動) が発生し、場合によっては一時ドライブが失われることがあります。 接続されている OS とデータ ディスクは常に保持されます。
仮想マシン サービスの中断の詳細については、ディザスター リカバリーのガイダンスを参照してください。
ディザスター リカバリーと障害検出を設定する
仮想マシンのディザスター リカバリーを設定する場合は、Azure Site Recovery で提供されるものを理解してください。 次の方法を使用して仮想マシンのディザスター リカバリーを有効にします。
- Azure VM のセカンダリ Azure リージョンにディザスター リカバリーを設定する
- Recovery Services コンテナーを作成する
- Linux 仮想マシンのディザスター リカバリーを有効にする
- Windows 仮想マシンのディザスター リカバリーを有効にする
- 仮想マシンを別のリージョンにフェールオーバーする
- 仮想マシンをプライマリ リージョンにフェールオーバーする
単一リージョンの地域でのディザスター リカバリー
ディザスター リカバリーが設定されていると、Azure VM によって別のターゲット リージョンへのレプリケートが継続的に行われます。 障害が発生した場合は、セカンダリ リージョンに VM をフェールオーバーし、そこからそれらにアクセスできます。
Site Recovery を使用して Azure VM をレプリケートすると、すべての VM ディスクが、ターゲット リージョンに継続的かつ非同期的にレプリケートされます。 回復ポイントは数分ごとに作成されます。これにより、回復ポイントの目標 (RPO) が分単位で作成されます。 ディザスター リカバリー訓練を、運用環境のアプリケーションまたは実行中のレプリケーションに影響を与えることなく、必要な回数だけ実施できます。 詳細については、「Azure へのディザスター リカバリー訓練を実行する」を参照してください。
詳細については、Azure VM のアーキテクチャ コンポーネントおよびリージョンのペアリングに関するページを参照してください。
容量と予防的なディザスター リカバリーの回復性
Microsoft とお客様は、共有責任モデルの下で活動します。 共同責任は、顧客対応 DR (お客様が責任を持つサービス) の場合、お客様がデプロイおよび制御するすべてのサービスのディザスター リカバリーに対処する必要があることを意味します。 復旧がプロアクティブになるように、お客様はセカンダリを事前にデプロイする必要があります。お客様が事前に割り当てていない場合、障害が発生したときに容量が保証されないためです。
仮想マシンをデプロイする場合、お客様は Virtual Machine Scale Sets でフレキシブル オーケストレーション モードを使用できます。 フレキシブル オーケストレーション モードでは、すべての VM サイズが使用できます。 また、フレキシブル オーケストレーション モードでは、リージョン内の障害ドメインまたは可用性ゾーン内のいずれかで VM を分散することで、(最大 1,000 個の VM まで) 高可用性を保証します。