Virtual Machines の信頼性

[アーティクル]
11/04/2024

この記事には、可用性ゾーンと、リージョン間のディザスターリカバリーおよび事業継続による VM のリージョンの回復性に関する詳細情報が含まれています。

可用性ゾーンのサポート

可用性ゾーンとは、各 Azure リージョン内にある、物理的に分離されたデータセンターのグループです。 1 つのゾーンで障害が発生した際には、サービスを残りのゾーンのいずれかにフェールオーバーできます。

Azure の可用性ゾーンの詳細については、「可用性ゾーンとは」を参照してください。

仮想マシンは、サポートされている Azure リージョンごとに 3 つの可用性ゾーンを持つ可用性ゾーンをサポートし、ゾーン冗長およびゾーンにも対応しています。詳細については、「可用性ゾーンを使用する Azure サービス」を参照してください。可用性のために仮想マシンを構成および移行する責任はお客様が負います。

可用性ゾーンの対応オプションの詳細については、次を参照してください。

前提条件

仮想マシン SKU は、リージョンのゾーン間で使用できる必要があります。可用性ゾーンをサポートしているリージョンを確認するには、サポートされているリージョンの一覧を参照してください。
VM SKU は、リージョンのゾーン間で使用できる必要があります。提供されている VM SKU を確認するには、以下のいずれかの方法を使用します。
- PowerShell を使用して、提供されている VM SKU を確認します。
- Azure CLI を使用して、提供されている VM SKU を確認します。
- 可用性ゾーンをサポートする Azure サービスに移動します。

SLA の機能強化

可用性ゾーンは物理的に分離されており、電源、ネットワーク、冷却を個別に提供するため、SLA (サービスレベルアグリーメント) が向上します。詳細については、「 Virtual Machines の SLA」を参照してください。

可用性ゾーンが有効になっているリソースを作成する

次のデプロイオプションから、可用性ゾーンが有効になっている仮想マシン (VM) の作成を開始します。

ゾーンフェールオーバーのサポート

お客様は、Site Recovery サービスを使用して別のゾーンにフェールオーバーするように仮想マシンを設定できます。詳細については、Site Recovery に関する記事を参照してください。

フォールトトレランス

仮想マシンはクラスター内の別のサーバーにフェールオーバーでき、VM のオペレーティングシステムは新しいサーバーで再起動されます。お客様は、ディザスターリカバリー、復旧計画での仮想マシンの集約、ディザスターリカバリー訓練の実行に関するフェールオーバープロセスを参照して、フォールトトレランスソリューションが成功することを確認する必要があります。

詳細については、サイトの回復プロセスに関するページを参照してください。

ゾーンダウンエクスペリエンス

ゾーン全体の停止中、仮想マシンサービスの自己復旧によって基になる容量が再調整され正常なゾーンになるまで、パフォーマンスの短期間の低下を覚悟する必要があります。自己復旧はゾーンの復元には依存しません。Microsoft が管理するサービスの自己修復状態では、他のゾーンの容量を使用して失われたゾーンを補うことが期待されます。

また、お客様は、リージョン全体が停止する可能性に備える必要があります。リージョン全体でサービス中断が発生した場合、データのローカル冗長コピーは、一時的に使用できなくなります。 geo レプリケーションが有効になっている場合は、Azure Storage の BLOB とテーブルのコピーがさらに 3 つ、別のリージョンに格納されます。地域的な停電や災害が発生し、プライマリリージョンを復旧できない場合は、すべての DNS エントリが、geo レプリケートされたリージョンに再マッピングされます。

ゾーン停止の準備と復旧

Azure 仮想マシンのアプリケーションがデプロイされているリージョン全体でサービスが中断している間、Azure 仮想マシンに関する次のガイダンスが提供されています。

VM に Azure Site Recovery を構成する
Azure Site Recovery が構成されていない場合、Azure Service Health ダッシュボードの状態を確認する
VM に対する Azure Backup サービスのしくみを確認する
- Azure VM バックアップのサポートマトリックスを確認する
環境に最適な VM 復元オプションとシナリオを決定する

低待機時間デザイン

リージョンをまたがる (セカンダリリージョン)、クロスサブスクリプション (プレビュー)、クロスゾーン (プレビュー) は、低待機時間の仮想マシンソリューションを設計する際に検討すべき利用可能なオプションです。これらのオプションの詳細については、「サポートされる復元方法」を参照してください。

重要

ゾーン対応のデプロイをオプトアウトして、基になる障害の分離からの保護は見合わせてください。可用性ゾーンをサポートしていない SKU を使用するか、可用性ゾーン構成からオプトアウトすると、ゾーンの配置と分離に従わないリソース (これらのリソースの基になる依存関係を含む) への依存が強制されます。これらのリソースが、ゾーンダウンシナリオで存続することは期待できません。このようなリソースを活用するソリューションでは、ディザスターリカバリー戦略を定義し、別のリージョンでソリューションの復旧を構成する必要があります。

安全なデプロイ手法

可用性ゾーンの分離を選択する場合は、アプリケーションコードとアプリケーションのアップグレードに安全なデプロイ手法を利用する必要があります。 Azure Site Recovery の構成に加えて、VM に対する次のいずれかの実装の安全なデプロイ手法を次に示します。

Microsoft は定期的に計画メンテナンス更新を実施しているため、これらの更新により、基盤となるインフラストラクチャに必要な更新を適用する場合に、まれに仮想マシンの再起動が必要になることがあります。詳細については、「予定メンテナンス中の可用性に関する考慮事項」を参照してください。

別のゾーン内のノードの次のセットをアップグレードする前に、次のタスクを実行する必要があります。

Azure Service Health ダッシュボードで、想定しているリージョンの仮想マシンサービスの状態を確認します。
VM でレプリケーションが有効になっていることを確認します。

可用性ゾーンサポートに移行する

VM を可用性ゾーンのサポートに移行する方法については、「Virtual Machines と Virtual Machine Scale Sets を可用性ゾーンのサポートに移行する」を参照してください。

他のサブスクリプションまたはリソースグループへ VM を移動する
- CLI
- PowerShell
Azure Resource Mover
Azure VM を可用性ゾーンに移動する
リージョンのメンテナンス構成リソースを移動する

リージョン間のディザスターリカバリーおよび事業継続

ディザスターリカバリー (DR) とは、ダウンタイムやデータ損失につながるような、影響の大きいイベント (自然災害やデプロイの失敗など) から復旧することです。原因に関係なく、災害に対する最善の解決策は、明確に定義されテストされた DR プランと、DR を積極的にサポートするアプリケーション設計です。ディザスターリカバリー計画の作成を検討する前に、「ディザスターリカバリー戦略の設計に関する推奨事項」を参照してください。

DR に関しては、Microsoft は共有責任モデルを使用します。共有責任モデルでは、ベースラインインフラストラクチャとプラットフォームサービスの可用性が Microsoft によって保証されます。同時に、多くの Azure サービスでは、データのレプリケート、または障害が発生したリージョンから別の有効なリージョンにクロスレプリケートするフォールバックは、自動的には行われません。それらのサービスに対して、ワークロードに適したディザスターリカバリー計画を設定する責任はユーザーにあります。 Azure PaaS (サービスとしてのプラットフォーム) オファリング上で実行されるほとんどのサービスには、DR をサポートするための機能とガイダンスが用意されており、お客様はサービス固有の機能を使って迅速な復旧をサポートでき、DR 計画の開発に役立ちます。

"リージョンをまたがる" 復元を使用して、ペアになっているリージョン経由で Azure VM を復元できます。 "リージョンをまたがる" 復元では、セカンダリリージョンにバックアップが実行されている場合は、選択されている回復ポイントのすべての Azure VM を復元できます。リージョンをまたがる復元の詳細については、「復元オプション」の表で「リージョンをまたがる」行のエントリを参照してください。

複数リージョンの地域でのディザスターリカバリー

リージョン全体のサービス中断が発生した場合、Microsoft は仮想マシンサービスの復元に全力で取り組みます。ただし、最高レベルの可用性を実現するには、アプリケーション固有の他のバックアップ戦略も利用する必要があります。詳細については、ディザスターリカバリーのためのデータ戦略に関するセクションをご覧ください。

停止の検出、通知、管理

仮想マシンのハードウェアまたは物理インフラストラクチャで予期しない障害が発生する可能性があります。予期しない障害に含まれるのは、ローカルネットワーク障害、ローカルディスク障害、その他のラックレベルでの障害などです。障害が検知されると、Azure プラットフォームは、同じデータセンター内の正常な物理マシンに仮想マシンを自動的に移行 (復旧) します。復旧中に、仮想マシンでダウンタイム (再起動) が発生し、場合によっては一時ドライブが失われることがあります。接続されている OS とデータディスクは常に保持されます。

仮想マシンサービスの中断の詳細については、ディザスターリカバリーのガイダンスを参照してください。

ディザスターリカバリーと障害検出を設定する

仮想マシンのディザスターリカバリーを設定する場合は、Azure Site Recovery で提供されるものを理解してください。次の方法を使用して仮想マシンのディザスターリカバリーを有効にします。

Azure VM のセカンダリ Azure リージョンにディザスターリカバリーを設定する
Recovery Services コンテナーを作成する
- Bicep
- ARM テンプレート
Linux 仮想マシンのディザスターリカバリーを有効にする
Windows 仮想マシンのディザスターリカバリーを有効にする
仮想マシンを別のリージョンにフェールオーバーする
仮想マシンをプライマリリージョンにフェールオーバーする

単一リージョンの地域でのディザスターリカバリー

ディザスターリカバリーが設定されていると、Azure VM によって別のターゲットリージョンへのレプリケートが継続的に行われます。障害が発生した場合は、セカンダリリージョンに VM をフェールオーバーし、そこからそれらにアクセスできます。

Site Recovery を使用して Azure VM をレプリケートすると、すべての VM ディスクが、ターゲットリージョンに継続的かつ非同期的にレプリケートされます。回復ポイントは数分ごとに作成されます。これにより、回復ポイントの目標 (RPO) が分単位で作成されます。ディザスターリカバリー訓練を、運用環境のアプリケーションまたは実行中のレプリケーションに影響を与えることなく、必要な回数だけ実施できます。詳細については、「Azure へのディザスターリカバリー訓練を実行する」を参照してください。

詳細については、Azure VM のアーキテクチャコンポーネントおよびリージョンのペアリングに関するページを参照してください。

容量と予防的なディザスターリカバリーの回復性

Microsoft とお客様は、共有責任モデルの下で活動します。共同責任は、顧客対応 DR (お客様が責任を持つサービス) の場合、お客様がデプロイおよび制御するすべてのサービスのディザスターリカバリーに対処する必要があることを意味します。復旧がプロアクティブになるように、お客様はセカンダリを事前にデプロイする必要があります。お客様が事前に割り当てていない場合、障害が発生したときに容量が保証されないためです。

仮想マシンをデプロイする場合、お客様は Virtual Machine Scale Sets でフレキシブルオーケストレーションモードを使用できます。フレキシブルオーケストレーションモードでは、すべての VM サイズが使用できます。また、フレキシブルオーケストレーションモードでは、リージョン内の障害ドメインまたは可用性ゾーン内のいずれかで VM を分散することで、(最大 1,000 個の VM まで) 高可用性を保証します。

次の方法で共有

Virtual Machines の信頼性

可用性ゾーンのサポート

前提条件

SLA の機能強化

可用性ゾーンが有効になっているリソースを作成する

ゾーンフェールオーバーのサポート

フォールトトレランス

ゾーンダウンエクスペリエンス

ゾーン停止の準備と復旧

低待機時間デザイン

安全なデプロイ手法

可用性ゾーンサポートに移行する

リージョン間のディザスターリカバリーおよび事業継続

複数リージョンの地域でのディザスターリカバリー

停止の検出、通知、管理

ディザスターリカバリーと障害検出を設定する

単一リージョンの地域でのディザスターリカバリー

容量と予防的なディザスターリカバリーの回復性

次のステップ

フィードバック

その他のリソース

次の方法で共有

Virtual Machines の信頼性

可用性ゾーンのサポート

前提条件

SLA の機能強化

可用性ゾーンが有効になっているリソースを作成する

ゾーン フェールオーバーのサポート

フォールト トレランス

ゾーン ダウン エクスペリエンス

ゾーン停止の準備と復旧

低待機時間デザイン

安全なデプロイ手法

可用性ゾーン サポートに移行する

リージョン間のディザスター リカバリーおよび事業継続

複数リージョンの地域でのディザスター リカバリー

停止の検出、通知、管理

ディザスター リカバリーと障害検出を設定する

単一リージョンの地域でのディザスター リカバリー

容量と予防的なディザスター リカバリーの回復性

次のステップ

フィードバック

その他のリソース

ゾーンフェールオーバーのサポート

フォールトトレランス

ゾーンダウンエクスペリエンス

可用性ゾーンサポートに移行する

リージョン間のディザスターリカバリーおよび事業継続

複数リージョンの地域でのディザスターリカバリー

ディザスターリカバリーと障害検出を設定する

単一リージョンの地域でのディザスターリカバリー

容量と予防的なディザスターリカバリーの回復性