Synapse 実装の成功手法: 運用準備状況レビューを実行する
注意
この記事は、「設計による Azure Synapse 実装の成功」シリーズの記事の一部です。 このシリーズの概要については、設計による Azure Synapse 実装の成功に関する記事を参照してください。
Azure Synapse Analytics ソリューションを構築し、デプロイの準備ができたら、そのソリューションの運用準備状況を確認することが重要です。 運用準備状況レビューを実行すると、ユーザーに最適なサービスを提供するための準備状況についてソリューションの評価が行われます。 起動の前に時間とリソースを費やして運用準備状況を評価する組織は、成功の確率がはるかに高くなります。 また、確実に運用上の期待から逸脱しないようにするために、デプロイ後に定期的に (おそらく毎年) 運用準備状況レビューを実施することも重要です。
プロセスと対象領域
プロセスと重点領域としては、サービス運用の目標、ソリューションの準備、セキュリティ、監視、高可用性 (HA) とディザスター リカバリー (DR) があります。
サービスの運用目標
顧客の視点からサービスの期待を文書化し、これらのサービスの期待について企業から同意を得ます。 サービスのビジネス目標と目的を達成するために必要な変更を加えます。
各 Azure サービスのサービス レベル アグリーメント (SLA) は、サービスによって異なります。 たとえば、Microsoft では特定の月間稼働率を保証しています。 詳細については、「Azure Synapse Analytics の SLA」を参照してください。 これらの SLA が独自のビジネス SLA と一致していることを確認し、ギャップを文書化します。 また、異なるチーム間で運用レベル アグリーメント (OLA) を定義し、SLA と確実に一致させることも重要です。
ソリューションの準備状況
次の点を使用して、ソリューションの準備状況を確認することが重要です。
- さまざまなコンポーネントの重要な機能と、それらが相互にどのように作用し合うかを示すソリューション アーキテクチャ全体について説明します。
- ソリューションのスケーラビリティの側面を文書化します。 スケーリングに伴う作業とそれがビジネスに与える影響に関する具体的な詳細を含めます。 ユーザー アクティビティの急増に対応できるかどうかを検討します。 Azure Synapse には、最小限のダウンタイムでスケーリングするための機能が用意されていることに留意してください。
- ソリューション内の単一障害点と、そのような障害が発生した場合の復旧方法を文書化します。 影響を最小限に抑えるために、このような障害が依存サービスに与える影響を含めます。
- ソリューションに依存するすべてのサービスとその影響を文書化します。
セキュリティ
データのセキュリティとプライバシーに交渉の余地はありません。 Azure Synapse は、データをエンド ツー エンドで保護するための多層セキュリティ アーキテクチャを実装します。 次の点を使用してセキュリティの準備状況を確認します。
- 認証: 可能な限り Microsoft Entra 認証が使用されていることを確認します。 Microsoft Entra 以外の認証が使用されている場合、強力なパスワード メカニズムが設定されていること、およびパスワードが定期的にローテーションされていることを確認します。 詳細については、「パスワード ガイダンス」を参照してください。 ユーザー認証に関連した不審なアクションを検出するために、監視が実施されていることを確認します。 Azure Identity Protection を使用して ID ベースのリスクの検出と修復を自動化することを検討します。
- アクセス制御:最小限の特権の原則に従って、適切なアクセス制御が実施されていることを確認します。 Azure サービスで利用できるセキュリティ機能を使用して、ソリューションのセキュリティを強化します。 たとえば、Azure Synapse には、行レベルのセキュリティ (RLS)、列レベルのセキュリティ、動的データ マスクなど、きめ細かいセキュリティ機能が用意されています。 詳細については、「Azure Synapse Analytics のセキュリティに関するホワイト ペーパー: アクセス制御」を参照してください。
- 脅威に対する保護: 脅威の防止、検出、対応を行うための適切な脅威検出メカニズムが設定されていることを確認します。 Azure Synapse は、データベースの監査、保護、監視のための SQL 監査、SQL の脅威検出、脆弱性評価を提供します。 詳細については、「Azure Synapse Analytics のセキュリティに関するホワイト ペーパー: 脅威の検出」を参照してください。
詳細については、「Azure Synapse Analytics のセキュリティに関するホワイト ペーパー」を参照してください。
監視
ビジネスでの準備状況の監視に対する期待を設定して文書化します。 これらの期待では、次の点が説明されている必要があります。
- ユーザー エクスペリエンス全体を監視する方法と、単一ユーザー エクスペリエンスの監視を含めるかどうか。
- 監視する各サービス固有のメトリック。
- ユーザー エクスペリエンスの低下について通知する方法と通知先。
- プロアクティブな正常性チェックの詳細。
- インシデントに対応するアクションを自動化するメカニズム (たとえば、チケットの自動的な発行など)。
Azure Monitor を使用して Azure およびオンプレミス環境からテレメトリ データを収集、分析、処理ことを検討します。 Azure Monitor は、数秒で問題を事前に特定することにより、アプリケーションのパフォーマンスと可用性を最大限に高めるのに役立ちます。
ソリューション内の各サービスについて監視する重要なメトリックと、それらの許容されるしきい値を一覧表示します。 たとえば、メトリックを表示して、専用 SQL プールを監視できます。
Azure Service Health を使用して、Azure サービス インシデントと計画メンテナンスについて通知することを検討します。 これにより、ダウンタイムを軽減するためのアクションを実行できます。 カスタマイズ可能なクラウド アラートを設定し、個人用に設定されたダッシュボードを使用して正常性の問題の分析、クラウド リソースに対する影響の監視、ガイダンスとサポートの取得、詳細と更新プログラムの共有を行うことができます。
最後に、インシデントが発生したときに適切なユーザーに通知するように適切な通知が設定されていることを確認します。 インシデントは、プロアクティブである (特定のメトリックがしきい値を超えた場合など) か、またはリアクティブである (コンポーネントやサービスの障害など) 可能性があります。 詳細については、「Microsoft Azure のアラートの概要」を参照してください。
高可用性
ソリューションの "回復時刻の目標 (RTO)" と "回復ポイントの目標 (RPO)" を定義し、文書化します。 RTO は、ユーザーがサービスを利用できるようになるまでの時間であり、RPO は、フェールオーバーが発生した場合に発生するデータ損失の量です。
各 Azure サービスは、サービスの期待される高可用性 (HA) に関する一連のガイドラインとメトリックを公開します。 これらの HA メトリックがビジネスの期待と一致していることを確認します。 それらが一致しない場合は、HA 要件を満たすためにカスタマイズが必要になる場合があります。 たとえば、Azure Synapse 専用 SQL プールでは、自動復元ポイントを含む 8 時間の RPO がサポートされています。 その RPO が十分ではない場合、RPO のニーズを満たすために、適切な頻度でユーザー定義の復元ポイントを設定できます。 詳細については、「Azure Synapse の専用 SQL プールにおけるバックアップと復元」を参照してください。
障害復旧
ディザスター リカバリー (DR) シナリオの詳細なプロセスを定義して文書化します。 DR シナリオには、フェールオーバー プロセス、通信メカニズム、エスカレーション プロセス、ウォー ルームのセットアップなどを含めることができます。 また、停止の原因を特定するためのプロセスと、災害からの復旧に必要な手順も文書化します。
DR プロセスを構築するには、Azure サービスで使用できる組み込みの DR メカニズムを使用します。 たとえば、Azure Synapse では、ペアのデータ センターに対して SQL 専用プールの標準 geo バックアップが毎日 1 回実行されます。 geo バックアップは、プライマリ ロケーションの災害から復旧するために使用できます。 また、Azure Data Lake Storage (ADLS) を設定して、数百マイル離れた別の Azure リージョンにデータをコピーすることもできます。 プライマリ ロケーションで障害が発生した場合、フェールオーバーを開始して、セカンダリ ストレージの場所をプライマリ ストレージの場所に変換できます。 詳細については、「ディザスター リカバリーとストレージ アカウントのフェールオーバー」を参照してください。
次の手順
"設計による Azure Synapse の成功" シリーズの次の記事では、Azure Synapse ソリューションの監視を実行する方法について説明します。