シナリオに適した統合ランタイム構成を選択する
統合ランタイム (IR) は、Microsoft Purview がさまざまなネットワーク環境でデータ スキャンを実行するために使用するコンピューティング インフラストラクチャです。 この記事では、Microsoft Purview で使用できるさまざまな種類の統合ランタイムについて説明し、シナリオに適した統合ランタイム構成を選択する方法に関するガイダンスを提供します。
統合ランタイムの種類
Microsoft Purview には、次の種類の統合ランタイムが用意されています。
- Azure 統合ランタイム: Azure 統合ランタイムは、Azure または Azure 以外のデータ ソースをスキャンするために使用できるフル マネージドのエラスティック コンピューティングです。 Azure IR では、パブリックにアクセス可能なエンドポイントを使用したデータ ストアとコンピューティング サービスへの接続がサポートされています。 これは、開始するために何も作成する必要のない既定の統合ランタイムです。
- マネージド Virtual Network (VNet) 統合ランタイム: Microsoft Purview Managed Virtual Networkに存在するマネージド VNet 統合ランタイムを作成できます。 プライベート エンドポイントを使用して、サポートされているデータ ソースに安全に接続してスキャンできます。 詳細については、「マネージド Virtual Networkとマネージド プライベート エンドポイント」を参照してください。
- セルフホステッド統合ランタイム: セルフホステッド統合ランタイムを使用して、オンプレミス ネットワークまたは仮想ネットワーク内のデータ ソースをスキャンできます。 オンプレミスのマシンまたはプライベート ネットワーク内の仮想マシンにインストールできます。 詳細については、「 セルフホステッド統合ランタイムの作成と管理」を参照してください。
- Kubernetes でサポートされているセルフホステッド統合ランタイム (プレビュー): この統合ランタイムは Kubernetes クラスターでホストされており、オンプレミス ネットワークまたは仮想ネットワーク内のデータ ソースをスキャンするために使用できます。 Kubernetes のサポートにより、全体的なパフォーマンスが向上し、統合ランタイムがジョブでスケーリングできるようになります。 Kubernetes でサポートされているセルフホステッド統合ランタイムの作成と管理に関するページを参照してください
- AWS 統合ランタイム: AWS 統合ランタイムは、AWS の Microsoft Purview によってホストされるフル マネージドでエラスティックな計算です。 これは、S3、RDS などの Amazon データ ソースをスキャンするときに適用されます。
適切な統合ランタイムを選択する
適切な種類の統合ランタイムを選択することが重要です。 既存のアーキテクチャとデータ統合の要件に適している必要があるだけでなく、増大するビジネス ニーズと今後のワークロードの増加をさらに満たす方法を検討する必要があります。
次の考慮事項は、決定をナビゲートするのに役立ちます。
スキャンするデータ ソースの種類
スキャンする データ ソースでサポートされている IR の種類については、「サポートされているデータ ソース」セクションを参照してください。
データ ソースのネットワーク アクセス制御とは
異なるデータ ソースには、インターネット経由のランダム アクセスから保護するためのネットワーク ファイアウォール設定が異なる場合があります。オンプレミスまたはクラウド/SaaS データ ストアである場合があります。 次の表に、一般的なファイアウォール オプションの一覧を示します。 シナリオに応じて、サポートされている IR の種類を選択できます。
データ ソース ファイアウォール Azure IR マネージド VNet IR SHIR Kubernetes でサポートされている SHIR パブリック アクセスを許可する ✓ ✓ ✓ ✓ Azure サービスまたは信頼されたサービスを許可する ✓ ✓ ✓ ✓ 特定の Azure 仮想ネットワークからのアクセスを許可する ✓ (マネージド プライベート エンドポイントのサポートあり) ✓ ✓ 特定の IP/IP 範囲を許可する ✓ ✓ その他のオンプレミスまたはプライベート ネットワーク アクセス ✓ ✓ Microsoft Purview のファイアウォール設定は何ですか?
Microsoft Purview には、さまざまなネットワーク ファイアウォール オプションが用意されています。 詳細については、「 Microsoft Purview ファイアウォールの構成」を参照してください。 シナリオに応じて、サポートされている IR の種類を選択できます。
Purview ファイアウォール Azure IR マネージド VNet IR SHIR Kubernetes でサポートされている SHIR すべてのネットワークから有効 ✓ ✓ ✓ ✓ すべてのネットワークから無効 ✓ (マネージド プライベート エンドポイントが必要) ✓ (ネットワークからプライベート エンドポイントを作成する必要があります) ✓ (ネットワークからプライベート エンドポイントを作成する必要があります) データ転送中に必要なセキュリティレベルは何ですか?
統合ランタイムの場所は、バックエンド コンピューティングの場所とスキャン操作を実行する場所を定義します。 データ所在地の考慮事項:
- Azure IR を使用すると、Microsoft Purview はデータ ソースの場所を自動的に検出し、そのリージョンの IR を使用します。 Microsoft Purview がリージョンを検出できない場合は、Purview アカウントのリージョンが使用されます。
- マネージド VNet IR を使用すると、マネージド仮想ネットワーク用に構成したリージョンで実行されます。
- SHIR を使用する場合は、オンプレミスまたは Azure 仮想マシン内の場所を完全に決定できます。
たとえば、データ転送中の中間者攻撃から防御するには、プライベート エンドポイントとPrivate Linkを使用してデータセキュリティを確保できます。
- マネージド VNet IR を使用する場合は、データ ストアに対してマネージド プライベート エンドポイントを作成できます。 プライベート エンドポイントは、マネージド仮想ネットワーク内の Microsoft Purview サービスによって管理されます。
- 仮想ネットワークにプライベート エンドポイントを作成することもできます。また、SHIR はそれらを使用してデータ ストアにアクセスできます。
どのレベルのメンテナンスを提供できますか?
インフラストラクチャ、サーバー、機器の保守は、企業の IT 部門の重要なタスクの 1 つです。 通常、多くの時間と労力がかかります。
- Azure IR とマネージド VNet IR を使用する場合は、更新プログラム、パッチ、バージョンなどのメンテナンスについて心配する必要はありません。 Microsoft Purview サービスは、すべてのメンテナンス作業を処理します。
- SHIR はマシンにインストールされ、Kubernetes でサポートされている SHIR は Kubernetes クラスター上にあるため、メンテナンスを管理する必要があります。
- SHIR は自動更新をサポートし、更新プログラムがある場合は常に最新バージョンを自動的に取得します。 詳細については、 セルフホステッド統合ランタイムの自動更新と有効期限に関するページを参照してください。
- 現在、 Kubernetes でサポートされているセルフホステッド統合ランタイム では、手動更新のみがサポートされています。
パフォーマンスとスケーラビリティ
必要に応じて、フル マネージドおよび自動スケーリングされた Azure IR、Managed VNet IR、または Kubernetes でサポートされるセルフホステッド統合ランタイムを使用することをお勧めします。 弾力性により、特に大規模なデータ システムをスキャンする場合に、パフォーマンスとスケーラビリティを向上させることができます。
サポートされているデータ ソース
次の表は、Microsoft Purview スキャンでサポートされているすべてのデータ ソースと、サポートされている統合ランタイムの種類を示しています。
カテゴリ | サポートされているデータ ストア | Azure IR/AWS IR | マネージド VNet IR | SHIR | Kubernetes SHIR |
---|---|---|---|---|---|
Azure | 複数のソース | ✓ | |||
Azure Blob ストレージ | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure Cosmos DB (NoSQL 用 API) | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure Data Explorer | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
Azure Data Lake Storage Gen1 | ✓ | ✓ (v2 のみ) | ✓ | ||
Azure Data Lake Storage Gen2 | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure Database for MySQL | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure Database for PostgreSQL | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure Databricks Hive メタストア | ✓ | ✓ | |||
Azure Databricks Unity Catalog | ✓ | ✓ (マネージド プライベート エンドポイントを含む v2 のみ) | ✓ | ||
Azure 専用 SQL プール (旧称 SQL DW) | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure Files | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure SQL データベース | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure SQL Managed Instance | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Azure Synapse Analytics (ワークスペース) | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
Database | Amazon RDS | ✓ | ✓ | ||
Amazon Redshift | ✓ | ✓ | |||
Cassandra | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
Db2 | ✓ | ✓ | |||
Google BigQuery | ✓ | ✓ | |||
Hive メタストア データベース | ✓ | ✓ | |||
MongoDB | ✓ | ✓ | |||
MySQL | ✓ | ✓ (マネージド プライベート エンドポイントを含む v2 のみ) | ✓ | ✓ | |
Oracle | ✓ | ||||
PostgreSQL | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
SAP ビジネス ウェアハウス | ✓ | ✓ | |||
SAP HANA | ✓ | ✓ | |||
Snowflake | ✓ | ✓ (v2 のみ) | ✓ | ||
SQL Server | ✓ | ✓ | |||
Azure-Arc でのSQL Server | ✓ | ✓ | |||
Teradata | ✓ | ||||
File | Amazon S3 | ✓ | |||
HDFS | ✓ | ✓ | |||
サービスとアプリ | Dataverse | ✓ | ✓ (v2 のみ) | ✓ | |
Erwin | ✓ | ||||
Looker | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
生地 | ✓ | ✓ (v2 のみ) | ✓ | ||
Power BI | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
Qlik Sense | ✓ | ✓ (v2 のみ) | ✓ | ||
Salesforce | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
SAP ECC | ✓ | ✓ | |||
SAP S/4HANA | ✓ | ✓ | |||
Tableau | ✓ | ✓ (v2 のみ) | ✓ |