データ系列
データ系列は、クラウド規模の分析において重要な役割を果たします。 系列は、生データと完成品の間の依存関係を示し、その生データを最終的なデータ製品に変換する変換と操作を説明します。 データ系列は、データの発生からデータ資産全体の移動まで、データのライフサイクルにわたっています。 用途としては、トラブルシューティング、根本原因分析、データ品質分析、コンプライアンス、影響分析などがあります。 また、系列によってデータセットと製品に追加されるコンテキストを使用して、検出可能でセルフサービス可能なデータ製品を実現することができます。
データ カタログの主な機能は、データ製品間の系列を表示することです。
Microsoft Purview Data Catalog は、さまざまなデータ処理、ストレージ、分析システムに接続して、系列情報を抽出します。 目的は、各データ システムからの移動、変換、および運用メタデータを表すことです。
Azure Data Factory および Azure Synapse パイプラインを使用すると、Microsoft Purview でデータ系列が有効になるため、取り込み用のソリューションとしてこれらの使用をお勧めします。 それ以外のインジェスト パターンでは、データ処理の一部としてデータ系列を更新するために Apache Atlas API を使用する必要があります。
Microsoft Fabric では、Microsoft Purview を必要とせずに系列がサポートされます。 系列を 1 か所で確認する必要がある場合は、Microsoft Fabric テナントをスキャンするように Microsoft Purview を設定することをお勧めします。これにより、Power BI を含む Fabric 項目からのメタデータと系列が Microsoft Purview Data Catalog に自動的に取り込まれます。 詳細については、「Fabric の系列」と、Microsoft Fabric 項目から Microsoft Purview に系列を取得する方法に関する記事を参照してください。
ヒント
サポートされているシステムとベスト プラクティスの詳細については、「Microsoft Purviewのデータ系列」を参照してください。
次のステップ
Azure でマスター データを管理する方法について説明します。