Microsoft Purview を使用した Synapse でのデータの検出、接続、探索
このドキュメントでは、Microsoft Purview アカウントを Synapse に登録するときに実行できる操作の種類について説明します。
前提条件
Synapse で Microsoft Purview を使用する
Synapse で Microsoft Purview を使用するには、その Microsoft Purview アカウントにアクセスできる必要があります。 Synapse では、Microsoft Purview のアクセス許可をパススルーします。 たとえば、キュレーター アクセス許可ロールがある場合は、Microsoft Azure Purview によってスキャンされたメタデータを編集できます。
データ検出: データセットの検索
Microsoft Purview によって登録およびスキャンされたデータを検出するには、Synapse ワークスペースの上部中央にある検索バーを使用します。 すべての組織データを検索するために、必ずMicrosoft Azure Purview を選択してください。
Microsoft Purview のアクション
Synapse で使用できる Microsoft Purview の機能を次に示します。
- メタデータの概要。
- 分類、用語集の用語、データ型、説明を含むメタデータのスキーマを表示、編集する。
- 依存関係を理解し、影響分析を実行するために系列を表示する。 詳細については、系列に関する記事をご覧ください。
- データセットの所有者または専門家を確認するために、連絡先を表示、編集する。
- 特定のデータセットの階層的依存関係を理解するための関連項目。 このエクスペリエンスは、データ階層を参照する際に役立ちます。
- [アクセスの要求] をクリックして、Microsoft Purview のワークフロー管理者によって構成されたセルフサービス データ アクセス ワークフローをトリガーすることにより、データへのアクセスを要求します。 詳細については、アクセスの要求とセルフサービス データ アクセス ワークフローに関する記事を参照してください。
Synapse リソースを使用してデータセットに対して実行できるアクション
Synapse へのデータの接続
- Synapse への新しいリンク サービスを作成できます。 このアクションは、データを Synapse にコピーしたり、データ ハブに配置したりするために必要となります (ADLSg2 などのサポートされているデータ ソースの場合)。
- ファイル、フォルダー、テーブルなどのオブジェクトについては、新しい統合データセットを直接作成し、既存のリンク サービス (既に作成されている場合) を活用できます。
既存のリンク サービスまたは統合データセットがあるかどうかはまだ推測できません。
Synapse での開発
実行できるアクションは、新しい SQL スクリプト、新しい Notebook、新しいデータ フローの 3 つです。
新しい SQL スクリプトでは、サポートの種類に応じて、次のことができます。
- データの構造を理解するために、上位 100 行を表示する
- Synapse SQL データベースから外部テーブルを作成する
- Synapse SQL データベースにデータを読み込む
新しい Notebook では、次のことができます。
- Spark DataFrame にデータを読み込む
- Spark テーブルを作成する (Parquet 形式でこれを行うと、サーバーレス SQL プール テーブルも作成されます)
新しいデータ フローでは、データ フロー パイプラインのソースとして使用できる統合データセットを作成できます。 データ フローは、データ変換を実行するためのコード不要の開発者向け機能です。 Synapse でのデータ フローの使用方法の詳細については、こちらをご覧ください。