Microsoft Purview で PostgreSQL に接続して管理する
この記事では、PostgreSQL を登録する方法と、Microsoft Purview で PostgreSQL を認証して操作する方法について説明します。 Microsoft Purview の詳細については、 入門記事を参照してください。
サポートされている機能
メタデータ抽出 | フル スキャン | 増分スキャン | スコープスキャン | 分類 | ラベル付け | アクセス ポリシー | 系統 | データ共有 | ライブ ビュー |
---|---|---|---|---|---|---|---|---|---|
○ | はい | いいえ | はい | いいえ | 不要 | 不要 | はい | いいえ | 不要 |
サポートされている PostgreSQL サーバーのバージョンは、8.4 から 12.x です。
PostgreSQL ソースをスキャンする場合、Microsoft Purview では次の処理がサポートされます。
以下を含む技術的なメタデータの抽出:
- サーバー
- Databases
- Schemas
- 列を含むテーブル
- 列を含むビュー
テーブルとビュー間の資産リレーションシップに対する静的系列のフェッチ。
スキャンを設定するときに、PostgreSQL データベース全体をスキャンするか、指定された名前または名前パターンに一致するスキーマのサブセットにスキャンのスコープを設定できます。
既知の制限
オブジェクトがデータ ソースから削除された場合、現在、後続のスキャンでは、Microsoft Purview の対応する資産は自動的に削除されません。
前提条件
- アクティブなサブスクリプションを持つ Azure アカウント。 無料でアカウントを作成します。
- アクティブな Microsoft Purview アカウント。
- ソースを登録し、Microsoft Purview ガバナンス ポータルで管理するには、データ ソース管理者とデータ 閲覧者のアクセス許可が必要です。 アクセス許可の詳細については、「 Microsoft Purview でのアクセス制御」を参照してください。
注:
データ ストアにパブリックにアクセスできない場合 (データ ストアでオンプレミス ネットワーク、プライベート ネットワーク、または特定の IP からのアクセスが制限されている場合)、 セルフホステッド統合ランタイムを構成して接続する必要があります。
- データ ストアにパブリックにアクセスできない場合は、最新の セルフホステッド統合ランタイムを設定します。 詳細については、 セルフホステッド統合ランタイムの作成と構成に関するガイドを参照してください。
- セルフホステッド統合ランタイムがインストールされているマシンに JDK 11 がインストールされていることを確認します。 JDK を新しくインストールして有効にした後、マシンを再起動します。
- Visual C++ 再頒布可能パッケージ (バージョン Visual Studio 2012 Update 4 以降) がセルフホステッド統合ランタイム コンピューターにインストールされていることを確認します。 この更新プログラムがインストールされていない場合は、 こちらからダウンロードできます。
スキャンに必要なアクセス許可
高度なメタデータにアクセスするには、PostgreSQL ユーザーがシステム テーブルへの読み取りアクセス権を持っている必要があります。
登録
このセクションでは、 Microsoft Purview ガバナンス ポータルを使用して、Microsoft Purview に PostgreSQL を登録する方法について説明します。
登録手順
データ カタログに新しい PostgreSQL ソースを登録するには、次の手順に従います。
- Microsoft Purview ガバナンス ポータルで Microsoft Purview アカウントに移動します。
- 左側のナビゲーションで [ データ マップ ] を選択します。
- [ 登録] を選択します
- [ソースの登録] で、[ PostgreSQL] を選択します。 [続行] を選択します。
[ ソースの登録 (PostgreSQL)] 画面で、次の手順を実行します。
カタログ内にデータ ソースが一覧表示される 名前 を入力します。
PostgreSQL ソースに接続する サーバー 名を入力します。 次のいずれかを実行できます。
- データベース サーバーへの接続に使用されるホスト名。 例:
MyDatabaseServer.com
- IP アドレス。 例:
192.169.1.2
- データベース サーバーへの接続に使用されるホスト名。 例:
データベース サーバーへの接続に使用する ポート を入力します (PostgreSQL の場合は既定で 5432)。
コレクションを選択するか、新しいコレクションを作成します (省略可能)
完了してデータ ソースを登録します。
スキャン
PostgreSQL をスキャンして資産を自動的に識別するには、次の手順に従います。 スキャン全般の詳細については、スキャン とインジェストの概要に関するページを参照してください。
スキャンの認証
PostgreSQL ソースでサポートされている認証の種類は Basic 認証です。
スキャンの作成と実行
新しいスキャンを作成して実行するには、次の手順に従います。
サーバーにパブリックにアクセスできる場合は、手順 2 に進みます。 それ以外の場合は、セルフホステッド統合ランタイムが構成されていることを確認する必要があります。
- Microsoft Purview ガバナンス ポータルで、管理センターに移動し、[統合ランタイム] を選択します。
- セルフホステッド統合ランタイムが使用可能であることを確認します。 設定されていない場合は、 ここで 説明する手順を使用して、セルフホステッド統合ランタイムを設定します。
Microsoft Purview ガバナンス ポータルで、[ソース] に移動します。
登録済みの PostgreSQL ソースを選択します。
[ + 新しいスキャン] を選択します。
以下の詳細を指定します。
名前: スキャンの名前
統合ランタイム経由で接続する: サーバーがパブリックにアクセス可能な場合は Azure 自動解決統合ランタイムを選択し、一般公開されていない場合は構成済みのセルフホステッド統合ランタイムを選択します。
資格情報: データ ソースに接続する資格情報を選択します。 次のことを確認してください。
- 資格情報の作成時に [ 基本認証 ] を選択します。
- [ユーザー名] 入力フィールドに、データベース サーバーへの接続に使用するユーザー名を指定します。
- データベース サーバーへの接続に使用するユーザー パスワードを秘密キーに格納します。
データベース: インポートするデータベース インスタンスの名前を指定します。
スキーマ: インポートするスキーマのサブセットをセミコロン区切りリストとして一覧表示します。 たとえば、「
schema1; schema2
」のように入力します。 そのリストが空の場合、すべてのユーザー スキーマがインポートされます。 既定では、すべてのシステム スキーマ (SysAdmin など) とオブジェクトは無視されます。SQL LIKE 式構文を使用する許容されるスキーマ名パターンには、 % を使用するものが含まれます。 例:
A%; %B; %C%; D
- A または から始める
- B または で終わる
- C または を含む
- 等しい D
NOT 文字と特殊文字の使用は許可されません。
使用可能な最大メモリ (セルフホステッド統合ランタイムを使用する場合に適用可能): プロセスのスキャンによって使用される、お客様の VM で使用可能な最大メモリ (GB 単位)。 これは、スキャンする PostgreSQL ソースのサイズによって異なります。
注:
経験則として、1000 テーブルごとに 1 GB のメモリを提供してください
[接続のテスト] を選択して設定を検証します (Azure Integration Runtimeを使用する場合に使用できます)。
[続行] を選択します。
スキャン トリガーを選択します。 スケジュールを設定することも、スキャンを 1 回実行することもできます。
スキャンを確認し、[ 保存して実行] を選択します。
スキャンとスキャンの実行を表示する
既存のスキャンを表示するには:
- Microsoft Purview ガバナンス ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。
- データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。
- 表示する結果を含むスキャンを選択します。 このウィンドウには、以前のすべてのスキャン実行と、各スキャン実行の状態とメトリックが表示されます。
- 実行 ID を選択して、スキャン実行の詳細をチェックします。
スキャンを管理する
スキャンを編集、取り消し、または削除するには:
Microsoft Purview ガバナンス ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。
データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。
管理するスキャンを選択します。 次のことを実行できます。
- [スキャンの編集] を選択して スキャンを編集します。
- [スキャンの実行の取り消し] を選択して、進行中 のスキャンを取り消します。
- [スキャンの削除] を選択して スキャンを削除します。
注:
- スキャンを削除しても、以前のスキャンから作成されたカタログ資産は削除されません。
- ソース テーブルが変更され、Microsoft Purview の [スキーマ] タブで説明を編集した後にソース テーブルを再スキャンした場合、資産は スキーマ の変更で更新されなくなります。
系統
PostgreSQL ソースをスキャンした後、 データ カタログを参照 するか 、データ カタログを検索 して資産の詳細を表示できます。
[資産 -> 系列] タブに移動すると、該当する場合に資産関係を確認できます。 サポートされている PostgreSQL 系列シナリオのサポート されている機能 に関するセクションを参照してください。 系列全般の詳細については、「データ系列と系列ユーザー ガイド」を参照してください。
次の手順
ソースを登録したので、次のガイドに従って、Microsoft Purview とデータの詳細を確認してください。