次の方法で共有


Microsoft Purview で Cassandra に接続して管理する

この記事では、Cassandra を登録する方法と、Microsoft Purview で Cassandra を認証して操作する方法について説明します。 Microsoft Purview の詳細については、 入門記事を参照してください。

サポートされている機能

メタデータ抽出 フル スキャン 増分スキャン スコープスキャン 分類 ラベル付け アクセス ポリシー 系統 データ共有 ライブ ビュー
はい いいえ はい いいえ いいえ いいえ はい いいえ いいえ

サポートされている Cassandra サーバーのバージョンは 3 です。x または 4。x

Cassandra ソースをスキャンする場合、Microsoft Purview では次の処理がサポートされます。

  • 以下を含む技術的なメタデータの抽出:

    • クラスター
    • Keyspaces
    • 列とインデックスを含むテーブル
    • 列を含む具体化されたビュー
  • テーブルと具体化されたビュー間の資産リレーションシップに対する静的系列をフェッチする。

スキャンを設定するときに、Cassandra インスタンス全体をスキャンするか、指定された名前または名前パターンに一致するキースペースのサブセットにスキャンのスコープを設定するかを選択できます。

既知の制限

オブジェクトがデータ ソースから削除された場合、現在、後続のスキャンでは、Microsoft Purview の対応する資産は自動的に削除されません。

前提条件

注:

データ ストアにパブリックにアクセスできない場合 (データ ストアでオンプレミス ネットワーク、プライベート ネットワーク、または特定の IP からのアクセスが制限されている場合)、 セルフホステッド統合ランタイムを構成して接続する必要があります。

登録

このセクションでは、 Microsoft Purview ガバナンス ポータルを使用して、Microsoft Purview に Cassandra を登録する方法について説明します。

登録手順

Microsoft Purview 統合カタログで新しい Cassandra サーバーを登録するには:

  1. 次の方法で Microsoft Purview ガバナンス ポータルを開きます。

  2. 左側のウィンドウで [ データ マップ ] を選択します。

  3. [登録] を選択します。

  4. [ ソースの登録 ] 画面 で、[Cassandra] を選択し、[続行] を選択 します

    [ソースの登録] 画面を示すスクリーンショット。

  5. [ ソースの登録 (Cassandra)] 画面で、次の手順を実行します。

    1. 名前 を入力します。 データ ソースでは、カタログでこの名前が使用されます。
    2. [ ホスト ] ボックスに、Cassandra サーバーが実行されているサーバー アドレスを入力します。 たとえば、20.190.193.10 などです。
    3. [ ポート ] ボックスに、Cassandra サーバーで使用されるポートを入力します。
    4. 一覧からコレクションを選択します。 [ソースの登録 ] (Cassandra) 画面を示すスクリーンショット。
    5. [登録] を選択します。

スキャン

Cassandra をスキャンして資産を自動的に識別するには、次の手順に従います。 スキャン全般の詳細については、スキャンとインジェストの概要に関するページを参照してください。

スキャンの作成と実行

新しいスキャンを作成して実行するには:

  1. サーバーにパブリックにアクセスできる場合は、手順 2 に進みます。 それ以外の場合は、セルフホステッド統合ランタイムが構成されていることを確認する必要があります。

    1. Microsoft Purview ガバナンス ポータルで、管理センターに移動し、[統合ランタイム] を選択します。
    2. セルフホステッド統合ランタイムが使用可能であることを確認します。 セットアップされていない場合は、「 前提条件」で 説明されている手順を使用して、セルフホステッド統合ランタイムを設定します。
  2. Microsoft Purview ガバナンス ポータルで、[ソース] に移動します。

  3. 登録済みの Cassandra サーバーを選択します。

  4. [ 新しいスキャン] を選択します。

  5. 次の詳細を指定します。

    1. [名前]: スキャンの名前を指定します。

    2. 統合ランタイム経由で接続する: サーバーがパブリックにアクセス可能な場合は Azure 自動解決統合ランタイムを選択し、一般公開されていない場合は構成済みのセルフホステッド統合ランタイムを選択します。

    3. 資格情報: Cassandra 資格情報を構成するときは、次の手順を実行してください。

      • 認証方法として [ 基本認証 ] を選択します。
      • [ ユーザー名 ] ボックスに、接続するユーザーの名前を指定します。
      • キー コンテナーのシークレットで、接続する Cassandra ユーザーのパスワードを保存します。

      詳細については、「 Microsoft Purview でのソース認証の資格情報」を参照してください。

    4. Keyspaces: インポートする Cassandra キースペースの一覧を指定します。 複数のキースペースはセミコロンで区切る必要があります。 たとえば、「 keyspace1;keyspace2 」のように入力します。 リストが空の場合、使用可能なすべてのキースペースがインポートされます。

    5. Secure Sockets Layer(SSL)を使用する: Cassandra サーバーに接続するときに Secure Sockets Layer (SSL) を使用するかどうかを指定するには、[ True] または [ False] を 選択します。 既定では、このオプションは False に設定 されています

    6. 使用可能な最大メモリ (セルフホステッド統合ランタイムを使用する場合に適用可能): スキャン プロセスに使用する VM で使用できる最大メモリ (GB 単位) を指定します。 この値は、スキャンする Cassandra サーバーのサイズによって異なります。 cassandra ソースをスキャンする

  6. [ 接続のテスト] を選択して、設定を検証します。

  7. [続行] を選択します。

  8. スキャン トリガーを選択します。 スケジュールを設定することも、スキャンを 1 回実行することもできます。

  9. スキャンを確認し、[保存して 実行] を選択します。

スキャンとスキャンの実行を表示する

既存のスキャンを表示するには:

  1. Microsoft Purview ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。
  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。
  3. 表示する結果を含むスキャンを選択します。 このウィンドウには、以前のすべてのスキャン実行と、各スキャン実行の状態とメトリックが表示されます。
  4. 実行 ID を選択して、スキャン実行の詳細をチェックします

スキャンを管理する

スキャンを編集、取り消し、または削除するには:

  1. Microsoft Purview ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。

  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。

  3. 管理するスキャンを選択します。 次のことを実行できます。

    • [スキャンの編集] を選択して スキャンを編集します
    • [スキャンの実行の取り消し] を選択して、進行中 のスキャンを取り消します
    • [スキャンの削除] を選択して スキャンを削除します

注:

  • スキャンを削除しても、以前のスキャンから作成されたカタログ資産は削除されません。

系統

Cassandra ソースをスキャンした後、統合カタログ参照するか、統合カタログを検索して資産の詳細を表示できます。

[資産 - > 系列] タブに移動すると、該当する場合に資産関係を確認できます。 サポートされている Cassandra 系列のシナリオについては、サポートされている機能に関するセクションを参照してください。 系列全般の詳細については、「データ系列と系列ユーザー ガイド」を参照してください。

Cassandra 系列ビュー

次の手順

ソースを登録したので、次のガイドに従って、Microsoft Purview とデータの詳細を確認してください。