Azure Data Catalog でデータ ソースを検出する方法
重要
Azure Data Catalog は、2024 年 5 月 15 日に廃止されました。
データ カタログ機能については、Microsoft Purview サービスを使用してください。データ資産全体に対する一元化されたデータ ガバナンスが得られます。
はじめに
Azure Data Catalog は、フル マネージドのクラウド サービスで、エンタープライズ データ ソースの登録と検出システムとして機能します。 つまり、Data Catalog を利用して、ユーザーはデータ ソースを検出、解釈、および使用することが可能です。 組織は、既存のデータからより優れた価値を得ることができます。 データ ソースが Data Catalog に登録されると、そのメタデータにはサービスによってインデックスが付けられます。その結果、ユーザーは検索を実行して必要なデータを容易に検出できるようになります。
検索とフィルター処理
Data Catalog での検出では、検索とフィルター処理という 2 つの主要なメカニズムを使用します。
検索は、直感的かつ強力な検出方法です。 既定では、検索語句はカタログ内の任意のプロパティと照合されます (ユーザーが指定した注釈を含む)。
フィルター処理は、検索を補完するものです。 エキスパート、データ ソースの種類、オブジェクトの種類、タグなどの特定の特性を選択できます。 一致するデータ資産のみを表示したり、検索結果を一致する資産に制限したりすることができます。
検索とフィルター処理を組み合わせて使用することで、Data Catalog に登録されたデータ ソースをすばやく移動し、必要なデータ ソースを検出することができます。
検索構文
既定の自由テキストの検索は単純かつ直観的ですが、Data Catalog の検索構文を使用して検索結果をより細かく制御することもできます。 Data Catalog 検索では、次の手法をサポートしています。
手法 | 用途 | 例 |
---|---|---|
基本的な検索 | 1 つまたは複数の検索語句を使用した基本的な検索です。 いずれかのプロパティが指定した 1 つまたは複数の語句と一致するすべての資産が返されます。 | sales data |
プロパティ スコープ | 検索語句が指定したプロパティと一致するデータ ソースのみを返します。 | name:finance |
ブール演算子 | ブール演算子を使用して検索の範囲を広げたり狭めたりします。 | finance NOT corporate |
かっこを使用したグループ化 | かっこを、特にブール演算子とともに使用して、クエリの各部分をグループ化し、論理的に分離します。 | name:finance AND (tags:Q1 OR tags:Q2) |
比較演算子 | 数値データ型および日付データ型を持つプロパティについて、等値演算子以外の比較演算子を使用します。 | modifiedTime > "11/05/2014" |
Data Catalog の検索の詳細については、「Azure Data Catalog REST API」の記事を参照してください。
検索結果の強調表示
検索結果を表示すると、指定した検索語句 (データ資産名、説明、タグなど) と一致して表示されるプロパティは強調表示されます。これにより、特定の検索によって特定のデータ資産が返された理由を容易に識別できます。
Note
検索結果の強調表示をオフにするには、Data Catalog ポータルで [強調表示] を切り替えます。
検索結果を表示する場合は、検索語句の強調表示が有効であっても、データ資産が検索結果に含まれている理由が常に明らかであるとは限りません。 既定ではすべてのプロパティが検索されるため、列レベルのプロパティでの一致により、データ資産が返される可能性があります。 また、複数のユーザーが独自のタグおよび説明を使用して登録済みのデータ資産に注釈を付けることができるので、検索結果の一覧にすべてのメタデータが表示されるとは限りません。
既定のタイル ビューでは、検索結果に表示される各タイルに [検索語句の一致を表示] アイコンが含まれます。このアイコンを使用することで、一致した数および一致場所を迅速に表示し、必要に応じてジャンプすることができます。
まとめ
Data Catalog でデータ ソースを登録すると、構造メタデータと記述メタデータがデータ ソースからカタログ サービスにコピーされるため、データ ソースの検出と把握が容易になります。 データ ソースを登録すると、Data Catalog ポータルでフィルター処理と検索を使用してデータ ソースの探索を行うことができます。
次のステップ
- データ ソースの検出方法の詳細な手順については、「Azure Data Catalog の概要」を参照してください。