重要
Azure Data Catalog は、2024 年 5 月 15 日に廃止されました。
データ カタログの機能については、データ資産全体に対する一元化されたデータ ガバナンスを提供する、Microsoft Purview サービスをご使用ください。
この記事では、Azure Data Catalog サービスに関連する、よく寄せられる質問の回答を示します。
Azure Data Catalog とは何ですか
Data Catalog は、Microsoft Azure でホストされるフル マネージドのサービスであり、エンタープライズ データ ソースの登録および検出のシステムとして機能します。 Data Catalog を利用することで、アナリストやデータ サイエンティスト、開発者など、さまざまなユーザーがデータ ソースを登録、検出、理解、消費することができます。
どのようなお客様の課題を解決しますか?
Data Catalog は、ユーザーがエンタープライズ データ ソースの検出と理解ができるように、データ ソースの検出と "ダーク データ" の課題に対処します。
対象ユーザーはだれですか?
Data Catalog は、次のような技術者と技術者以外のユーザーを対象にしています。
- データ開発者、BI、および分析のプロフェッショナル: 他のユーザーが使用するデータおよび分析用コンテンツの生成を担当するユーザー。
- データ スチュワード: データの意味、意図された使用方法などのデータに関する知識を持つユーザー。
- データ コンシューマー: 選択したツールを使用して、ジョブの実行に必要なデータを簡単に検出し、理解し、接続できる必要があるユーザー。
- 中央 IT: ビジネス ユーザー向けに、数百のデータ ソースを探索可能にする必要があり、データの使用方法と使用者を監視し続ける必要があるユーザー。
Data Catalog はどのくらいの期間使用できますか?
Data Catalog は 2025 年 8 月までご利用いただけます。 その時点までに移行する必要があります。
どこに移行すればよいですか?
データ資産全体に対して統合されたデータ ガバナンスを提供する Microsoft Purview サービスに移行できます。
地域ごとの可能性はどうなっていますか?
Data Catalog サービスは、現在、次のデータ センターで使用できます。
- 米国西部
- 米国東部
- 西ヨーロッパ
- 北ヨーロッパ
- オーストラリア東部
- 東南アジア
データ資産の数の制限はどのくらいですか?
Free エディションの Data Catalog は、5,000 の登録済みデータ資産に制限されます。
Standard Edition の Data Catalog は、最大 100,000 の登録済みのデータ資産をサポートします。
テーブル、ビュー、ファイル、レポートなど、Data Catalog に登録されるすべてのオブジェクトが、データ資産として数えられます。
サポートされているデータ ソースと資産の種類は何ですか?
現在サポートされているデータ ソースの一覧については、「Azure Data Catalog でサポートされるデータ ソース」をご覧ください。
別のデータ ソースのサポートを要求するにはどうすればよいですか?
機能要求やその他のフィードバックを送信するには、Azure フィードバック フォーラムの Data Catalog を利用してください。
新しいカタログを作成しようとすると、エラー "カタログは既に存在します" が表示されるのはなぜですか?
Power BI Pro ライセンス付きの Office 365 E5 を購入すると、Microsoft によってサブスクリプションのリージョンに既定のカタログが自動的に作成されます。 このカタログは、無料の SKU を使用します。 Office 365 と Power BI のユーザー ライセンスは管理ページで管理されています。
ただし、この種類のデータ カタログは管理者オプションを備えていないため、Azure portal に表示されません。 この種類のデータ カタログは削除できません。 同様に、データ カタログの名前変更も、別のリージョンへの移動もできません。
Power BI Pro ライセンスが自動的に割り当てられているユーザー アカウントは、Power BI Pro ライセンス付きの Office 365 E5 にサインアップしたときに、使用許諾契約書によりデータ カタログのアクセス権を付与されます。 この種類のユーザーには、データ カタログ資産へのフル アクセス権 (管理特権なし) があります。 この種類のユーザーは、Azure Data Catalog の カタログ ユーザー役割には "含まれません"。
データの登録方法を教えてください
Data Catalog でデータを登録するには、次の手順を実行します。
- Azure Data Catalog ポータルの [発行] 領域で、Azure Data Catalog 登録ツールを起動します。
- Data Catalog データ ソース登録ツールで、Data Catalog ポータルへのアクセスに使うのと同じ資格情報でサインインします。
- データ ソースと登録する特定の資産を選択します。
登録されているデータ資産に対し、どのようなプロパティが抽出されますか?
具体的なプロパティはデータ ソースごとに異なりますが、一般に、Data Catalog 発行サービスでは次の情報が抽出されます。
- Asset Name
- 資産の種類
- 資産の説明
- 属性/列名
- 属性/列データ型
- 属性/列の説明
重要
データ資産を Data Catalog に登録しても、クラウドへのデータの移動もコピーも行われません。 データ ソースから資産を登録すると、資産のメタデータが Azure にコピーされますが、データは、既存のデータ ソースの場所に残ります。 このルールの例外は、資産の登録時に、プレビュー レコードまたはデータ プロファイルをアップロードするように選択した場合です。 プレビューを含めると、最大 20 のレコードが各資産からコピーされ、Data Catalog にスナップショットとして格納されます。 データ プロファイルを含めると、集計情報が計算され、カタログに格納されているメタデータに含まれます。 集計情報には、テーブルのサイズ、列あたりの null 値の割合、または列の最小、最大、および平均値を含めることができます。
Note
ファーストクラス Description プロパティを持つ SQL Server Analysis Services などのデータ ソースに対し、Data Catalog データ ソース登録ツールはそのプロパティ値を抽出します。 ファーストクラス Description プロパティがない "オンプレミス" SQL Server リレーショナル データベースに対しては、Data Catalog データ ソース登録ツールはオブジェクトと列の MS_Description 拡張プロパティから値を抽出します。 このプロパティは SQL Azure ではサポートされていません。 詳細については、「データベース オブジェクトでの拡張プロパティの使用」を参照してください。
新しく登録された資産がカタログに表示されるまでにどのくらいの時間がかかりますか?
Data Catalog に資産を登録した後に、それらが Data Catalog ポータルに表示されるまで、5 ~ 10 秒の時間がかかる可能性があります。
登録したデータ資産のメタデータに注釈を付け、強化するには、どうするのですか?
登録した資産にメタデータを指定する最も簡単な方法は、Data Catalog ポータルで資産を選択し、選択したオブジェクトのプロパティ ウィンドウまたはスキーマ ウィンドウで、値を入力することです。
エキスパートやタグなどのいくつかのメタデータは、登録プロセス中に指定することもできます。 Data Catalog 発行サービスで指定した値は、その時点で登録されているすべての資産に適用されます。 ポータルに最近登録されたオブジェクトでさらに注釈を表示するには、Data Catalog データ ソース登録ツールの最終画面の [ポータルの表示] ボタンをクリックします。
登録済みのデータ オブジェクトを削除するにはどうすればよいですか?
Data Catalog からオブジェクトを削除するには、ポータルでオブジェクトを選択し、[削除] ボタンをクリックします。 オブジェクトを削除すると、そのメタデータが Data Catalog から削除されますが、基になるデータ ソースには影響しません。
エキスパートとは何ですか?
エキスパートは、データ オブジェクトに関して、情報に基づいた、ある観点を持つ個人です。 オブジェクトには、複数のエキスパートを指定できます。 エキスパートは、オブジェクトの "所有者" である必要はありませんが、単純に、データをどのように使用でき、使用すべきかを知っている者です。
問題が発生した場合に、Data Catalog チームに情報を伝えるにはどうすればよいですか?
問題の報告、情報の共有、質問の投稿を行うには、Azure Data Catalog フォーラムにアクセスするか、サポート リクエストを開きます。
カタログは興味がある別のデータ ソースを処理しますか?
Data Catalog へのデータ ソースの追加には積極的に取り組んでいるところです。 サポートされている具体的なデータ ソースを確認する場合は、Azure フィードバック フォーラムの Data Catalog に移動して、それを提案 (または、それが既に提案されている場合は、その支持を表明) してください。
Data Catalog に資産を登録するには、どのようなアクセス許可が必要ですか?
Data Catalog 登録ツールを実行するには、データ ソースに対し、そのソースからメタデータを読み取ることができるアクセス許可が必要です。 プレビューも含めるには、登録されるオブジェクトからのデータの読み取りができるアクセス許可が必要です。
Data Catalog を使うことで、カタログ管理者は、カタログにメタデータを追加できるユーザーとグループを制限することもできます。 詳細については、「データ カタログとデータ資産へのアクセスをセキュリティで保護する方法」を参照してください。
Data Catalog は、オンプレミスのデプロイメントにも使用できますか?
Data Catalog は、クラウドとオンプレミスの両方のデータ ソースを操作できるクラウド サービスであり、ハイブリッド データ ソース検出ソリューションを提供します。 現在オンプレミスで実行する Data Catalog のバージョンの計画はありません。
登録するデータ ソースから抽出するメタデータを追加したり、強化したりできますか?
Data Catalog の機能の拡張に積極的に取り組んでいるところです。 登録時にデータ ソースからさらにメタデータを抽出する場合は、Azure フィードバック フォーラムの Data Catalog で、それを提案して (または既に提案されている場合は、賛成票を投じて) ください。
データ ソース登録ツールによってこのメタデータが抽出されないデータ ソースの列/スキーマ メタデータ、プレビュー、またはデータ プロファイルを含める場合は、Data Catalog API を使用してこのメタデータを追加できます。 詳細については、「Azure Data Catalog の REST API」を参照してください。
特定のユーザーだけが検出できるように、登録されているデータ資産の可視性を制限するにはどうすればいいですか?
Data Catalog で、データ資産を選択し、[所有権の取得] ボタンを選択します。 Data Catalog のデータ資産の所有者は、可視性設定を変更して、すべてのユーザーが、所有している資産を検出できるようにするか、または特定のユーザーに可視性を制限することができます。 詳細については、「Azure Data Catalog でデータ資産を管理する」を参照してください。
データ ソースの変更がカタログに反映されるように、データ資産の登録を更新するにはどうすればいいですか?
カタログに既に登録されているデータ資産のメタデータを更新するには、その資産を含むデータ ソースを再登録します。 テーブルまたはビューの列の追加や削除などのデータ ソースのすべての変更は、カタログで更新されますが、ユーザーによって提供されたすべての注釈は維持されます。
ここに質問の答えがありません。 どうすればいいですか?
Azure Data Catalog Q&A フォームにアクセスしてください。