分析データフローのストレージ構造
分析データフローでは、データとメタデータの両方が Azure Data Lake Storage に格納されます。 データフローは、標準的な構造を利用して、作成されたデータをレイク内に格納し、記述します。この構造を Common Data Model フォルダーと呼びます。 この記事では、データフローがバックグラウンドで使用するストレージ標準について詳しく説明します。
ストレージには分析データフロー用の構造が必要です。
データフローが標準である場合、データは Dataverse に格納されます。 Dataverse はデータベース システムに似ていて、テーブルやビューなどの概念があります。 Dataverse は、構造化されたデータ ストレージ オプションであり、標準データフローで使用されます。
ただし、データフローが分析である場合、データは Azure Data Lake Storage に格納されます。 データフローのデータとメタデータは、Common Data Model フォルダーに格納されます。 1 つのストレージ アカウントに複数のデータフローが格納されている場合もあるため、データの整理に役立つように、フォルダーとサブフォルダーから成る階層が導入されています。 データフローが作成された製品に応じて、フォルダーとサブフォルダーは、ワークスペース (または環境) を表し、さらにデータフローの Common Data Model フォルダーを表す場合があります。 Common Data Model フォルダー内には、データフロー テーブルのスキーマとデータの両方が保存されます。 この構造は、Common Data Model のために定義されている標準に従います。
Common Data Model のストレージ構造とは何ですか?
Common Data Model は、複数のプラットフォーム間でデータを使用するときに、適合性と整合性を維持できるように定義されたメタデータ構造です。 Common Data Model は、データ ストレージではなく、データの格納と定義の方法を規定します。
Common Data Model フォルダーは、テーブルのスキーマとそのデータを保存する方法を定義します。 Azure Data Lake Storage では、データはフォルダーごとに整理されます。 フォルダーは、ワークスペースまたは環境を表す場合があります。 それらのフォルダーの下に、各データフローのサブフォルダーが作成されます。
データフロー フォルダーの内容
各データフロー フォルダーには、各テーブルのサブフォルダーと model.json
という名前のメタデータ ファイルが含まれています。
メタデータ ファイル: model.json
model.json
ファイルは、データフローのメタデータ定義です。 この 1 つのファイルに、すべてのデータフロー メタデータが含まれています。 これには、テーブル、列、各テーブルのデータ型のリスト、テーブル間の関係などが含まれます。 Common Data Model フォルダー構造にアクセスできない場合でも、データフローからこのファイルを簡単にエクスポートできます。
この JSON ファイルを使用して、データフローを別のワークスペースまたは環境に移行 (またはインポート) できます。
model.json メタデータ ファイルに含まれる内容を正確に確認するには、「Common Data Model のメタデータ ファイル (model.json)」を参照してください。
データ ファイル。
メタデータ ファイルに加えて、データフロー フォルダーには他のサブフォルダーが含まれています。 データフローは、各テーブルのデータをテーブル名のサブフォルダーに保存します。 テーブルのデータは複数のデータ パーティションに分割され、CSV 形式で保存される場合があります。
Common Data Model フォルダーの表示またはアクセスの方法
データフローで使用されているのがその作成元の製品によって提供されるストレージである場合、Common Data Model フォルダーに直接アクセスすることはできません。 このような場合、データフローからデータを取得するには、Microsoft Power Platform データフロー コネクタを使用する必要があります。このコネクタは、Power BI サービス、Power Apps、Dynamics 35 Customer Insights 製品のデータの取得エクスペリエンス、または Power BI Desktop で利用できます。
データフローと内部 Data Lake Storage の統合の動作については、「データフローと Azure Data Lake の統合 (プレビュー)」を参照してください。
組織が Data Lake Storage アカウントを利用するためにデータフローを有効にし、データフローの読み込みターゲットとして選択されている場合でも、前述のように Power Platform データフロー コネクタを使用してデータフローからデータを取得できます。 ただし、Power Platform ツールやサービスの外部であっても、レイクを通じてデータフローの Common Data Model フォルダーに直接アクセスすることもできます。 レイクへのアクセスは、Azure portal や Microsoft Azure Storage Explorer など、Azure Data Lake Storage をサポートする任意のサービスまたはエクスペリエンスを通じて行うことができます。 詳細情報: データフロー ストレージに Azure Data Lake Storage Gen2を接続する