共用方式為


擴充 Smart Store Analytics

Smart Store Analytics 的進階使用者可以從他們自己的 Data Lake Storage 中存取相關的資料和分析。 您可以透過任何其他支援 Microsoft Azure Data Lake Storage 和 Common Data Model 定義 (例如 Microsoft Azure Synapse AnalyticsMicrosoft Azure Data FactoryMicrosoft Power BI) 的服務或應用程式進行存取。

重要

由於 Microsoft Azure Data Lake Storage Gen1 不相容,因此您必須使用 Microsoft Azure Data Lake Storage Gen2。

Smart Store Analytics 資料模型遵循適用於 Retail 的 Azure Synapse 資料庫範本、已依照 Smart Store Analytics 詳細規格進行增強,並簡化了其他應用程式與資料湖資料的連接。

Smart Store Analytics 資料湖結構

Smart Store Analytics 資料湖遵循Common Data Model 定義 (Common Data Model 中繼資料)。

圖中顯示 Smart Store Analytics 的資料湖結構。

根資料夾的名稱為 smartstores/。 在根資料夾下,有兩個資料快照集:

從智慧商店提供者 (原始智慧商店資料) 轉換的資料

未經處理資料的根 Common Data Model 資訊清單是 root.manifest.cdm.json。 資訊清單檔案是指位於子資料夾 (以資料表命名,例如 smartstores/Order/) 的結構描述檔案和實際資料檔案。

每個資料表的子資料夾都包含:

  • 結構描述檔案 (這會定義資料表中繼資料、資料行和類型),採用 table-name.cdm.json 格式,例如 Order.cdm.json

  • 資料檔案 (也稱為資料分割或資料表記錄),採用 Parquet 格式,例如 Order-cec9368060a849b8aab7583b62b506eb-00001.parquet

零售分析和 AI 模組從原始智慧商店資料產生的資料

所有產生的資料都位於以 GUID 命名的資料夾,例如 smartstores/14a7334b-7176-ed11-9985-00224804e0d0/。 此資料的根 Common Data Model 資訊清單是 kpi.manifest.cdm.json。 資訊清單檔案是指位於以 GUID 命名的資料夾中的結構描述檔案和實際資料檔案。

以 GUID 命名的資料夾包含:

  • 每個資料表的結構描述檔案 (這會定義資料表中繼資料、資料行和類型),採用 table-name.cdm.json 格式,例如 OrderMetrics.cdm.json

  • 資料檔案 (也稱為資料分割或資料表記錄),採用 Parquet 格式,例如 part-00000-1e110bf0-6474-400b-b40a-086fce9f8e2a-c000.snappy.parquet

重要

根據 Common Data Model 中繼資料合約,使用者只需要 manifest.cdm.json 檔案中的資料。 他們不需要解譯資料夾結構或其他存在於資料湖中的內部檔案。

Smart Store Analytics 資料湖使用方式

以下是一些同步處理至由 Microsoft Cloud for Retail 所產生分析/AI Insights 之資料的範例。

資料管線與 Microsoft Azure Data Factory

若要建立資料管線:

  1. 建立 Azure Data Factory 執行個體,並將其連結至 Smart Store Analytics Data Lake Storage。 您必須有一個連接測試成功的連結服務。

影像顯示如何建立 Azure Data Factory 連結服務。

注意

將 Azure Data Factory 執行個體連接至 Azure Data Lake Storage 的最簡單方式是,將參與者角色指派給 Azure Data Lake Storage 帳戶中的 Azure Data Factory 受控識別。 如需詳細資訊,請參閱 Azure Data Factory 文件

  1. 選取全部發佈以發佈新連結。

影像顯示如何發佈 Azure Data Factory 連結服務。

建立包含 Microsoft Azure Data Factory 的資料管線

若要建立 smartstores/ 資料夾的複製管線做為來源,請執行下列步驟:

  1. 在 [作者] 區段中,選取新增資料流程以建立新的資料流程。

影像顯示如何建立新的資料流程。

  1. 開始偵錯以加速檢查管線設定。

影像顯示如何開始偵錯資料流程。

  1. 設定 [來源] 設定,如下所示:
  • 對於來源類型,選取內嵌

影像顯示選取的內嵌來源類型。

  • 對於內嵌資料集類型,選取 Common Data Model

影像顯示做為內聯來源的 Common Data Model。

  • 使用 Smart Store Analytics 資料湖已建立的 Azure Data Lake Storage 連結。

影像示範使用資料湖的連結服務。

  1. 在 [來源選項] 區段中,設定 Common Data Model 結構描述來源,如下所示:
  • 選取資訊清單做為中繼資料格式。

影像顯示選取資訊清單做為中繼資料格式。

  • 在根位置中,瀏覽並選取 smartstores 資料夾。

  • 在 [資訊清單檔案] 區段中,瀏覽以選取所需的根資訊清單。 選取分析和 AI Insights 資料的根檔案 kpi.manifest.cdm.json

    影像示範選取根資訊清單檔案

  • 在 [實體] 區段中,選取您需要複製/轉換的實體 (資料表),例如「經常一起購買」套件中的 FBTProductAssociationsUI

影像示範選取「經常一起購買」套件。

  1. 在 [投影] 索引標籤中,選取允許結構描述漂移。 此選取項目可確保結構描述不會在來源處進行驗證,但會漂移至其他轉換/接收步驟。

影像示範允許結構描述漂移。

  1. 在 [資料預覽] 索引標籤中,選取重新載入以驗證資料來源設定。

影像示範驗證資料來源。

  1. 新增接收步驟 - 根據案例需要設定參數和資料對應。

  2. 選取發行以發行變更。