資料來源概觀
若要進行 Dynamics 365 Customer Insights - Data 設定,請先引入來源資料供處理。 Customer Insights - Data 提供數種類型的資料連接器,以連接至一組廣泛的來源並從中擷取資料。
本文說明可能影響資料擷取效能的選項。
Delta 格式
Delta 資料格式是 Customer Insights – Data 使用的原生處理格式。 如果您可以提供 Delta 格式的來源資料,則會有很多好處。
- 使用 Customer Insights - Data 提高效率:Customer Insights - Data 在內部使用 Delta 格式。
- 加快資料擷取:Delta 格式提供絕佳壓縮,使資料傳輸更快速。
- 加快統整速度:使用 Delta 時間旅行功能時,Customer Insights–Data 僅統整已變更的資料。 不會重新處理整個資料集。 如需進行增量統整,所有用於統整的資料輸入都必須採用 Delta 格式。
- 減少資料損毀問題:Delta 格式會減少由逗號分隔值 (CSV) 格式等舊格式造成的磁碟分割損壞和一般資料損毀問題。
- 增加資料管理設計可靠性:Delta 格式不需要手動更新資訊清單、結構描述和磁碟分割檔案。
- 提高資料有效性:Delta 格式在 Spark 中提供不可部分完成性、一致性、隔離性、耐用性 (ACID) 異動和隔離層級。
您可以將 Delta 格式用於下列連接器:
Delta 是 Delta Lake (Databricks Lakehouse 平台中儲存資料和資料表的基礎) 中採用的詞彙。 Delta Lake 是開放原始碼儲存層,可為巨量資料工作負載提供 ACID (不可部分完成性、一致性、隔離性、耐用性) 交易。 如需詳細資訊,請參閱 Delta Lake 文件頁面。
資料來源附加或匯入
決定擷取資料的方式時,主要考量在於資料連接器是附加至資料還是建立其複本。 使用 Customer Insights - Data時,建議您使用附加至資料的連接器。 如此一來,就會在需要處理資料時直接加以存取。 如果使用複製資料的連接器,則可能會在更新資料時發生延遲。
下列資料連接器會附加至您的資料:
- Azure Data Lake Storage Delta 資料表
- Azure Data Lake Storage Common Data Model 資料表
- Microsoft Dataverse
- Azure Synapse Analytics (預覽版)
如果無法使用附加至資料的連接器,請使用其中一個 Power Query 連接器來複製資料。 Power Query 提供轉換資料的實用方法。
資料分析
擷取資料時,Customer Insights – Data 會執行一些基本資料分析。 例如,分析資料行中重複值的頻率。 您可以使用設定檔資料來了解您的資料並解決問題。 例如,如果要根據 FullName
資料行進行比對,則資料分析可協助您偵測到 10,000 個資料列中出現預設值輸入您的姓名。 因此,如果根據此值進行比對,則會比對出 10,000 個應該不會比對相符的資料列。 新增 Azure 資料湖、Delta 資料表或 Azure Synapse 資料來源時,您可以在更多資料行中啟用資料分析。
擷取資料後,您可以檢視資料分析的結果。
移至資料>資料表,並選取資料表。 然後,在欄位 (例如,
DateOfBirth
) 所在列的摘要欄中,選取摘要圖示。檢閱任何錯誤或遺失值的詳細資料。
資料來源頁面
資料來源頁面在兩個區段中列出資料來源:
- 由我管理:您所建立和管理的 Microsoft Power Platform 資料流程。 其他使用者只能檢視這些資料流程。 他們無法加以編輯、重新整理或刪除。
- 由其他人管理:其他管理員建立的 Microsoft Power Platform 資料流程。 您只能檢視這些資料流程。 此區段顯示每個資料流程的擁有者,讓您可以在需要任何協助時連絡他們。
注意
其他使用者可以檢視和使用所有資料表。 雖然每個資料來源都歸建立它的使用者所擁有,但 Customer Insights - Data 的所有使用者也都可以使用資料擷取產生的所有資料表。