Přehled zdrojů dat
Chcete-li nakonfigurovat Dynamics 365 Customer Insights - Data, nejprve zadejte zdrojová data ke zpracování. Customer Insights - Data poskytuje několik typů datových konektorů pro připojení a zpracování dat ze široké množiny zdrojů.
Tento článek popisuje možnosti, které mohou ovlivnit výkon příjmu dat.
Formát Delta
Formát dat Delta je nativní formát zpracování používaný službou Customer Insights – Data. Pokud můžete poskytnout zdrojová data ve formátu Delta, má to mnoho výhod.
- Vyšší efektivita s Customer Insights - Data: Formát Delta interně používá Customer Insights - Data.
- Rychlejší příjem dat: Formát Delta poskytuje vynikající kompresi pro rychlejší přenosy dat.
- Rychlejší sjednocení: Při použití funkce cestování v čase Delta sjednocuje Customer Insights – Data pouze data, která se změnila. Nezpracovává znovu celou sadu dat. Pro přírůstkové sjednocení musí být všechny vstupy dat ke sjednocení ve formátu Delta.
- Méně problémů s poškozením dat: Rozdílový formát snižuje poškozené oddíly a běžné problémy s poškozením dat, které jsou způsobeny staršími formáty, jako je formát hodnot oddělených čárkami (CSV).
- Spolehlivější návrh správy dat: Formát Delta nevyžaduje ruční aktualizace manifestů, schémat a souborů oddílů.
- Vyšší validita dat: Delta formát poskytuje ve Spark atomicitu, konzistenci, izolaci, trvanlivost (ACID) a úrovně izolace.
Formát Delta můžete použít s následujícími konektory:
Delta je termín zavedený s Delta Lake a jedná se o základ pro ukládání dat a tabulek v Databricks Lakehouse Platform. Delta Lake je vrstva úložiště s otevřeným zdrojovým kódem, která přenáší transakce ACID (atomicita, konzistence, izolace a trvanlivost) do úloh s velkým objemem dat. Další informace najdete na stránce s dokumentací k Delta Lake.
Připojení nebo import zdroje dat
Při rozhodování, jak ingestovat data, je klíčovým faktorem, zda se konektor dat připojuje k datům nebo vytváří jejich kopie. Při použití Customer Insights - Data doporučujeme použít konektor, který se připojuje k datům. Tímto způsobem se k datům přistupuje přímo v čase jejich zpracování. Pokud použijete konektor, který kopíruje data, při aktualizaci dat může dojít ke zpoždění.
K vašim datům se připojují následující konektory dat:
- Tabulky Azure Data Lake Storage Delta
- Tabulky Azure Data Lake Storage Common Data Model
- Microsoft Dataverse
- Azure Synapse Analytics(Preview)
Pokud nemůžete použít konektor, který se připojí k datům, zkopírujte data pomocí jednoho z konektorů Power Query. Power Query poskytuje užitečný způsob transformace dat.
Profilování dat
Při ingestování dat provádí Customer Insights – Data některé základní profilace dat. Například profiluje frekvenci opakovaných hodnot ve sloupci. Údaje z profilu můžete použít k pochopení svých údajů a řešení problémů. Pokud například hledáte shodu podle sloupce FullName
, profilace dat vám může pomoci zjistit, že se na 10 000 řádcích zobrazuje výchozí hodnota Zadejte své jméno. Proto pokud párujete podle této hodnoty, 10 000 řádků, které by neměly být spárovány, jsou spárovány. Když přidáte datové jezero Azure, tabulky Delta nebo zdroje dat Azure Synapse, můžete povolit profilaci dat pro více sloupců.
Po ingestaci dat si můžete prohlédnout výsledky profilace dat.
Přejděte na Data>Tabulky a vyberte tabulku. Potom v řádku pole (například
DateOfBirth
ve sloupci Souhrn) vyberte ikonu Souhrn.Zkontrolujte chyby nebo chybějící hodnoty.
Stránka Zdroje dat
Stránka Zdroje dat uvádí zdroje dat ve dvou částech:
- Spravováno mnou: Datové toky Microsoft Power Platform, které jste vytvořili a spravujete. Ostatní uživatelé můžou tyto toky dat jenom zobrazit. Nemohou je upravit, aktualizovat nebo odstranit.
- Spravováno ostatními: Toky dat Microsoft Power Platform vytvořené ostatními správci. Můžete zobrazit pouze tyto datové toky. V této části se zobrazuje vlastník každého toku dat, abyste ho mohli kontaktovat, pokud potřebujete pomoc.
Poznámka:
Ostatní uživatelé mohou prohlížet a používat všechny tabulky. I když je každý zdroj dat vlastněn uživatelem, který jej vytvořil, každý uživatel Customer Insights - Data může používat všechny tabulky, které jsou výsledkem příjmu dat.