Поделиться через


Обзор источников данных

Чтобы настроить Dynamics 365 Customer Insights - Data, сначала добавьте исходные данные для обработки. Customer Insights - Data предоставляет несколько типов соединителей данных для подключения и приема данных из широкого набора источников.

В этой статье описаны параметры, которые могут повлиять на производительность приема данных.

Формат Delta

Формат данных Delta — это собственный формат обработки, используемый Customer Insights - Data. Если вы можете предоставить исходные данные в формате Delta, это имеет множество преимуществ.

  • Повышенная эффективность с Customer Insights - Data: формат Delta используется внутри Customer Insights - Data.
  • Более быстрый прием данных: формат Delta обеспечивает превосходное сжатие для более быстрой передачи данных.
  • Более быстрое объединение: благодаря функции перемещения во времени Delta Customer Insights - Data объединяет только те данные, которые были изменены. Весь набор данных не обрабатывается повторно. Для инкрементной унификации все входные данные для унификации должны быть в формате Delta.
  • Меньше проблем с повреждением данных: формат Delta уменьшает количество поврежденных разделов и распространенных проблем с повреждением данных, вызванных старыми форматами, такими как формат с разделителями-запятыми (CSV).
  • Более надежная конструкция управления данными: формат Delta не требует ручного обновления файлов манифестов, схем и разделов.
  • Более высокая достоверность данных: формат Delta обеспечивает атомарность, согласованность, изоляцию, надежность (ACID) транзакций и уровни изоляции в Spark.

Формат Delta можно использовать в следующих соединителях:

Delta — это термин, введенный с Delta Lake, основой для хранения данных и таблиц на платформе Databricks Lakehouse. Delta Lake — это слой хранения с открытым исходным кодом, который обеспечивает транзакции ACID (атомарность, согласованность, изоляция и надежность) для рабочих нагрузок больших данных. Дополнительные сведения см. на странице документации по Delta Lake.

Вложение или импорт источника данных

Ключевым моментом при выборе способа приема данных является то, присоединяется ли соединитель к данным или создает их копии. При использовании Customer Insights - Data рекомендуется использовать соединитель, который присоединяется к данным. В этом случае доступ к данным осуществляется напрямую, когда приходит время их обработки. При использовании соединителя, который копирует данные, при обновлении данных могут возникать задержки.

Следующие соединители данных подключаются к вашим данным:

Если вы не можете использовать соединитель, который подсоединяется к вашим данным, скопируйте данные с помощью одного из соединителей Power Query. Power Query предоставляет полезный способ преобразования данных.

Профилирование данных

При приеме данных Customer Insights — Data выполняет базовое профилирование данных. Например, он профилирует частоту повторяющихся значений в столбце. Вы можете использовать данные профиля, чтобы понять свои данные и решить проблемы. Например, если вы сопоставляете столбец FullName, профиль данных может помочь вам обнаружить, что значение по умолчанию Введите свое имя появляется в 10 000 строк. Таким образом, при сопоставлении по этому значению будут сопоставлены 10 000 строк, которые не должны быть сопоставлены. При добавлении Azure Data Lake, таблиц Delta или источников данных Azure Synapse вы можете включить профилирование данных для большего количества столбцов.

После приема данных просмотрите результаты профилирования данных.

  1. Перейдите в раздел Данные>Таблицы и выберите таблицу. Затем в строке для поля (например) DateOfBirth в столбце Сводка выберите значок Сводка.

    Снимок экрана вкладки

  2. Проверьте сведения на наличие ошибок или пропущенных значений.

    Снимок экрана, на котором показана сводка по полю DateOfBirth, включая диаграмму с максимальными значениями по количеству.

Страница «Источники данных»

На странице Источники данных перечисляются источники данных в двух разделах:

  • Управляется мной: потоки данных Microsoft Power Platform, которые создаются и управляются вами. Другие пользователи могут только просматривать эти потоки данных. Они не могут редактировать, обновлять или удалять их.
  • Управляется другими: потоки данных Microsoft Power Platform, созданные другими администраторами. Вы можете только просматривать эти потоки данных. В этом разделе указан владелец каждого потока данных, чтобы вы могли связаться с ним в случае необходимости.

Заметка

Другие пользователи могут просматривать и использовать все таблицы. Хотя каждый источник данных принадлежит пользователю, который его создал, каждый пользователь Customer Insights - Data может использовать все таблицы, полученные в результате приема данных.

Снимок экрана страницы источников данных.

Следующие шаги