Udostępnij za pośrednictwem


Omówienie źródeł danych

W celu skonfigurowania Dynamics 365 Customer Insights - Data należy najpierw wprowadzić dane źródłowe do przetwarzania. Customer Insights - Data Dostarcza kilka typów łączników danych do łączenia się i bierania danych z szerokiego zestawu źródeł.

W tym artykule opisano opcje, które mogą wpłynąć na wydajność pozyskiwania danych.

Format Delta

Format Dane Wyformatuj jest macierzystym formatem przetwarzania używanym przez program Customer Insights — Data. Jeśli dane źródłowe można podać w formacie Delta, zalet jest wiele.

  • Lepsza wydajność: Customer Insights - Data Format Delta jest używany wewnętrznie przez Customer Insights - Data.
  • Szybsze przyspieszanie przetwarzania danych: dzięki formatowi do najwyższej klasy i szybszego przetwarzania danych.
  • Szybsze ujednolicanie: gdy jest używana funkcja Delta podróży w czasie, Customer Insights — dane ujednolica tylko te dane, które uległy zmianie. Nie przetwarza ponownie całego zestawu danych. W przypadku stopniowego łączenia wszystkie dane muszą mieć format Delta.
  • Mniej problemów z uszkodzeniem danych: Format różnicowy zmniejsza liczbę uszkodzonych partycji i typowych problemów z uszkodzeniem danych, które są spowodowane przez starsze formaty, takie jak format wartości rozdzielanych przecinkami (CSV).
  • Bardziej wiarygodne zarządzanie danymi: format plików nie wymaga ręcznych aktualizacji w celu pojawiania się plików, schematów i partycji.
  • Wyższa odpowiedzialność za dane: format Delta do przechowywania danych zapewnia spójność, spójność, izolacji, skalowalność i poziomy izolacji w Spark.

Możesz używać formatu Delta w następujących łącznikach:

Delta jest terminem wprowadzonym z Delta Lake, który jest podstawą do przechowywania danych i tabel na platformie Databricks Lakehouse Platform. Tym elementem jest warstwą przechowywania open-source, która zapewnia transakcje ACID (atomiczność, spójność, izolacja i trwałość) do dużych prac dotyczących danych. Aby uzyskać więcej informacji, zobacz Strona dokumentacji Delta Lake.

Załącznik źródła danych lub importowanie

Kluczowym czynnikiem podczas wybierania sposobu pozyskiwania danych jest to, czy łącznik dołącza do danych, czy tworzy kopie danych. W przypadku korzystania Customer Insights - Data z niego zalecamy użycie łącznika, który jest dołączany do danych. W ten sposób dane są bezpośrednio dostępne, gdy nadejdzie czas ich przetwarzania. Jeśli używasz łącznika, który kopiuje dane, mogą wystąpić opóźnienia podczas aktualizowania danych.

Do danych są dołączane następujące łączniki danych:

Jeśli nie możesz użyć łącznika, który dołącza się do danych, skopiuj dane przy użyciu jednego z Power Query łączników. Power Query stanowi użyteczny sposób przekształcania danych.

Profilowanie danych

Po pozyskaniu danych Customer Insights — dane wykonuje podstawowe profilowanie danych. Na przykład profiluje częstotliwość powtarzania wartości w kolumnie. Za pomocą danych profilowych można poznać dane i rozwiązać problemy. Jeśli na przykład użytkownik dopasował wartość do kolumny FullName, profil danych może pomóc w wykrywaniu, że domyślna wartość Wprowadź imię i nazwisko jest wyświetlana w wierszach 10 000. W związku z tym, jeśli dopasujesz tę wartość, zostanie dopasowanych 10 000 wierszy, które nie powinny być dopasowane. Podczas dodawania kolumn, tabel kolumn Azure Synapse i źródeł danych Azure możesz włączyć profilowanie danych dla większej liczby kolumn.

Po pozyskaniu danych możesz wyświetlić wyniki profilowania danych.

  1. Przejdź do Dane>Tabele i wybierz tabelę. Następnie w wierszu pola (na przykład DateOfBirth,) w kolumnie Podsumowanie wybierz Podsumowanie .

    Zrzut ekranu przedstawiający kartę Atrybuty na stronie tabeli Klient, na której wyróżniono ikonę Podsumowanie dla pola DataUrodzenia.

  2. Przejrzyj szczegóły pod kątem błędów lub brakujących wartości.

    Zrzut ekranu przedstawiający podsumowanie pola DateOfBirth, w tym wykres najważniejszych wartości według liczby.

Strona źródeł danych

Na stronie Źródła danych wymieniono źródła danych w dwóch sekcjach:

  • Zarządzane przeze mnie: utworzone przepływy danych Microsoft Power Platform i zarządzane tylko przez użytkownika. Inni użytkownicy mogą wyświetlać tylko te przepływy danych. Nie można ich edytować, odświeżyć ani usunąć.
  • Zarządzane przez innych: przepływy danych Microsoft Power Platform utworzone przez innych administratorów. Można tylko wyświetlać te przepływy danych. W tej sekcji jest wyświetlany właściciel każdego przepływu danych, dzięki czemu możesz się z nim skontaktować, jeśli potrzebujesz pomocy.

Uwaga

Inni użytkownicy mogą wyświetlać wszystkie tabele i używać ich. Mimo że każde źródło danych jest własnością użytkownika, który je utworzył, każdy użytkownik Customer Insights - Data może używać wszystkich tabel powstałych w wyniku pozyskiwania danych.

Zrzut ekranu strony Źródeł danych.

Następne kroki