Udostępnij za pośrednictwem


Synchronizowanie źródła danych programu Excel z usługą Dataverse przy użyciu przepływu danych

Jednym z typowych scenariuszy, które występują podczas integrowania danych z usługą Dataverse, jest zachowanie synchronizacji ze źródłem. Przy użyciu standardowego przepływu danych można załadować dane do usługi Dataverse. W tym artykule wyjaśniono, jak można zachować synchronizację danych z systemem źródłowym.

Znaczenie kolumny klucza

Jeśli używasz systemu relacyjnego bazy danych jako źródła, zwykle masz kluczowe kolumny w tabelach, a dane są w odpowiednim formacie, które mają zostać załadowane do usługi Dataverse. Jednak dane z plików programu Excel nie zawsze są tak czyste. Często masz plik programu Excel z arkuszami danych bez konieczności posiadania żadnej kolumny klucza. W obszarze Zagadnienia dotyczące mapowania pól dla standardowych przepływów danych można zobaczyć, że jeśli w źródle znajduje się kolumna klucza, można ją łatwo użyć jako klucza alternatywnego w mapowaniu pola przepływu danych.

Konfiguracja klucza alternatywnego.

Posiadanie kolumny klucza jest ważne dla tabeli w usłudze Dataverse. Kolumna klucza jest identyfikatorem wiersza; ta kolumna zawiera unikatowe wartości w każdym wierszu. Posiadanie kolumny klucza pomaga uniknąć zduplikowanych wierszy, a także ułatwia synchronizowanie danych z systemem źródłowym. Jeśli wiersz zostanie usunięty z systemu źródłowego, przydatne jest znalezienie go i usunięcie go również z usługi Dataverse.

Tworzenie kolumny klucza

Jeśli nie masz kolumny klucza w źródle danych (excel, plik tekstowy lub inne źródła), możesz wygenerować kolumnę przy użyciu następującej metody:

  1. Czyszczenie danych.

    Pierwszym krokiem do utworzenia kolumny klucza jest usunięcie wszystkich niepotrzebnych wierszy, wyczyszczenie danych, usunięcie pustych wierszy i usunięcie wszelkich możliwych duplikatów.

    czyszczenie danych.

  2. Dodaj kolumnę indeksu.

    Po wyczyszczeniu danych następnym krokiem jest przypisanie do niej kolumny klucza. W tym celu możesz użyć opcji Dodaj kolumnę indeksu na karcie Dodaj kolumnę .

    Dodaj kolumnę indeksu.

Podczas dodawania kolumny indeksu masz kilka opcji dostosowywania, na przykład dostosowania numeru początkowego lub liczby wartości do przeskoczenia za każdym razem. Domyślna wartość początkowa to zero i zwiększa jedną wartość za każdym razem.

Użyj kolumny klucza jako klucza alternatywnego

Teraz, gdy masz kolumny kluczy, możesz przypisać mapowanie pól przepływu danych do klucza alternatywnego.

Ustawianie pól Alternatywny klucz.

Ustawienie jest proste. Wystarczy ustawić klucz alternatywny. Jeśli jednak masz wiele plików lub tabel, należy wziąć pod uwagę jeden inny krok.

Jeśli masz wiele plików

Jeśli masz tylko jeden plik programu Excel (lub arkusz lub tabelę), kroki opisane w poprzedniej procedurze są wystarczające, aby ustawić klucz alternatywny. Jeśli jednak masz wiele plików (lub arkuszy lub tabel) o tej samej strukturze (ale z różnymi danymi), dołącz je razem.

Jeśli otrzymujesz dane z wielu plików programu Excel, opcja Połącz pliki dodatku Power Query automatycznie dołączy wszystkie dane razem, a dane wyjściowe będą wyglądać podobnie jak na poniższej ilustracji.

Obraz przedstawiający wiele plików, które zostały dołączone razem.

Jak pokazano na powyższym obrazie, oprócz wyniku dołączania dodatek Power Query zawiera również kolumnę Source.Name zawierającą nazwę pliku. Wartość Indeks w każdym pliku może być unikatowa, ale nie jest unikatowa w wielu plikach. Jednak kombinacja kolumny Index i kolumny Source.Name jest unikatową kombinacją. Wybierz złożony klucz alternatywny dla tego scenariusza.

klucz złożony.

Usuwanie wierszy, które już nie istnieją w danych wyjściowych zapytania

Ostatnim krokiem jest wybranie pozycji Usuń wiersze, które już nie istnieją w danych wyjściowych zapytania. Ta opcja porównuje dane w tabeli Dataverse z danymi pochodzącymi ze źródła na podstawie klucza alternatywnego (co może być kluczem złożonym) i usuwa wiersze, które już nie istnieją. W związku z tym dane w usłudze Dataverse będą zawsze synchronizowane ze źródłem danych.

usuwanie wierszy już nie istnieje.