Sprzęganie danych
W tym artykule opisano sposób użycia składnika Join Data w projektancie usługi Azure Machine Learning do scalania dwóch zestawów danych przy użyciu operacji sprzężenia w stylu bazy danych.
Jak skonfigurować dane dołączania
Aby wykonać sprzężenie na dwóch zestawach danych, powinny być powiązane z kolumną klucza. Obsługiwane są również klucze złożone korzystające z wielu kolumn.
Dodaj zestawy danych, które chcesz połączyć, a następnie przeciągnij składnik Join Data do potoku.
Składnik można znaleźć w kategorii Przekształcanie danych w obszarze Manipulowanie.
Połącz zestawy danych ze składnikiem Join Data ( Dołącz dane ).
Wybierz pozycję Uruchom selektor kolumn, aby wybrać kolumny kluczy. Pamiętaj, aby wybrać kolumny zarówno dla danych wejściowych po lewej, jak i prawej stronie.
Dla pojedynczego klucza:
Wybierz jedną kolumnę klucza dla obu danych wejściowych.
W przypadku klucza złożonego:
Zaznacz wszystkie kolumny kluczy z lewego wejścia i prawego wejścia w tej samej kolejności. Składnik Join Data (Łączenie danych ) połączy tabele, gdy wszystkie kolumny kluczy są zgodne. Zaznacz opcję Zezwalaj na duplikaty i zachowaj kolejność kolumn w zaznaczeniu , jeśli kolejność kolumn nie jest taka sama jak oryginalna tabela.
Wybierz opcję Dopasuj wielkość liter, jeśli chcesz zachować ważność wielkości liter w sprzężeniu kolumny tekstowej.
Użyj listy rozwijanej Typ sprzężenia, aby określić sposób łączenia zestawów danych.
Sprzężenie wewnętrzne: sprzężenie wewnętrzne jest najczęstszą operacją sprzężenia. Zwraca on połączone wiersze tylko wtedy, gdy wartości kolumn kluczy są zgodne.
Lewe sprzężenie zewnętrzne: lewe sprzężenie zewnętrzne zwraca sprzężone wiersze dla wszystkich wierszy z lewej tabeli. Gdy wiersz w tabeli po lewej stronie nie zawiera pasujących wierszy w prawej tabeli, zwracany wiersz zawiera brakujące wartości dla wszystkich kolumn, które pochodzą z prawej tabeli. Można również określić wartość zastępczą dla brakujących wartości.
Pełne sprzężenie zewnętrzne: Pełne sprzężenie zewnętrzne zwraca wszystkie wiersze z lewej tabeli (tabela1) i z prawej tabeli (table2).
Dla każdego wiersza w każdej tabeli, które nie mają pasujących wierszy w drugiej, wynik zawiera wiersz zawierający brakujące wartości.
Lewe sprzężenie półsprzężenia: lewe sprzężenie zwraca tylko wartości z lewej tabeli, gdy wartości kolumn kluczy są zgodne.
Dla opcji Zachowaj odpowiednie kolumny kluczy w tabeli sprzężonej:
- Wybierz tę opcję, aby wyświetlić klucze z obu tabel wejściowych.
- Usuń zaznaczenie, aby zwrócić tylko kolumny kluczy z lewej strony danych wejściowych.
Prześlij potok.
Aby wyświetlić wyniki, kliknij prawym przyciskiem myszy pozycję Dołącz dane i wybierz polecenie Visualize (Wizualizacja).
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.