Udostępnij za pośrednictwem


Sprzęganie danych

W tym artykule opisano sposób użycia składnika Join Data w projektancie usługi Azure Machine Learning do scalania dwóch zestawów danych przy użyciu operacji sprzężenia w stylu bazy danych.

Jak skonfigurować dane dołączania

Aby wykonać sprzężenie na dwóch zestawach danych, powinny być powiązane z kolumną klucza. Obsługiwane są również klucze złożone korzystające z wielu kolumn.

  1. Dodaj zestawy danych, które chcesz połączyć, a następnie przeciągnij składnik Join Data do potoku.

    Składnik można znaleźć w kategorii Przekształcanie danych w obszarze Manipulowanie.

  2. Połącz zestawy danych ze składnikiem Join Data ( Dołącz dane ).

  3. Wybierz pozycję Uruchom selektor kolumn, aby wybrać kolumny kluczy. Pamiętaj, aby wybrać kolumny zarówno dla danych wejściowych po lewej, jak i prawej stronie.

    Dla pojedynczego klucza:

    Wybierz jedną kolumnę klucza dla obu danych wejściowych.

    W przypadku klucza złożonego:

    Zaznacz wszystkie kolumny kluczy z lewego wejścia i prawego wejścia w tej samej kolejności. Składnik Join Data (Łączenie danych ) połączy tabele, gdy wszystkie kolumny kluczy są zgodne. Zaznacz opcję Zezwalaj na duplikaty i zachowaj kolejność kolumn w zaznaczeniu , jeśli kolejność kolumn nie jest taka sama jak oryginalna tabela.

    selektor kolumn

  4. Wybierz opcję Dopasuj wielkość liter, jeśli chcesz zachować ważność wielkości liter w sprzężeniu kolumny tekstowej.

  5. Użyj listy rozwijanej Typ sprzężenia, aby określić sposób łączenia zestawów danych.

    • Sprzężenie wewnętrzne: sprzężenie wewnętrzne jest najczęstszą operacją sprzężenia. Zwraca on połączone wiersze tylko wtedy, gdy wartości kolumn kluczy są zgodne.

    • Lewe sprzężenie zewnętrzne: lewe sprzężenie zewnętrzne zwraca sprzężone wiersze dla wszystkich wierszy z lewej tabeli. Gdy wiersz w tabeli po lewej stronie nie zawiera pasujących wierszy w prawej tabeli, zwracany wiersz zawiera brakujące wartości dla wszystkich kolumn, które pochodzą z prawej tabeli. Można również określić wartość zastępczą dla brakujących wartości.

    • Pełne sprzężenie zewnętrzne: Pełne sprzężenie zewnętrzne zwraca wszystkie wiersze z lewej tabeli (tabela1) i z prawej tabeli (table2).

      Dla każdego wiersza w każdej tabeli, które nie mają pasujących wierszy w drugiej, wynik zawiera wiersz zawierający brakujące wartości.

    • Lewe sprzężenie półsprzężenia: lewe sprzężenie zwraca tylko wartości z lewej tabeli, gdy wartości kolumn kluczy są zgodne.

  6. Dla opcji Zachowaj odpowiednie kolumny kluczy w tabeli sprzężonej:

    • Wybierz tę opcję, aby wyświetlić klucze z obu tabel wejściowych.
    • Usuń zaznaczenie, aby zwrócić tylko kolumny kluczy z lewej strony danych wejściowych.
  7. Prześlij potok.

  8. Aby wyświetlić wyniki, kliknij prawym przyciskiem myszy pozycję Dołącz dane i wybierz polecenie Visualize (Wizualizacja).

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.