Dołączanie domeny lub domeny złożonej do danych referencyjnych — Data Quality Services (DQS)
Dotyczy:programu SQL Server
W tym temacie opisano sposób dołączania domen/domen złożonych w bazie wiedzy dotyczącej jakości danych do usługi danych referencyjnych w witrynie Azure Marketplace w celu zbudowania wiedzy na temat danych referencyjnych wysokiej jakości. Każda usługa danych referencyjnych zawiera schemat (kolumny danych). Po dołączeniu domeny lub domeny złożonej do usługi danych referencyjnych należy zamapować dołączoną domenę lub poszczególne domeny w dołączonej domenie złożonej do odpowiednich kolumn w schemacie usługi danych referencyjnych. Dołączanie domeny złożonej do usługi danych referencyjnych umożliwia dołączenie tylko jednej domeny do usługi danych referencyjnych, a następnie mapowanie poszczególnych domen w domenie złożonej na odpowiednie kolumny w schemacie usługi danych referencyjnych.
Ważny
W tym artykule omówiono usługi danych referencyjnych innych firm, które były wcześniej dostępne w witrynie Azure DataMarket. Usługi DataMarket i Data Services — w tym dane adresowe Melissa, na przykład — zostały wycofane po 12.31.2016 r. W związku z tym nie można już uruchamiać przykładów w tym artykule z określonymi usługami z DataMarket. Nadal możesz używać usług danych referencyjnych, które są dostępne bezpośrednio w trybie online od dostawców danych referencyjnych innych firm.
Ostrzeżenie
Domena złożona dołączona do usługi danych referencyjnych jest dostępna na liście rozwijanej domen podczas mapowania domen na kolumny w schemacie usługi danych referencyjnych. Nie mapuj domeny złożonej na kolumnę w schemacie usługi danych referencyjnych; należy mapować tylko poszczególne domeny w domenie złożonej na odpowiednie kolumny w schemacie usługi danych referencyjnych. W przeciwnym razie spowoduje to wystąpienie błędu.
Schemat usługi danych referencyjnych może zawierać obowiązkową kolumnę, która musi być mapowana z odpowiednią domeną, jeśli chcesz użyć usługi danych referencyjnych. Obowiązkowa kolumna w schemacie danych referencyjnych jest oznaczona przy nazwie kolumny "(M)". Na przykład AddressLine jest obowiązkową kolumną schematu w Melissa Data – dane adresowe, a CompanyName jest obowiązkową kolumną schematu w Digital Trowel Inc. – firmy i profesjonalne dane dla użytkowników SQL.
W tym temacie utworzymy cztery domeny: Linia Adresowa, Miasto, Województwoi Kod Pocztowy, w ramach domeny złożonej Weryfikacja Adresu, dołączymy domenę złożoną do Melissa Data – Sprawdzanie Adresów w usłudze danych referencyjnych, a następnie zmapujemy poszczególne domeny w domenie złożonej na odpowiednie kolumny w schemacie usługi danych referencyjnych.
Przed rozpoczęciem
Warunki wstępne
Aby korzystać z usług danych referencyjnych, musisz skonfigurować usługi Data Quality Services (DQS). Zobacz Skonfiguruj DQS do używania danych referencyjnych.
Bezpieczeństwo
Uprawnienia
Aby mapować domeny na dane referencyjne, musisz mieć rolę dqs_kb_editor w bazie danych DQS_MAIN.
Mapuj domeny do danych referencyjnych z Melissa Data
Uruchom klienta jakości danych. Aby uzyskać informacje o tym, zobacz Uruchom aplikację kliencką Data Quality.
Na ekranie głównym Klienta jakości danych, w sekcji Zarządzanie bazą wiedzy , kliknij pozycję Nowa baza wiedzy.
Na ekranie Nowa baza wiedzy, wpisz nazwę nowej bazy wiedzy, kliknij aktywność Zarządzanie domeną, a następnie kliknij pozycję Utwórz.
Na ekranie zarządzania domenami kliknij ikonę Utwórz domenę, aby utworzyć domenę. Utwórz następujące cztery domeny: Wiersz adresu, Miasto, Stani Kod pocztowy.
Kliknij ikonę Utwórz domenę złożoną, aby utworzyć domenę złożoną. W oknie dialogowym Tworzenie domeny złożonej wpisz Address Verification do pola Nazwa domeny złożonej i uwzględnij wszystkie domeny utworzone w kroku 3 w domenie złożonej. Kliknij przycisk OK.
W okienku domena po lewej stronie wybierz domenę złożoną, klikając weryfikacji adresu, a następnie kliknij kartę Dane referencyjne po prawej stronie.
Kliknij ikonę Przeglądaj.
W oknie dialogowym Katalog dostawców danych referencyjnych online :
W obszarze DataMarket Data Quality Serviceswybierz pole wyboru Melissa Data - Address Check.
Mapuj kolumny usługi Melissa Data — sprawdzanie adresów referencyjnych z odpowiednimi domenami (Kolumna adresu, Miasto, Stan i kod pocztowy). Kolumny są mapowane, wybierając kolumnę usługi danych referencyjnych w kolumnie schematu usług pulpitu zdalnego, a następnie wybierając odpowiednią domenę w kolumnie domena. Aby dodać więcej wierszy w tabeli, kliknij ikonę Dodaj wpis schematu.
Kliknij OK, aby zapisać zmiany, a następnie zamknij okno dialogowe Katalog dostawców danych referencyjnych online.
Notatka
- W oknie dialogowym katalogu dostawców danych referencyjnych online DataMarket Data Quality Services węzła wyświetla wszystkich dostawców usług danych referencyjnych, do których subskrybujesz w witrynie Azure Marketplace. Jeśli skonfigurowano bezpośrednich dostawców usług danych referencyjnych innych firm online w DQS, będą one wyświetlane w innym węźle o nazwie 3rd Party Direct Online Providers (niedostępne obecnie, ponieważ żaden bezpośredni dostawcy danych referencyjnych innych firm online nie są skonfigurowani w DQS).
Nastąpi powrót do karty danych referencyjnych. W obszarze ustawień dostawcy zmień wartości w następujących polach, jeśli to konieczne:
próg automatycznej korekty: korekty z usługi danych referencyjnych z poziomem ufności powyżej tych wartości progowych zostaną automatycznie wykonane. Wprowadź wartość w notacji dziesiętnej odpowiadającej wartości procentowej. Na przykład wprowadź wartość 0.9 dla 90%.
Sugerowani kandydaci: liczba sugerowanych kandydatów do wyświetlenia z usługi danych referencyjnych.
minimalna pewność: sugestie z usługi danych referencyjnych o poziomie ufności niższym niż ta wartość zostaną zignorowane. Wprowadź wartość w notacji dziesiętnej odpowiadającej wartości procentowej. Na przykład wprowadź wartość 0.6 dla 60%.
Kliknij pozycję Zakończ, aby opublikować bazę wiedzy. Po pomyślnym opublikowaniu bazy wiedzy zostanie wyświetlony komunikat potwierdzający.
Teraz możesz użyć tej bazy wiedzy w projekcie jakości danych, aby standaryzować i oczyszczać adresy w USA w danych źródłowych na podstawie wiedzy dostarczonej przez usługę Melissa Data za pośrednictwem witryny Azure Marketplace.
Następne kroki: Po mapowaniu domeny na dane referencyjne
Utwórz projekt jakości danych i uruchom działanie czyszczenia danych źródłowych zawierających adresy USA, porównując je z bazą wiedzy utworzoną w tym temacie. Zobacz Oczyszczanie Danych za Pomocą Danych Referencyjnych (Zewnętrznych)Wiedza.