Tworzenie domeny złożonej
Dotyczy:programu SQL Server
W tym temacie opisano sposób tworzenia domeny złożonej w bazie wiedzy w usługach Data Quality Services (DQS). Domena złożona składa się z co najmniej jednej domeny, która ma zastosowanie do jednego pola danych. Aby uzyskać więcej informacji na temat domen złożonych, zobacz Zarządzanie domeną złożoną.
Istnieją dwa sposoby tworzenia nowej domeny złożonej. Pierwszy to krok Mapy działania odnajdywania wiedzy, gdy jesteś w trakcie analizowania przykładu danych, aby dodać wiedzę do nowej lub istniejącej bazy wiedzy. Drugi jest podczas działania zarządzania domeną, gdy zamiast zmieniać istniejącą domenę, należy utworzyć nową. Aby utworzyć domenę złożoną, musisz już utworzyć co najmniej dwie pojedyncze domeny, aby dodać je do domeny złożonej. Tylko te pojedyncze domeny, które zostały już utworzone i które nie zostały dodane do istniejącej domeny złożonej, są dostępne podczas tworzenia nowej domeny złożonej. Nie można dodać jednej domeny do więcej niż jednej domeny złożonej i nie można dodać domeny złożonej do innej domeny złożonej.
Po utworzeniu domeny złożonej można zmienić właściwości domeny złożonej, dołączyć usługę danych referencyjnych do domeny, utworzyć reguły między domenami lub utworzyć relacje wartości. Aby to zrobić, wybierz domenę złożoną na liście Domena na stronie Zarządzanie Domenami, a następnie wybierz odpowiednią kartę.
Przed rozpoczęciem
Warunki wstępne
Aby utworzyć domenę złożoną, musisz utworzyć i otworzyć bazę wiedzy. Musisz utworzyć co najmniej dwie pojedyncze domeny, aby dodać ją do domeny złożonej.
Bezpieczeństwo
Uprawnienia
Aby utworzyć domenę złożoną, musisz mieć rolę dqs_kb_editor lub dqs_administrator w bazie danych DQS_MAIN.
Tworzenie domeny złożonej w działaniu odnajdywania wiedzy
Uruchom klienta jakości danych. Aby uzyskać informacje na ten temat, zobacz Informacje o uruchamianiu aplikacji klienckiej ds. jakości danych.
Na ekranie głównym Klienta jakości danych kliknij Otwórz bazę wiedzy, a następnie wybierz bazę wiedzy lub kliknij Nowa baza wiedzy i wprowadź właściwości nowej bazy wiedzy.
Wybierz Odkrywanie wiedzy jako działanie, a następnie kliknij Utwórz, aby utworzyć nową bazę wiedzy lub Otwórz, aby otworzyć istniejącą bazę wiedzy.
Na stronie Mapa określ połączenie ze źródłem danych. Aby uzyskać więcej informacji, zobacz Perform Knowledge Discovery.
W tabeli Mapowania wybierz kolumnę źródłową z listy rozwijanej dla kolumny kolumny źródłowej pustego wiersza. Upewnij się, że kolumna źródłowa zawiera domenę złożoną adresowaną przez dwie istniejące pojedyncze domeny. Jeśli nie ma odpowiednich pojedynczych domen, kliknij ikonę Utwórz domenę.
W tabeli Mapowania wybierz kolumnę źródłową z listy rozwijanej dla kolumny kolumny źródłowej pustego wiersza. Upewnij się, że kolumna źródłowa zawiera części złożone domeny, które są powiązane z dwoma istniejącymi pojedynczymi domenami. Jeśli nie istnieją żadne odpowiadające im domeny, kliknij ikonę Utwórz domenę, aby je utworzyć. Aby uzyskać więcej informacji, zobacz Create a Domain.
Kliknij ikonę Utwórz złożoną domenę.
Tworzenie domeny złożonej w działaniu zarządzania domenami
Na stronie głównej klienta usług Data Quality Services kliknij Otwórz bazę wiedzy, a następnie wybierz bazę wiedzy lub kliknij Nowa baza wiedzy i wprowadź właściwości nowej bazy wiedzy.
Wybierz zarządzanie domenami jako działanie, a następnie kliknij Utwórz, aby utworzyć nową bazę wiedzy lub Otwórz, aby otworzyć istniejącą bazę wiedzy.
Upewnij się, że istnieją co najmniej dwie pojedyncze domeny wymagane przez domenę złożoną. Jeśli nie, kliknij ikonę Utwórz domenę i utwórz je. Aby uzyskać więcej informacji, zobacz Create a Domain.
Na stronie Domain Management kliknij ikonę Utwórz domenę złożoną nad listą domen.
Wprowadź nazwę unikatową dla bazy wiedzy i opis do 256 znaków.
Na liście domen wybierz domeny, które będą częścią domeny złożonej, a następnie kliknij strzałkę w prawo, aby przenieść je do domeny w tabeli domen złożonych.
Kliknij przycisk OK.
Ustawianie właściwości domeny złożonej
W oknie dialogowym Tworzenie domeny złożonej wprowadź nazwę unikatową dla bazy wiedzy i opis do 256 znaków.
Na liście domen wybierz domeny, które będą częścią domeny złożonej, a następnie kliknij strzałkę w prawo, aby przenieść je do domeny w tabeli domen złożonych. Jest to lista pojedynczych domen, które są dostępne do dodania do tworzonej domeny złożonej. Dostępne są tylko te pojedyncze domeny, które zostały już utworzone i które nie zostały dodane do istniejącej domeny złożonej. Nie można dodać jednej domeny do więcej niż jednej domeny złożonej w bazie wiedzy i nie można dodać domeny złożonej do innej domeny złożonej.
Kliknij pozycję Zaawansowane.
Wybierz jedną z następujących opcji dla metody analizowania :
dane referencyjne: przeanalizuj wartości pola zgodnie z formatem danych referencyjnych (RDS). Usługi Data Quality Services będą wysyłać wartości w domenie złożonej do RDS, a RDS zwraca dane poprawione i przeanalizowane zgodnie z domeną złożoną.
W kolejności: przeanalizuj wartości pola zgodnie z kolejnością domen w domenie złożonej. Pierwsza wartość zostanie uwzględniona w pierwszej domenie, druga wartość w drugiej domenie itd.
Ograniczniki: Przeanalizuj wartości pola na podstawie ogranicznika wybranego z przycisków radiowych wyświetlanych po wybraniu Ograniczniki. Może to być Tab, średnik, przecinek, spacjalub inne. Jeśli inne, wprowadź wartość, która będzie służyć jako ogranicznik.
Jeśli wybrano ograniczniki jako metodę analizowania, możesz również wybrać użycie analizy opartej na wiedzy. Aby uzyskać więcej informacji, zobacz Knowledge-Based Analizowanie.
Kliknij przycisk Zakończ, aby ukończyć działanie zarządzania domeną zgodnie z opisem w Zakończ działanie zarządzania domeną.
Kontynuacja: po utworzeniu domeny złożonej
Po utworzeniu domeny złożonej można wykonywać inne zadania zarządzania domenami w domenie, można wykonać odnajdywanie wiedzy w celu dodania wiedzy do domeny lub dodać pasujące zasady do domeny. Aby uzyskać więcej informacji, zobacz Perform Knowledge Discovery, Managing a Domainlub Create a Matching Policy.
Knowledge-Based analizowanie
Funkcje Data Quality Services umożliwiają parsowanie danych na podstawie wiedzy, a nie tylko na znakach rozdzielających lub kolejności. Analizowanie oparte na wiedzy jest używane, gdy złożone dane źródłowe są mapowane na domenę złożoną i nie korzystasz z usług danych referencyjnych. Możesz użyć analizowania opartego na wiedzy, aby przetwarzać dane ze źródła danych na odpowiednie pojedyncze domeny. W przypadku przetwarzania opartego na wiedzy DQS najpierw spróbuje użyć wiedzy do przetwarzania złożonych danych na pojedyncze domeny. Jeśli to możliwe, zidentyfikuje części ciągu w jednej lub więcej domenach i przeanalizuje go, dzieląc na różne domeny. Załóżmy na przykład, że masz "John B. Doe" jako złożone wartości w polu pełnej nazwy reprezentowanym przez kompozytową domenę Pełna Nazwa. Jeśli DQS zidentyfikuje "John" tak jak w domenie First Name i "Doe", tak jak w domenie Last Name, DQS doda wartość "B". do domeny Nazwy środkowej na podstawie wiedzy o domenie.
Analizowanie oparte na wiedzy można użyć tylko wtedy, gdy wybierzesz również analizowanie oparte na ogranicznikach. Analizowanie oparte na wiedzy nie zastępuje analizowania ograniczników, ale zwiększa je. Tylko wtedy, gdy nie ma wiedzy, aby to zrobić, DQS użyje ogranicznika do analizy. W niektórych przypadkach DQS może określić niektóre analizowanie przez analizowanie oparte na wiedzy, a następnie określić inne analizowanie przez analizowanie oparte na ogranicznikach.
Analizowanie oparte na wiedzy może być używane, gdy domena złożona składa się z domen ciągów lub gdy domena złożona składa się z kombinacji różnych typów domen (int, data, godzina itp.). Jeśli źródło danych składa się z różnych typów danych, analizowanie powinno odbywać się najpierw dla typów danych innych niż ciągi, a następnie zgodnie z powyższym opisem na podstawie wiedzy o domenie dla pozostałych danych.
Jeśli korzystasz z analizy opartej na wiedzy i istnieje mniej wartości w danych źródłowych niż istnieją domeny w domenie złożonej, DQS umieści wartość null w brakującej domenie. Jeśli w danych źródłowych znajduje się więcej wartości niż w domenie złożonej, dQS doda dodatkowe dane do jednej z kolumn. Jeśli co najmniej dwie domeny zawierają te same wartości, źródło danych zostanie przeanalizowane do pierwszej dopasowanej domeny.