Opcje żądania Profil wzorca kolumn (dane Profilowanie zadań)
Użycie Żądaj właściwości Okienko Żądania profilu strona, aby ustawić opcje dla Wzorzec kolumna żądania profilu wybranego w okienku żądania.Profil wzorca kolumn raportów zestaw wyrażeń regularnych, obejmujące określonej wartości procentowej wartości kolumna ciąg znaków.Ten profil może pomóc w identyfikacji problemów danych, takich jak nieprawidłowe ciągi i może sugerować wyrażeń regularnych, które mogą być używane w przyszłości do sprawdzania poprawności nowych wartości.Na przykład, profil deseń kolumna z kody ZIP Stanów Zjednoczonych może dawać \d{5}-\d{4 wyrażeń regularnych}, \d{5}, a \d{9}.Jeśli widzisz innych wyrażeń regularnych, prawdopodobnie dane zawierają wartości, które są nieprawidłowe lub niepoprawny format.
Uwaga
Opcje opisane w tym temacie są wyświetlane na Profil żądań strona of the Edytor zadań profilowania danych.Aby uzyskać więcej informacji na temat tej strona edytora zobacz Dane Profilowanie Edytor zadań (strona profil żądań).
Aby uzyskać więcej informacji na temat korzystania z danych Profilowanie zadania Zobacz Konfigurowanie danych Profilowanie zadań. Aby uzyskać więcej informacji dotyczących sposobów korzystania z Przeglądarka profilu danych do analizowania danych wyjściowych danych Profilowanie zadania Zobacz Wyświetlanie profil wyjściowy w oknie Przeglądarka profilu danych.
Opis stosowania ograniczniki i symbole
Przed przetwarzania desenie dla Wzorzec kolumna żądania profilu, zadanie Profilowanie danych tokenizes danych.To znaczy zadania oddziela wartości ciąg na mniejsze jednostki nazywane tokenów.Zadanie oddziela ciągi znaków do tokenów w oparciu o ograniczników i symbole, których można określić dla Ograniczniki and Symbole właściwości:
Ograniczniki Domyślnie na liście ograniczników zawiera następujące znaki: miejsce, kartę poziomy (\t), nowego wiersza (\n) i przewozu zwracać (\r). Można określić dodatkowe ograniczniki, ale nie można usunąć ograniczniki domyślne.
Symbole Domyślnie na liście Symbole zawiera następujące znaki: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.For example, if the symbols are "()-", the value "(425) 123-4567" is tokenized as ["(", "425", ")", "123", "-", "4567", ")"].
Znak nie może być zarówno ogranicznik i symbol.
Wszystkie ograniczniki są znormalizowane do pojedynczą spacją jako część procesu tokenizing, podczas gdy symbole są zachowywane.
Opis użycia tabela tagów
Opcjonalnie można grupować tokeny powiązane z jednym znacznikiem dzięki przechowywaniu w specjalnej tabela, utworzonego przy użyciu tagów i odpowiednich warunków SQL Server Baza danych. Tabela tag musi zawierać dwie kolumny ciąg znaków, o nazwie "etykieta", a druga o nazwie "" termin ".Kolumny te mogą być typu char, nchar, varchar, lub nvarchar, ale nie text lub ntext. Można łączyć wiele tagów i odpowiednich warunków w jednej tabela.Deseń kolumna żądania profilu można użyć tylko jedną tabela tagu.Można użyć oddzielne ADO.NET Menedżer połączeń, aby połączyć się z tagu tabela. Dlatego tagu tabela może być umieszczone w innej bazie danych lub na innym serwerze niż urządzenie źródłowe danych.
Na przykład można grupowania wartości „ Wschód","Zachód.","Północ"i"Południe", może się pojawić adresy ulic za pomocą pojedynczego tagu"Kierunek".W poniższej tabela przedstawiono przykładowy tabela tagu.
Tag |
Termin |
---|---|
Kierunek |
Wschód |
Kierunek |
Zachód |
Kierunek |
Północna |
Kierunek |
Południowa |
Inny znacznik, można użyć do grupowania różnych wyrazy, które wyrażają pojęcie "domowy" w adresach ulicy:
Tag |
Termin |
---|---|
Ulica |
Ulica |
Ulica |
Ścieżek |
Ulica |
Umieść |
Ulica |
Sposób |
W oparciu o tę kombinację tagów, wynikowy wzorzec dla adres zamieszkania może wyglądać jest następujący wzór:
\d+\ LookupTag=Direction \d+\p{L}+\ LookupTag=Street
Uwaga
Przy użyciu tabela tag zmniejsza wydajność Profilowanie dane zadanie.Nie należy używać więcej niż 10 tagów lub więcej niż 100 terminów na tagu.
Termin ten sam może należeć do więcej niż jeden tag.
Opcje właściwości żądania
Aby Wzorzec kolumna żądania profilu, the Żądaj właściwości okienku wyświetlane są następujące grupy opcji:
Dane, która obejmuje TableOrView and kolumna opcji
Ogólne
Opcje
Opcje danych
ConnectionManager
Wybierz istniejące ADO.NET Menedżer połączeń, który używa dostawca danych .NET dla SQL Server Klient (SQL) do łączenia się z SQL Server Baza danych zawierająca tabela lub widok, aby być profiled.TableOrView
Wybierz istniejącą tabela lub widok zawierający kolumna, aby być profiled.Aby uzyskać więcej informacji zobacz sekcję "Opcje TableorView" w tym temacie.
Kolumna
Wybierz istniejącą kolumna można profiled.Wybierz opcję (*) profile wszystkich kolumn.Aby uzyskać więcej informacji zobacz sekcję kolumna "Opcje," w tym temacie.
Opcje TableOrView
Schemat
Określa schemat, do której należy dany wybranej tabela.Ta opcja jest tylko do odczytu.Table
Wyświetla nazwę wybranej tabela.Ta opcja jest tylko do odczytu.
Opcje kolumn
IsWildCard
Określa, czy (*) symbol wieloznaczny został wybrany.Ta opcja jest ustawiona na Wartość true w przypadku wybrania (*) profile wszystkich kolumn.Jest on Fałszywe po wybraniu pojedynczej kolumna do się profiled.Ta opcja jest tylko do odczytu.Element ColumnName
Wyświetla nazwę zaznaczonej kolumna.Ta opcja jest puste, jeśli została wybrana (*) profile wszystkich kolumn.Ta opcja jest tylko do odczytu.StringCompareOptions
Ta opcja nie ma zastosowania do Profil wzorca kolumn.
Opcje ogólne
- IdentyfikatorŻądania
Wpisz opisową nazwę identyfikującą to żądanie profilu.Zazwyczaj nie trzeba zmieniać wartości wygenerowany automatycznie.
Opcje
MaxNumberOfPatterns
Określanie maksymalnej liczby wzorców, który ma profil do obliczenia.Wartością domyślną tej opcji jest 10.Maksymalna wartość wynosi 100.PercentageDataCoverageDesired
Umożliwia określenie procentu dane, które mają być obliczane desenie na pokrycie.Wartością domyślną tej opcji jest 95 (procent).CaseSensitive
Wskazuje, czy desenie powinna być uwzględniana wielkość liter.Wartością domyślną tej opcji jest Fałszywe.Ograniczniki
Listę znaków, które powinny być traktowane jako odpowiednik spacje między wyrazami podczas tokenizing tekstu.Domyślnie, wykaz Ograniczniki zawiera następujące znaki: miejsca, kartę poziomy (\t), nowego wiersza (\n) i przewozu zwracają (\r). Można określić dodatkowe ograniczniki, ale nie można usunąć ograniczniki domyślne.Aby uzyskać więcej informacji zobacz „ opis korzystanie z ograniczniki i symboli „ we wcześniejszej części tego tematu.
Symbole
Na liście symboli, które powinny być przechowywane jako część wzorców.Przykładem może być "/"dla dat,": „ dla godzin a "@" adresów e-mail.Domyślnie, wykaz Symbole zawiera następujące znaki: ,.;:-"'`~=&/\@!?()<>[]{}|#*^%.Aby uzyskać więcej informacji zobacz „ opis korzystanie z ograniczniki i symboli „ we wcześniejszej części tego tematu.
TagTableConnectionManager
Wybierz istniejące ADO.NET Menedżer połączeń, który używa dostawca danych .NET dla SQL Server Klient (SQL) do łączenia się z SQL Server Baza danych zawierająca tabela tagu.Aby uzyskać więcej informacji zobacz "Opis korzystanie z tag tabela" we wcześniejszej części tego tematu.
TagTableName
Wybierz istniejącą tabela tag musi mieć dwie kolumny ciąg o nazwie znacznika i termin.Aby uzyskać więcej informacji zobacz "Opis korzystanie z tag tabela" we wcześniejszej części tego tematu.