Поделиться через


Параметры запроса профиля распределения значений в столбцах (задача «Профилирование данных»)

Для установки параметров запроса профиля распределения значений столбцов, выделенного на панели запросов, используется панель Свойства запроса страницы Запросы профиля. Профиль распределения значений столбцов описывает все различные значения в выделенном столбце и указывает выраженную в процентах долю строк таблицы, представляемых каждым значением. Этот профиль может также указывать значения, превышающие указанную процентную долю строк в таблице. Этот профиль поможет выявить проблемы в данных, например неверное число уникальных значений в столбце. Например, при профилировании столбца штатов США можно обнаружить более 50 различных значений.

ПримечаниеПримечание

В этом разделе описываются параметры, расположенные на странице Запросы профиля в редакторе задачи «Профилирование данных». Дополнительные сведения об этой странице редактора см. в разделе Редактор задачи «Профилирование данных» (страница «Запросы профиля»).

Дополнительные сведения об использовании задачи «Профилирование данных» см. в разделе Настройка задачи «Профилирование данных». Дополнительные сведения об использовании средства просмотра профиля данных для анализа результатов задачи «Профилирование данных» см. в разделе Просмотр выхода профиля в средстве просмотра профилей данных.

Параметры области «Свойства запроса»

Для варианта Запрос профиля распределения значений столбцов на панели Свойства запроса отображаются следующие группы параметров.

  • Данные, куда входят параметры TableOrView и Column

  • General

  • Options

Параметры данных

  • ConnectionManager
    Выберите существующий диспетчер соединений ADO.NET, использующий поставщик данных .NET для SQL Server (SqlClient) для подключения к базе данных SQL Server, которая содержит таблицу или представление для профилирования.

  • TableOrView
    Выберите существующую таблицу или представление, содержащие столбец для профилирования.

    Дополнительные сведения см. в подразделе «Параметры TableorView» данного раздела.

  • Column
    Выберите существующий столбец для профилирования. Выберите (*), чтобы выполнить профилирование всех столбцов.

    Дополнительные сведения см. в подразделе «Параметры столбца» данного раздела.

Параметры TableOrView

  • Schema
    Указывает схему, которой принадлежит выбранная таблица. Этот параметр доступен только для чтения.

  • Table
    Отображает имя выбранной таблицы. Этот параметр доступен только для чтения.

Параметры столбца

  • IsWildCard
    Указывает, выбран ли символ-шаблон (*). Этот параметр принимает значение True, если выбран шаблон (*), означающий профилирование всех столбцов. Значение False показывает, что для профилирования выбран отдельный столбец. Этот параметр доступен только для чтения.

  • ColumnName
    Отображает имя выбранного столбца. Этот параметр пуст, если выбран шаблон (*), означающий профилирование всех столбцов. Этот параметр доступен только для чтения.

  • StringCompareOptions
    Выберите параметры для сравнения строковых значений. Это свойство имеет параметры, указанные в следующей таблице. По умолчанию значение этого параметра равно Default.

    ПримечаниеПримечание

    При использовании шаблона (*) для параметра ColumnName поле CompareOptions доступно только для чтения и имеет настройку По умолчанию.

    Значение

    Описание

    Default

    Сортирует и сравнивает данные на основе параметров сортировки столбца в исходной таблице.

    BinarySort

    Сортирует и сравнивает данные на основе битовых шаблонов, определенных для каждого символа. Двоичный порядок сортировки учитывает регистр и диакритические знаки. Двоичный порядок сортировки является самым быстрым.

    DictionarySort

    Сортирует и сравнивает данные в соответствии с правилами сортировки и сравнения, определенными в словарях для соответствующего языка или алфавита.

    Если выбран вариант DictionarySort, можно дополнительно указать любое сочетание параметров, перечисленных в следующей таблице. По умолчанию эти дополнительные параметры не выбираются.

    Значение

    Описание

    IgnoreCase

    Указывает, следует ли при сравнении различать символы в верхнем и нижнем регистре. Если параметр задан, то строковое сравнение игнорирует регистр. Например, «ABC» при сравнении не отличается от «abc».

    IgnoreNonSpace

    Указывает, следует ли при сравнении различать знаки ненулевой ширины и символы с диакритическими знаками. Если параметр задан, то при сравнении строк диакритические знаки не учитываются. Например, буква «a» с любыми диакритическими знаками будет считаться обычной буквой «a».

    IgnoreKanaType

    Указывает, следует ли различать при сравнении два типа символов японской азбуки: хирагана и катакана. Если параметр задан, то строковое сравнение игнорирует тип японской азбуки.

    IgnoreWidth

    Указывает, следует ли при сравнении различать однобайтовые символы или аналогичные двухбайтовые символы. Если параметр задан, то строковое сравнение рассматривает однобайтовое и двухбайтовое представление символа как один и тот же символ.

Общие параметры

  • RequestID
    Введите описательное имя для этого запроса профиля. Обычно автоматически сформированное значение менять не нужно.

Параметры

  • ValueDistributionOption
    Укажите, нужно ли вычислять распределение для всех значений столбца. По умолчанию значение этого параметра равно FrequentValues.

    Значение

    Описание

    AllValues

    Распределение вычисляется для всех значений столбца.

    FrequentValues

    Распределение вычисляется только для тех значений, частота которых превосходит минимальное значение, указанное параметром FrequentValueThreshold.

  • FrequentValueThreshold
    Укажите пороговое значение (между 0 и 1), при превышении которого необходимо сообщать о значении столбца. Этот параметр отключен, если в качестве значения ValueDistributionOption выбрано AllValues. Значение этого параметра по умолчанию равно 0,001.