Поделиться через


Преобразование «Процентная выборка»

Преобразование «Процентная выборка» создает образец набора данных извлечением некоторого процента входных строк преобразования. Данные выборки извлекаются случайным образом из входа преобразования. За счет этого достигается репрезентативность выборки.

Преобразование «Процентная выборка» особенно полезно для интеллектуального анализа данных. С помощью этого преобразования можно случайным образом разделить набор данных на два набора: один — для изучения модели интеллектуального анализа данных, другой — для тестирования этой модели.

Преобразование «Процентная выборка» также полезно для создания образца набора данных, используемого при разработке пакета. Применяя преобразование «Процентная выборка» к потоку данных, можно уменьшить размер набора данных, сохраняя его статистические характеристики. Тестовый пакет можно выполнить быстрее, потому что он содержит меньший, но репрезентативный набор данных.

Можно изменить стартовое значение генератора случайных чисел, используемого для выборки строк. Если всегда использовать одинаковое стартовое значение для генератора, то результирующая выборка, при прочих равных условиях, будет тоже всегда одинаковая. Если начальное значение для создания случайного номера не указано, преобразование использует счетчик времени операционной системы. Поэтому можно выбрать постоянное стартовое значение для генератора во время отладки и случайное значение при передаче пакета в производственную эксплуатацию.

Это преобразование немного схоже с преобразованием «Выборка строк», которое создает выборку с заданным количеством строк. Дополнительные сведения см. в разделе Преобразование «Выборка строк».

Преобразование «Процентная выборка» содержит пользовательское свойство SamplingValue. Это свойство может быть обновлено выражением свойства при загрузке пакета. Дополнительные сведения см. в разделах Справочник по выражениям служб Integration Services, Использование выражений свойств в пакетах и Пользовательские свойства преобразований.

Преобразование имеет один вход и два выхода. Выход ошибок не поддерживается.

ПримечаниеПримечание

Помимо заданного количества процентов преобразование «Процентная выборка» использует алгоритм, определяющий возможность включения строки в результирующую выборку. Это означает, что количество строк в выборке может не соответствовать точно заданному количеству процентов. Например, определив 10 процентов от входного набора данных, содержащего 25000 строк, можно получить выборку, содержащую немного больше или немного меньше, чем 2500 строк.

Настройка преобразования «Процентная выборка»

Свойства задаются с помощью конструктора служб SSIS или программно.

Дополнительные сведения о свойствах, которые можно установить в диалоговом окне Редактор преобразования «Процентная выборка», см. в разделе Редактор преобразования «Процентная выборка».

Диалоговое окно Расширенный редактор содержит свойства, которые можно установить с помощью программных средств. Дополнительные сведения о свойствах, которые можно задать программно или в диалоговом окне Расширенный редактор, см. в следующих разделах:

Дополнительные сведения об установке свойств см. в разделе Как установить свойства компонента потока данных.

Значок служб Integration Services (маленький) Будьте в курсе новых возможностей cлужб Integration Services

Чтобы загружать новейшую документацию, статьи, образцы и видеоматериалы от корпорации Майкрософт, а также лучшие решения от участников сообщества, посетите страницу служб Integration Services на сайте MSDN или TechNet:

Чтобы получать автоматические уведомления об этих обновлениях, подпишитесь на RSS-каналы, предлагаемые на этой странице.