Преобразование "Выборка строк"
Область применения: среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure
Преобразование «Выборка строк» используется для получения случайно выбранного подмножества входного набора данных. Можно указать точный размер получаемого образца и задать начальное значение для генератора случайных чисел.
Случайная выборка может применяться в различных ситуациях. Например, если в какой-то компании требуется случайным образом выбрать 50 сотрудников для получения призов в лотерее, можно воспользоваться преобразованием «Выборка строк» в базе данных сотрудников, чтобы сформировать точное число победителей.
Преобразование «Выборка строк» используется также во время разработки пакета, чтобы создать небольшой, но репрезентативный набор данных. С помощью репрезентативного набора данных выполнение пакета и преобразование данных можно протестировать гораздо быстрее за счет использования случайной выборки вместо полного набора данных. Поскольку выбранный набор данных, используемый в тестовом пакете, всегда одного и того же размера, с помощью выбранного подмножества легче распознать проблемы производительности в пакете.
Это преобразование имеет сходство с преобразованием «Процентная выборка», которое создает набор данных с помощью выбора количества строк, заданного в процентах. См. раздел Percentage Sampling Transformation.
Настройка преобразования «Выборка строк»
Преобразование «Выборка строк» создает набор данных с помощью извлечения заданного количества строк со входа преобразования. Поскольку выбор строк со входа преобразования происходит случайным образом, результирующая выборка содержит репрезентативный набор входных данных. Можно задать начальное значение генератора случайных чисел, чтобы изменить выбор строк преобразованием.
Использование одного и того же начального значения на одном и том же входе преобразования всегда приводит к созданию одной и той же выходной выборки. Если начальное значение для создания случайного номера не указано, преобразование использует счетчик тактов операционной системы. Поэтому для проверки результатов преобразования во время разработки и тестирования пакета нужно использовать одно и то же начальное значение, которое изменяется на случайное, когда пакет выпускается в производственную среду.
Преобразование «Выборка строк» включает в себя пользовательское свойство SamplingValue . Это свойство может быть обновлено выражением свойства при загрузке пакета. Дополнительные сведения см. в разделах Выражения служб Integration Services (SSIS), Использование выражений свойств в пакетах и Пользовательские свойства преобразований.
Преобразование имеет один вход и два выхода. Оно не имеет выхода ошибок.
Свойства могут быть заданы с помощью конструктора SSIS или программным путем.
Диалоговое окно Расширенный редактор содержит свойства, которые можно установить с помощью программных средств. Дополнительные сведения о свойствах, которые вы можете задать в диалоговом окне Расширенный редактор или программными средствами, см. в следующих разделах.
Дополнительные сведения об установке свойств см. в разделе:
Редактор преобразования "Выборка строк" (страница выборки)
Диалоговое окно Редактор преобразования «Выборка строк» используется для деления на части входных данных в выборке, используя указанное количество строк. Это преобразование разделяет входные данные на два отдельных вывода.
Параметры
Число строк
Задайте количество строк из входных данных для использования в качестве выборки.
Значение этого свойства можно задать с помощью выражения свойства.
Имя выхода выборки
Задайте уникальное имя выхода, содержащего строки выборки. Указанное имя будет отображаться в конструкторе служб SSIS.
Имя вывода невыбранных элементов
Задает уникальное имя выхода, который содержит строки, исключенные из выборки. Указанное имя будет отображаться в конструкторе служб SSIS.
Использовать следующее начальное значение
Задайте начальное значение выборки для генератора случайных чисел, который преобразование использует для создания выборки. Рекомендуется только для разработки и тестирования. Если начальное значение выборки не задано, преобразование использует счетчик сигналов времени Microsoft Windows.