Поделиться через


DataOperationsCatalog Класс

Определение

Класс, используемый для создания компонентов, которые работают с данными, но не являются частью конвейера обучения модели. Включает компоненты для загрузки, сохранения, кэширования, фильтрации, перетасовки и разделения данных.

public sealed class DataOperationsCatalog
type DataOperationsCatalog = class
Public NotInheritable Class DataOperationsCatalog
Наследование
DataOperationsCatalog

Методы

BootstrapSample(IDataView, Nullable<Int32>, Boolean)

Возьмите приблизительный пример inputначальной загрузки .

Cache(IDataView, String[])

Создает отложенный кэш inputв памяти .

CreateEnumerable<TRow>(IDataView, Boolean, Boolean, SchemaDefinition)

Преобразуйте объект IDataView в строго типизированный IEnumerable<T>.

CrossValidationSplit(IDataView, Int32, String, Nullable<Int32>)

Разделение набора данных на перекрестную проверку наборов обучения и наборов тестов. Уважает предоставленный samplingKeyColumnName параметр.

FilterRowsByColumn(IDataView, String, Double, Double)

Отфильтруйте набор данных по значениям числового столбца.

FilterRowsByKeyColumnFraction(IDataView, String, Double, Double)

Отфильтруйте набор данных по значениям столбца KeyDataViewType .

FilterRowsByMissingValues(IDataView, String[])

Удалите строки, в columns которых любой столбец содержит отсутствующее значение.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, DataViewSchema)

Создайте новый IDataView объект для перечисления элементов определяемого пользователем типа с помощью предоставленного DataViewSchemaтипа, который может содержать больше сведений о схеме, чем тип может захватывать.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, SchemaDefinition)

Создайте новый IDataView объект для перечисления элементов определяемого пользователем типа. Пользователь сохраняет владение data данными и итоговом представлении данных никогда не изменяет содержимое data. Так как IDataView предполагается, что неизменяемый пользователь будет поддерживать несколько перечислений data , возвращающих одни и те же результаты, если пользователь не знает, что данные будут курсорироваться только один раз.

Одним из типичных способов использования потокового представления данных может быть создание представления данных, которое лениво загружает данные по мере необходимости, а затем примените к нему предварительно обученные преобразования и наведите курсор через него для результатов преобразования.

ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean)

Перетасовка строк input.

SkipRows(IDataView, Int64)

Пропуск count строк в input.

TakeRows(IDataView, Int64)

Принимать count строки из input.

TrainTestSplit(IDataView, Double, String, Nullable<Int32>)

Разделите набор данных на набор обучения и набор тестов в соответствии с заданной дробной частью. Уважает предоставленный samplingKeyColumnName параметр.

Методы расширения

LoadFromBinary(DataOperationsCatalog, IMultiStreamSource)

Загрузите файл IDataView из IMultiStreamSource двоичного файла. Обратите внимание, что IDataView"ленивый, поэтому фактической загрузки здесь не происходит, просто проверка схемы.

LoadFromBinary(DataOperationsCatalog, String)

Загрузите файл IDataView из двоичного файла. Обратите внимание, что IDataView"ленивый, поэтому фактической загрузки здесь не происходит, просто проверка схемы.

SaveAsBinary(DataOperationsCatalog, IDataView, Stream, Boolean)

Сохраните его IDataView в двоичном потоке.

FilterByCustomPredicate<TSrc>(DataOperationsCatalog, IDataView, Func<TSrc,Boolean>)

Удаление строк, в которых указанный предикат возвращает значение true.

FilterByStatefulCustomPredicate<TSrc,TState>(DataOperationsCatalog, IDataView, Func<TSrc,TState,Boolean>, Action<TState>)

Удаление строк, в которых указанный предикат возвращает значение true. Этот фильтр позволяет поддерживать состояние каждого курсора.

CreateSvmLightLoader(DataOperationsCatalog, Nullable<Int64>, Int32, Boolean, IMultiStreamSource)

Создает загрузчик, который загружает файлы формата SVM-light. SvmLightLoader.

CreateSvmLightLoaderWithFeatureNames(DataOperationsCatalog, Nullable<Int64>, IMultiStreamSource)

Создает загрузчик, который загружает SVM-файлы, например файлы, где компоненты задаются их именами.

LoadFromSvmLightFile(DataOperationsCatalog, String, Nullable<Int64>, Int32, Boolean)

IDataView Загрузка из текстового файла с помощью SvmLightLoader.

LoadFromSvmLightFileWithFeatureNames(DataOperationsCatalog, String, Nullable<Int64>)

IDataView Загрузка из текстового файла, содержащего компоненты, заданные именами компонентов, с помощью SvmLightLoader.

SaveInSvmLightFormat(DataOperationsCatalog, IDataView, Stream, Boolean, Boolean, String, String, String, String)

Сохраните IDataView формат SVM-light. Можно сохранить четыре столбца: метку и столбец признаков, а также столбец идентификатора группы и пример столбца веса.

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Column[])

Создайте загрузчик DatabaseLoaderбазы данных.

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Options)

Создайте загрузчик DatabaseLoaderбазы данных.

CreateDatabaseLoader<TInput>(DataOperationsCatalog)

Создайте загрузчик DatabaseLoaderбазы данных.

CreateTextLoader(DataOperationsCatalog, TextLoader+Column[], Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

Создание загрузчика TextLoaderтекста.

CreateTextLoader(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

Создание загрузчика TextLoaderтекста.

CreateTextLoader<TInput>(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

Создайте загрузчик TextLoader текста путем вывода схемы набора данных из типа модели данных.

CreateTextLoader<TInput>(DataOperationsCatalog, Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

Создайте загрузчик TextLoader текста путем вывода схемы набора данных из типа модели данных.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"ленивый, поэтому фактической загрузки здесь не происходит, просто проверка схемы.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"ленивый, поэтому фактической загрузки здесь не происходит, просто проверка схемы.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"ленивый, поэтому фактической загрузки здесь не происходит, просто проверка схемы.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"ленивый, поэтому фактической загрузки здесь не происходит, просто проверка схемы.

SaveAsText(DataOperationsCatalog, IDataView, Stream, Char, Boolean, Boolean, Boolean, Boolean)

Сохраните IDataView текст в виде текста.

Применяется к