TextLoaderSaverCatalog.LoadFromTextFile 方法
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
重载
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options) |
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。 |
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean) |
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。 |
LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options) |
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。 |
LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean) |
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。 |
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。
public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView
参数
- catalog
- DataOperationsCatalog
- path
- String
指定要从中加载的文件的文件或路径。
- options
- TextLoader.Options
定义加载操作的设置。
返回
示例
using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;
namespace Samples.Dynamic
{
public static class SaveAndLoadFromText
{
public static void Example()
{
// Create a new context for ML.NET operations. It can be used for
// exception tracking and logging, as a catalog of available operations
// and as the source of randomness. Setting the seed to a fixed number
// in this example to make outputs deterministic.
var mlContext = new MLContext(seed: 0);
// Create a list of training data points.
var dataPoints = new List<DataPoint>()
{
new DataPoint(){ Label = 0, Features = 4},
new DataPoint(){ Label = 0, Features = 5},
new DataPoint(){ Label = 0, Features = 6},
new DataPoint(){ Label = 1, Features = 8},
new DataPoint(){ Label = 1, Features = 9},
};
// Convert the list of data points to an IDataView object, which is
// consumable by ML.NET API.
IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);
// Create a FileStream object and write the IDataView to it as a text
// file.
using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
mlContext.Data.SaveAsText(data, stream);
// Create an IDataView object by loading the text file.
IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");
// Inspect the data that is loaded from the previously saved text file.
var loadedDataEnumerable = mlContext.Data
.CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);
foreach (DataPoint row in loadedDataEnumerable)
Console.WriteLine($"{row.Label}, {row.Features}");
// Preview of the loaded data.
// 0, 4
// 0, 5
// 0, 6
// 1, 8
// 1, 9
}
// Example with label and feature values. A data set is a collection of such
// examples.
private class DataPoint
{
public float Label { get; set; }
public float Features { get; set; }
}
}
}
适用于
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。
public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView
参数
- catalog
- DataOperationsCatalog
- path
- String
文件的路径 (s) 。
- columns
- TextLoader.Column[]
架构的列。
- separatorChar
- Char
用作行中数据点分隔符的字符。 默认情况下,制表符用作分隔符。
- hasHeader
- Boolean
文件是否具有标头。 何时 true
,加载程序将在调用时 Load(IMultiStreamSource) 跳过第一行。
- allowQuoting
- Boolean
输入是否可能包含双引号值。 此参数用于区分输入值中的分隔符与实际分隔符。 当 true
双引号中的分隔符被视为输入值的一部分。 当 false
,所有分隔符(即使是那些惠廷引号)都被视为分隔新列。
它还用于区分空值与缺失值。 如果 true
缺少值由连续分隔符表示,空值则为“”。 当 false
,空值由连续分隔符和缺失值表示为记录 DataKind的每个类型的默认缺失值。
- trimWhitespace
- Boolean
从行中删除尾随空格。
- allowSparse
- Boolean
输入是否可能包含稀疏表示形式。 例如,包含“5 2:6 4:3”的行表示有 5 列,唯一的非零是列 2 和 4,分别具有值 6 和 3。 列索引从零开始,因此列 2 和 4 表示第 3 列和第 5 列。 列可能还具有密集值,后跟以这种方式表示的稀疏值。 例如,包含“1 2 5 2:6 4:3”的行表示值为 1 和 2 的两个密集列,后跟值 0、0、6、0 和 3 的稀疏表示列。 稀疏列的索引从 0 开始,即使 0 表示第三列。
返回
数据视图。
适用于
LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。
public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView
类型参数
- TInput
参数
- catalog
- DataOperationsCatalog
- path
- String
指定要从中加载的文件的文件或路径。
- options
- TextLoader.Options
定义加载操作的设置。 无需指定“列”字段,因为此方法将推断列。
返回
数据视图。
适用于
LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)
使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。
public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView
类型参数
- TInput
参数
- catalog
- DataOperationsCatalog
- path
- String
文件的路径 (s) 。
- separatorChar
- Char
列分隔符。 默认值为“\t”
- hasHeader
- Boolean
文件是否具有标头。 何时 true
,加载程序将在调用时 Load(IMultiStreamSource) 跳过第一行。
- allowQuoting
- Boolean
输入是否可能包含双引号值。 此参数用于区分输入值中的分隔符与实际分隔符。 当 true
双引号中的分隔符被视为输入值的一部分。 当 false
,所有分隔符(即使是那些惠廷引号)都被视为分隔新列。
它还用于区分空值与缺失值。 如果 true
缺少值由连续分隔符表示,空值则为“”。 当 false
,空值由连续分隔符和缺失值表示为记录 DataKind的每个类型的默认缺失值。
- trimWhitespace
- Boolean
从行中删除尾随空格。
- allowSparse
- Boolean
输入是否可能包含稀疏表示形式。 例如,包含“5 2:6 4:3”的行表示有 5 列,唯一的非零是列 2 和 4,分别具有值 6 和 3。 列索引从零开始,因此列 2 和 4 表示第 3 列和第 5 列。 列可能还具有密集值,后跟以这种方式表示的稀疏值。 例如,包含“1 2 5 2:6 4:3”的行表示值为 1 和 2 的两个密集列,后跟值 0、0、6、0 和 3 的稀疏表示列。 稀疏列的索引从 0 开始,即使 0 表示第三列。
返回
数据视图。