TorchSharpCatalog.TextClassification 方法

定义

重载

TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, TextClassificationTrainer+TextClassificationOptions)

微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。

TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, String, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)

微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。

TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, TextClassificationTrainer+TextClassificationOptions)

微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。

public static Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer TextClassification (this Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers catalog, Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer.TextClassificationOptions options);
static member TextClassification : Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers * Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer.TextClassificationOptions -> Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer
<Extension()>
Public Function TextClassification (catalog As MulticlassClassificationCatalog.MulticlassClassificationTrainers, options As TextClassificationTrainer.TextClassificationOptions) As TextClassificationTrainer

参数

返回

适用于

TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, String, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)

微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。

public static Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer TextClassification (this Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers catalog, string labelColumnName = "Label", string scoreColumnName = "Score", string outputColumnName = "PredictedLabel", string sentence1ColumnName = "Sentence1", string sentence2ColumnName = default, int batchSize = 32, int maxEpochs = 10, Microsoft.ML.TorchSharp.NasBert.BertArchitecture architecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Microsoft.ML.IDataView validationSet = default);
static member TextClassification : Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers * string * string * string * string * string * int * int * Microsoft.ML.TorchSharp.NasBert.BertArchitecture * Microsoft.ML.IDataView -> Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer
<Extension()>
Public Function TextClassification (catalog As MulticlassClassificationCatalog.MulticlassClassificationTrainers, Optional labelColumnName As String = "Label", Optional scoreColumnName As String = "Score", Optional outputColumnName As String = "PredictedLabel", Optional sentence1ColumnName As String = "Sentence1", Optional sentence2ColumnName As String = Nothing, Optional batchSize As Integer = 32, Optional maxEpochs As Integer = 10, Optional architecture As BertArchitecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Optional validationSet As IDataView = Nothing) As TextClassificationTrainer

参数

labelColumnName
String

标签列的名称。 列应是键类型。

scoreColumnName
String

评分列的名称。

outputColumnName
String

输出列的名称。 它将是键类型。 它是预测的标签。

sentence1ColumnName
String

第一个句子的列的名称。

sentence2ColumnName
String

第二个句子的列的名称。 仅当 NLP 分类需要句子对时才需要。

batchSize
Int32

批处理中的行数。

maxEpochs
Int32

循环访问训练集的最大次数。

architecture
BertArchitecture

模型的体系结构。 默认为 Roberta。

validationSet
IDataView

训练时用于提高模型质量的验证集。

返回

适用于