TorchSharpCatalog.TextClassification 方法
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
重载
TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, TextClassificationTrainer+TextClassificationOptions) |
微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。 |
TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, String, String, String, String, String, Int32, Int32, BertArchitecture, IDataView) |
微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。 |
TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, TextClassificationTrainer+TextClassificationOptions)
微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。
public static Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer TextClassification (this Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers catalog, Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer.TextClassificationOptions options);
static member TextClassification : Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers * Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer.TextClassificationOptions -> Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer
<Extension()>
Public Function TextClassification (catalog As MulticlassClassificationCatalog.MulticlassClassificationTrainers, options As TextClassificationTrainer.TextClassificationOptions) As TextClassificationTrainer
参数
高级选项。
返回
适用于
TextClassification(MulticlassClassificationCatalog+MulticlassClassificationTrainers, String, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)
微调 NLP 分类的 NAS-BERT 模型。 任何句子的限制为 512 个标记。 每个单词通常映射到单个标记,并且我们自动添加 2 个特定标记 (开始标记和分隔符标记) 因此,一般来说,对于所有句子,此限制为 510 字。
public static Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer TextClassification (this Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers catalog, string labelColumnName = "Label", string scoreColumnName = "Score", string outputColumnName = "PredictedLabel", string sentence1ColumnName = "Sentence1", string sentence2ColumnName = default, int batchSize = 32, int maxEpochs = 10, Microsoft.ML.TorchSharp.NasBert.BertArchitecture architecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Microsoft.ML.IDataView validationSet = default);
static member TextClassification : Microsoft.ML.MulticlassClassificationCatalog.MulticlassClassificationTrainers * string * string * string * string * string * int * int * Microsoft.ML.TorchSharp.NasBert.BertArchitecture * Microsoft.ML.IDataView -> Microsoft.ML.TorchSharp.NasBert.TextClassificationTrainer
<Extension()>
Public Function TextClassification (catalog As MulticlassClassificationCatalog.MulticlassClassificationTrainers, Optional labelColumnName As String = "Label", Optional scoreColumnName As String = "Score", Optional outputColumnName As String = "PredictedLabel", Optional sentence1ColumnName As String = "Sentence1", Optional sentence2ColumnName As String = Nothing, Optional batchSize As Integer = 32, Optional maxEpochs As Integer = 10, Optional architecture As BertArchitecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Optional validationSet As IDataView = Nothing) As TextClassificationTrainer
参数
- labelColumnName
- String
标签列的名称。 列应是键类型。
- scoreColumnName
- String
评分列的名称。
- outputColumnName
- String
输出列的名称。 它将是键类型。 它是预测的标签。
- sentence1ColumnName
- String
第一个句子的列的名称。
- sentence2ColumnName
- String
第二个句子的列的名称。 仅当 NLP 分类需要句子对时才需要。
- batchSize
- Int32
批处理中的行数。
- maxEpochs
- Int32
循环访问训练集的最大次数。
- architecture
- BertArchitecture
模型的体系结构。 默认为 Roberta。
- validationSet
- IDataView
训练时用于提高模型质量的验证集。