共用方式為


TorchSharpCatalog.SentenceSimilarity 方法

定義

多載

SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions)

微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。

SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)

微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。

SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions)

微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。

public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity (this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions options);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, options As SentenceSimilarityTrainer.SentenceSimilarityOptions) As SentenceSimilarityTrainer

參數

catalog
RegressionCatalog.RegressionTrainers

轉換的目錄。

傳回

適用於

SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)

微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。

public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity (this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, string labelColumnName = "Label", string scoreColumnName = "Score", string sentence1ColumnName = "Sentence1", string sentence2ColumnName = "Sentence2", int batchSize = 32, int maxEpochs = 10, Microsoft.ML.TorchSharp.NasBert.BertArchitecture architecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Microsoft.ML.IDataView validationSet = default);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * string * string * string * string * int * int * Microsoft.ML.TorchSharp.NasBert.BertArchitecture * Microsoft.ML.IDataView -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, Optional labelColumnName As String = "Label", Optional scoreColumnName As String = "Score", Optional sentence1ColumnName As String = "Sentence1", Optional sentence2ColumnName As String = "Sentence2", Optional batchSize As Integer = 32, Optional maxEpochs As Integer = 10, Optional architecture As BertArchitecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Optional validationSet As IDataView = Nothing) As SentenceSimilarityTrainer

參數

catalog
RegressionCatalog.RegressionTrainers

轉換的目錄。

labelColumnName
String

標籤資料列的名稱。 數據行應該是 float 類型。

scoreColumnName
String

分數數據行的名稱。

sentence1ColumnName
String

第一個句子的數據行名稱。

sentence2ColumnName
String

第二個句子的數據行名稱。 只有在 NLP 分類需要句子組時才需要 。

batchSize
Int32

批次中的資料列數。

maxEpochs
Int32

循環執行定型集的次數上限。

architecture
BertArchitecture

模型的架構。 預設為 Roberta。

validationSet
IDataView

定型時用來改善模型質量的驗證集。

傳回

適用於