TorchSharpCatalog.SentenceSimilarity 方法
定義
重要
部分資訊涉及發行前產品,在發行之前可能會有大幅修改。 Microsoft 對此處提供的資訊,不做任何明確或隱含的瑕疵擔保。
多載
SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions) |
微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。 |
SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView) |
微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。 |
SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions)
微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。
public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity (this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions options);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, options As SentenceSimilarityTrainer.SentenceSimilarityOptions) As SentenceSimilarityTrainer
參數
轉換的目錄。
進階選項
傳回
適用於
SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)
微調 NLP 句子相似性的 NAS-BERT 模型。 任何句子的限制為512個標記。 每個單字通常會對應至單一令牌,而且我們會在開始令牌和分隔符標記 (自動新增 2 個規格標記,) 因此,此限制一般會是所有句子 510 個字。
public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity (this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, string labelColumnName = "Label", string scoreColumnName = "Score", string sentence1ColumnName = "Sentence1", string sentence2ColumnName = "Sentence2", int batchSize = 32, int maxEpochs = 10, Microsoft.ML.TorchSharp.NasBert.BertArchitecture architecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Microsoft.ML.IDataView validationSet = default);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * string * string * string * string * int * int * Microsoft.ML.TorchSharp.NasBert.BertArchitecture * Microsoft.ML.IDataView -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, Optional labelColumnName As String = "Label", Optional scoreColumnName As String = "Score", Optional sentence1ColumnName As String = "Sentence1", Optional sentence2ColumnName As String = "Sentence2", Optional batchSize As Integer = 32, Optional maxEpochs As Integer = 10, Optional architecture As BertArchitecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Optional validationSet As IDataView = Nothing) As SentenceSimilarityTrainer
參數
轉換的目錄。
- labelColumnName
- String
標籤資料列的名稱。 數據行應該是 float 類型。
- scoreColumnName
- String
分數數據行的名稱。
- sentence1ColumnName
- String
第一個句子的數據行名稱。
- sentence2ColumnName
- String
第二個句子的數據行名稱。 只有在 NLP 分類需要句子組時才需要 。
- batchSize
- Int32
批次中的資料列數。
- maxEpochs
- Int32
循環執行定型集的次數上限。
- architecture
- BertArchitecture
模型的架構。 預設為 Roberta。
- validationSet
- IDataView
定型時用來改善模型質量的驗證集。