TorchSharpCatalog.SentenceSimilarity Methode
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Überlädt
SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions) |
Optimieren eines NAS-BERT-Modells für NLP-Satzähnlichkeit. Der Grenzwert für einen Satz beträgt 512 Token. Jedes Wort wird in der Regel einem einzelnen Token zugeordnet, und wir fügen automatisch 2 spezische Token (ein Starttoken und ein Trennzeichen) hinzu, sodass dieser Grenzwert im Allgemeinen 510 Wörter für alle Sätze beträgt. |
SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView) |
Optimieren eines NAS-BERT-Modells für NLP-Satzähnlichkeit. Der Grenzwert für einen Satz beträgt 512 Token. Jedes Wort wird in der Regel einem einzelnen Token zugeordnet, und wir fügen automatisch 2 spezische Token (ein Starttoken und ein Trennzeichen) hinzu, sodass dieser Grenzwert im Allgemeinen 510 Wörter für alle Sätze beträgt. |
SentenceSimilarity(RegressionCatalog+RegressionTrainers, SentenceSimilarityTrainer+SentenceSimilarityOptions)
- Quelle:
- TorchSharpCatalog.cs
- Quelle:
- TorchSharpCatalog.cs
- Quelle:
- TorchSharpCatalog.cs
Optimieren eines NAS-BERT-Modells für NLP-Satzähnlichkeit. Der Grenzwert für einen Satz beträgt 512 Token. Jedes Wort wird in der Regel einem einzelnen Token zugeordnet, und wir fügen automatisch 2 spezische Token (ein Starttoken und ein Trennzeichen) hinzu, sodass dieser Grenzwert im Allgemeinen 510 Wörter für alle Sätze beträgt.
public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity(this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions options);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer.SentenceSimilarityOptions -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, options As SentenceSimilarityTrainer.SentenceSimilarityOptions) As SentenceSimilarityTrainer
Parameter
Der Katalog der Transformation.
Erweiterte Optionen
Gibt zurück
Gilt für:
SentenceSimilarity(RegressionCatalog+RegressionTrainers, String, String, String, String, Int32, Int32, BertArchitecture, IDataView)
- Quelle:
- TorchSharpCatalog.cs
- Quelle:
- TorchSharpCatalog.cs
- Quelle:
- TorchSharpCatalog.cs
Optimieren eines NAS-BERT-Modells für NLP-Satzähnlichkeit. Der Grenzwert für einen Satz beträgt 512 Token. Jedes Wort wird in der Regel einem einzelnen Token zugeordnet, und wir fügen automatisch 2 spezische Token (ein Starttoken und ein Trennzeichen) hinzu, sodass dieser Grenzwert im Allgemeinen 510 Wörter für alle Sätze beträgt.
public static Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer SentenceSimilarity(this Microsoft.ML.RegressionCatalog.RegressionTrainers catalog, string labelColumnName = "Label", string scoreColumnName = "Score", string sentence1ColumnName = "Sentence1", string sentence2ColumnName = "Sentence2", int batchSize = 32, int maxEpochs = 10, Microsoft.ML.TorchSharp.NasBert.BertArchitecture architecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Microsoft.ML.IDataView validationSet = default);
static member SentenceSimilarity : Microsoft.ML.RegressionCatalog.RegressionTrainers * string * string * string * string * int * int * Microsoft.ML.TorchSharp.NasBert.BertArchitecture * Microsoft.ML.IDataView -> Microsoft.ML.TorchSharp.NasBert.SentenceSimilarityTrainer
<Extension()>
Public Function SentenceSimilarity (catalog As RegressionCatalog.RegressionTrainers, Optional labelColumnName As String = "Label", Optional scoreColumnName As String = "Score", Optional sentence1ColumnName As String = "Sentence1", Optional sentence2ColumnName As String = "Sentence2", Optional batchSize As Integer = 32, Optional maxEpochs As Integer = 10, Optional architecture As BertArchitecture = Microsoft.ML.TorchSharp.NasBert.BertArchitecture.Roberta, Optional validationSet As IDataView = Nothing) As SentenceSimilarityTrainer
Parameter
Der Katalog der Transformation.
- labelColumnName
- String
Name der Bezeichnungsspalte. Die Spalte sollte ein float-Typ sein.
- scoreColumnName
- String
Name der Bewertungsspalte.
- sentence1ColumnName
- String
Name der Spalte für den ersten Satz.
- sentence2ColumnName
- String
Name der Spalte für den zweiten Satz. Nur erforderlich, wenn ihre NLP-Klassifizierung Satzpaare erfordert.
- batchSize
- Int32
Die Anzahl von Zeilen im Batch.
- maxEpochs
- Int32
Maximale Anzahl von Schleifen durch Ihren Trainingssatz.
- architecture
- BertArchitecture
Architektur für das Modell. Standardmäßig wird Roberta verwendet.
- validationSet
- IDataView
Der Validierungssatz, der während des Trainings verwendet wird, um die Modellqualität zu verbessern.