ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)
|
を WordEmbeddingEstimator作成します。これは、事前トレーニング済みの埋め込みモデルを使用して、テキストのベクターを数値ベクトルに変換するテキスト特徴付け器です。
|
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)
|
WordEmbeddingEstimatorを作成します。これは、事前トレーニング済みの埋め込みモデルを使用して、テキストのベクターを数値ベクターに変換するテキスト特徴付け器です。
|
FeaturizeText(TransformsCatalog+TextTransforms, String, String)
|
テキスト列を TextFeaturizingEstimator、n-gram と char-gram の正規化されたカウントを表す 特徴付き ベクター Single に変換する を作成します。
|
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])
|
を TextFeaturizingEstimator作成します。これにより、テキスト列が、n-gram と char-gram の正規化されたカウントを表す の特徴付きベクター Single に変換されます。
|
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String,
String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32,
Int32, Int32, Boolean)
|
LatentDirichletAllocationEstimator
LightLDA を使用してテキスト (floats のベクターとして表される) を、特定された各トピックとのテキストのSingle類似性を示すベクターに変換する を作成します。
|
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)
|
必要に応じて大文字と小文字を TextNormalizingEstimator変更して受信テキスト inputColumnName を正規化し、ダイアクリティカル マーク、句読点、数字を削除し、新しいテキストを として outputColumnName 出力する を作成します。
|
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)
|
で NgramHashingEstimator指定された inputColumnName 列から新しい列にデータをコピーし、 outputColumnName ハッシュされた n-gram の数のベクトルを生成する を作成します。
|
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)
|
で NgramHashingEstimator指定された inputColumnNames 複数の列から新しい列にデータを受け取り、 outputColumnName ハッシュされた n-gram の数のベクトルを生成する を作成します。
|
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)
|
で WordHashBagEstimator指定された inputColumnName 列を、 という名前 outputColumnName の新しい列でハッシュされた n-gram の数のベクターにマップする を作成します。
|
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)
|
で WordHashBagEstimator指定された inputColumnNames 複数の列を という名前 outputColumnName の新しい列にハッシュされた n-gram の数のベクトルにマップする を作成します。
|
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
|
入力テキストで NgramExtractingEstimator 検出された n-gram (連続する単語のシーケンス) の数のベクトルを生成する を作成します。
|
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
|
で WordBagEstimator指定された inputColumnName 列を という名前 outputColumnName の新しい列の n-gram カウントのベクターにマップする を作成します。
|
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
|
で WordBagEstimator指定された inputColumnName 列を という名前 outputColumnName の新しい列の n-gram カウントのベクターにマップする を作成します。
|
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
|
で WordBagEstimator指定された inputColumnNames 複数の列を という名前 outputColumnName の新しい列の n-gram カウントのベクターにマップする を作成します。
|
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)
|
で CustomStopWordsRemovingEstimator指定された inputColumnName 列から新しい列にデータをコピーし、 outputColumnName に固有のテキストセットを削除する language を作成します。
|
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])
|
でCustomStopWordsRemovingEstimator指定された列から新しいoutputColumnName 列にデータをコピーし、 でinputColumnName stopwords 指定されたテキストを削除する を作成します。
|
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)
|
スライディング ウィンドウを TokenizingByCharactersEstimator使用してテキストを文字のシーケンスに分割してトークン化する を作成します。
|
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])
|
を WordTokenizingEstimator作成します。これにより、区切り記号として を使用して入力テキストが separators トークン化されます。
|