次の方法で共有


TransformsCatalog.TextTransforms クラス

定義

テキスト データ変換コンポーネントのインスタンスを作成するために によって MLContext 使用されるクラス。

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
継承
TransformsCatalog.TextTransforms

拡張メソッド

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

WordEmbeddingEstimatorを作成します。これは、事前トレーニング済みの埋め込みモデルを使用して、テキストのベクターを数値ベクターに変換するテキスト特徴付け器です。

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

WordEmbeddingEstimator作成します。これは、事前トレーニング済みの埋め込みモデルを使用して、テキストのベクターを数値ベクトルに変換するテキスト特徴付け器です。

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

TextFeaturizingEstimator作成します。これにより、テキスト列が、n-gram と char-gram の正規化されたカウントを表す の特徴付きベクター Single に変換されます。

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

テキスト列を TextFeaturizingEstimator、n-gram と char-gram の正規化されたカウントを表す 特徴付き ベクター Single に変換する を作成します。

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

LatentDirichletAllocationEstimator LightLDA を使用してテキスト (floats のベクターとして表される) を、特定された各トピックとのテキストのSingle類似性を示すベクターに変換する を作成します。

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

必要に応じて大文字と小文字を TextNormalizingEstimator変更して受信テキスト inputColumnName を正規化し、ダイアクリティカル マーク、句読点、数字を削除し、新しいテキストを として outputColumnName出力する を作成します。

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimator指定された inputColumnName 列から新しい列にデータをコピーし、 outputColumnName ハッシュされた n-gram の数のベクトルを生成する を作成します。

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimator指定された inputColumnNames 複数の列から新しい列にデータを受け取り、 outputColumnName ハッシュされた n-gram の数のベクトルを生成する を作成します。

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator指定された inputColumnName 列を、 という名前 outputColumnNameの新しい列でハッシュされた n-gram の数のベクターにマップする を作成します。

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator指定された inputColumnNames 複数の列を という名前 outputColumnNameの新しい列にハッシュされた n-gram の数のベクトルにマップする を作成します。

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

入力テキストで NgramExtractingEstimator 検出された n-gram (連続する単語のシーケンス) の数のベクトルを生成する を作成します。

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator指定された inputColumnName 列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator指定された inputColumnName 列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator指定された inputColumnNames 複数の列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

CustomStopWordsRemovingEstimator指定された inputColumnName 列から新しい列にデータをコピーし、 outputColumnName に固有のテキストセットを削除する language を作成します。

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

CustomStopWordsRemovingEstimator指定された列から新しいoutputColumnName列にデータをコピーし、 でinputColumnNamestopwords指定されたテキストを削除する を作成します。

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

スライディング ウィンドウを TokenizingByCharactersEstimator使用してテキストを文字のシーケンスに分割してトークン化する を作成します。

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

WordTokenizingEstimator作成します。これにより、区切り記号として を使用して入力テキストが separators トークン化されます。

適用対象