次の方法で共有


microsoftml.n_gram: N-gram を使用してテキストを特徴に変換する

使用法

microsoftml.n_gram(ngram_length: numbers.Real = 1,
    skip_length: numbers.Real = 0, all_lengths: bool = True,
    max_num_terms: list = [10000000], weighting: str = 'Tf')

説明

テキストから NGram を抽出し、辞書を使用してベクターに変換します。

引数

ngram_length

Ngram 長 (設定)。

skip_length

ngram の構築時にスキップするトークンの最大数 (設定)。

all_lengths

すべての ngram 長を含めるか (最大 NgramLength)、NgramLength だけを含めます (設定)。

max_num_terms

辞書に格納する ngram の最大数 (設定)。

weighting

重み付け条件 (設定)。

関連項目

n_gram_hash, featurize_text