microsoftml.n_gram: N-gram を使用してテキストを特徴に変換する
使用法
microsoftml.n_gram(ngram_length: numbers.Real = 1,
skip_length: numbers.Real = 0, all_lengths: bool = True,
max_num_terms: list = [10000000], weighting: str = 'Tf')
説明
テキストから NGram を抽出し、辞書を使用してベクターに変換します。
引数
ngram_length
Ngram 長 (設定)。
skip_length
ngram の構築時にスキップするトークンの最大数 (設定)。
all_lengths
すべての ngram 長を含めるか (最大 NgramLength)、NgramLength だけを含めます (設定)。
max_num_terms
辞書に格納する ngram の最大数 (設定)。
weighting
重み付け条件 (設定)。