microsoftml.n_gram_hash: ハッシュされた N-gram を使用してテキストを特徴に変換する
使用法
microsoftml.n_gram_hash(hash_bits: numbers.Real = 16,
ngram_length: numbers.Real = 1, skip_length: numbers.Real = 0,
all_lengths: bool = True, seed: numbers.Real = 314489979,
ordered: bool = True, invert_hash: numbers.Real = 0)
説明
テキストから NGrams を抽出し、ハッシュ トリックを使用してベクターに変換します。
引数
hash_bits
ハッシュ後のビット数。 1 から 30 までの数にする必要があります (1 と 30 も含まれます)。 (設定)。
ngram_length
Ngram 長 (設定)。
skip_length
ngram の構築時にスキップするトークンの最大数 (設定)。
all_lengths
すべての ngram 長を含めるか (最大 ngramLength)、ngramLength だけを含めます (設定)。
seed
ハッシュ シード (設定)。
ordered
各ソース列の位置をハッシュに含めるかどうか (複数のソース列があるとき)。 (設定)。
invert_hash
スロット名を生成するためのキー数をこの数までに制限します。 0 は逆ハッシュがないことを意味し、-1 は制限がないことを意味します。 (設定)。