microsoftml.n_gram : convertit un texte en caractéristiques en utilisant des n-grammes
Usage
microsoftml.n_gram(ngram_length: numbers.Real = 1,
skip_length: numbers.Real = 0, all_lengths: bool = True,
max_num_terms: list = [10000000], weighting: str = 'Tf')
Description
Extrait des n-grammes du texte et les convertit en vecteur à l’aide d’un dictionnaire.
Arguments
ngram_length
Longueur de n-gramme (paramètres).
skip_length
Nombre maximal de jetons à ignorer lors de la construction d’un n-gramme (paramètres).
all_lengths
Indique s’il faut inclure toutes les longueurs de n-gramme jusqu’à NgramLength ou uniquement NgramLength (paramètres).
max_num_terms
Nombre maximal de n-grammes à stocker dans le dictionnaire (paramètres).
weighting
Critères de pondération (paramètres).