Partager via


microsoftml.n_gram : convertit un texte en caractéristiques en utilisant des n-grammes

Usage

microsoftml.n_gram(ngram_length: numbers.Real = 1,
    skip_length: numbers.Real = 0, all_lengths: bool = True,
    max_num_terms: list = [10000000], weighting: str = 'Tf')

Description

Extrait des n-grammes du texte et les convertit en vecteur à l’aide d’un dictionnaire.

Arguments

ngram_length

Longueur de n-gramme (paramètres).

skip_length

Nombre maximal de jetons à ignorer lors de la construction d’un n-gramme (paramètres).

all_lengths

Indique s’il faut inclure toutes les longueurs de n-gramme jusqu’à NgramLength ou uniquement NgramLength (paramètres).

max_num_terms

Nombre maximal de n-grammes à stocker dans le dictionnaire (paramètres).

weighting

Critères de pondération (paramètres).

Voir aussi

n_gram_hash, featurize_text