microsoftml.n_gram: konvertiert Text mit N-Grammen in Features
Verwendung
microsoftml.n_gram(ngram_length: numbers.Real = 1,
skip_length: numbers.Real = 0, all_lengths: bool = True,
max_num_terms: list = [10000000], weighting: str = 'Tf')
BESCHREIBUNG
Extrahiert N-Gramme aus Text und konvertiert sie mithilfe eines Wörterbuchs in einen Vektor.
Argumente
ngram_length
Länge des N-Gramms (Einstellungen).
skip_length
Maximale Anzahl von Token, die beim Erstellen eines N-Gramms übersprungen werden sollen (Einstellungen).
all_lengths
Gibt an, ob alle N-Grammlängen bis NgramLength oder nur NgramLength eingeschlossen werden sollen (Einstellungen).
max_num_terms
Maximale Anzahl von N-Grammen, die im Wörterbuch gespeichert werden sollen (Einstellungen).
weighting
Die Gewichtungskriterien (Einstellungen).