Sdílet prostřednictvím


NgramExtractingEstimator.WeightingCriteria Výčet

Definice

Statistická míra použitá k vyhodnocení toho, jak důležité slovo je pro dokument v korpusu. Tento výčet je serializován.

public enum NgramExtractingEstimator.WeightingCriteria
type NgramExtractingEstimator.WeightingCriteria = 
Public Enum NgramExtractingEstimator.WeightingCriteria
Dědičnost
NgramExtractingEstimator.WeightingCriteria

Pole

Idf 1

Inverzní frekvence dokumentů Poměr (logaritmus inverzní relativní frekvence), který měří informace, které slot poskytuje, určením, jak často nebo vzácně je v celém korpusu.

Tf 0

Frekvence termínů. Vypočítá se na základě počtu výskytů v dokumentu.

TfIdf 2

Součin doby trvání a inverzní frekvence dokumentu.

Platí pro