Edytor transformacji ekstrakcji termin (karta Zaawansowane)
Użyj Zaawansowane karcie termin wyodrębnićjonów transformacji edytora okno dialogowe, aby określić właściwości dla wyodrębnićjonów, takie jak częstotliwość, długość i czy wyodrębnić wyrazy lub frazy.
Aby dowiedzieć się więcej o transformacja termin ekstrakcji, zobacz Termin ekstrakcji transformacji.
Opcje
Rzeczownik
Należy określić, że transformacja wyodrębnia tylko pojedyncze rzeczowniki.Rzeczownik frazy
Należy określić, że transformacja wyodrębnia tylko wyrażenia rzeczownikowe.Rzeczownik i frazy rzeczownik
Należy określić, że transformacja wyodrębnia rzeczowniki i wyrażenia rzeczownikowe.Częstotliwość
Określa, że wynik jest częstotliwość termin.TFIDF
Należy określić, że wynik jest wartością TFIDF terminu.Wynik TFIDF jest produktem określenie częstotliwości i odwrotny dokumentu częstotliwości, określone jako: TFIDF t termin (częstotliwość T) = * dziennika ((#rows w wejściowy) / (#rows having T))Próg częstotliwości
Określ ile razy wyraz lub frazę musi wystąpić przed wyodrębnianie go.Wartość domyślna to 2.Maksymalna długość termin
Określ maksymalną długość frazę słownie.Ta opcja dotyczy tylko wyrażenia rzeczownikowe.Wartość domyślna to 12.Użyj przypadek-ekstrakcji termin wrażliwe
Określ, czy ekstrakcji przypadek-poufne.Wartością domyślną jest False.Konfigurowanie błąd wyjścia
Użyj Konfigurowanie błąd wyjścia okno dialogowe, aby określić obsługa błędów dla wierszy, które powodują błędy.