Udostępnij za pośrednictwem


Edytor transformacji ekstrakcji termin (karta Zaawansowane)

Użyj Zaawansowane karcie termin wyodrębnićjonów transformacji edytora okno dialogowe, aby określić właściwości dla wyodrębnićjonów, takie jak częstotliwość, długość i czy wyodrębnić wyrazy lub frazy.

Aby dowiedzieć się więcej o transformacja termin ekstrakcji, zobacz Termin ekstrakcji transformacji.

Opcje

  • Rzeczownik
    Należy określić, że transformacja wyodrębnia tylko pojedyncze rzeczowniki.

  • Rzeczownik frazy
    Należy określić, że transformacja wyodrębnia tylko wyrażenia rzeczownikowe.

  • Rzeczownik i frazy rzeczownik
    Należy określić, że transformacja wyodrębnia rzeczowniki i wyrażenia rzeczownikowe.

  • Częstotliwość
    Określa, że wynik jest częstotliwość termin.

  • TFIDF
    Należy określić, że wynik jest wartością TFIDF terminu.Wynik TFIDF jest produktem określenie częstotliwości i odwrotny dokumentu częstotliwości, określone jako: TFIDF t termin (częstotliwość T) = * dziennika ((#rows w wejściowy) / (#rows having T))

  • Próg częstotliwości
    Określ ile razy wyraz lub frazę musi wystąpić przed wyodrębnianie go.Wartość domyślna to 2.

  • Maksymalna długość termin
    Określ maksymalną długość frazę słownie.Ta opcja dotyczy tylko wyrażenia rzeczownikowe.Wartość domyślna to 12.

  • Użyj przypadek-ekstrakcji termin wrażliwe
    Określ, czy ekstrakcji przypadek-poufne.Wartością domyślną jest False.

  • Konfigurowanie błąd wyjścia
    Użyj Konfigurowanie błąd wyjścia okno dialogowe, aby określić obsługa błędów dla wierszy, które powodują błędy.