Editor trasformazione Estrazione termini (Scheda Avanzate)
Usare la scheda Avanzate della finestra di dialogo Editor trasformazione Estrazione termini per specificare le proprietà per l'estrazione, ad esempio la frequenza, la lunghezza e le eventuali parole o frasi da estrarre.
Per ulteriori informazioni sulla trasformazione Estrazione termini, vedere Term Extraction Transformation.
Opzioni
Sostantivo
Consente di specificare che la trasformazione estrarrà solo singoli sostantivi.
Sintagma nominale
Consente di specificare che la trasformazione estrarrà solo sintagmi nominali.
Sostantivo e sintagma nominale
Consente di specificare che la trasformazione estrarrà sia sostantivi che sintagmi nominali.
Frequenza
Consente di specificare che il punteggio è rappresentato dalla frequenza del termine.
TFIDF
Consente di specificare che il punteggio è rappresentato dal valore TFIDF del termine. Il punteggio TFIDF è il prodotto della frequenza dei termini e della frequenza inversa dei documenti, definito come: TFIDF di un termine T = (frequenza di T) * log( (numero di righe nell'input) / (numero di righe contenenti T) )
Soglia di frequenza
Consente di specificare il numero di volte in cui una parola o una frase deve ricorrere prima che venga estratta. Il valore predefinito è 2.
Lunghezza massima termine
Consente di specificare la lunghezza massima in parole di una frase. Questa opzione ha effetto soltanto sui sintagmi nominali. Il valore predefinito è 12.
Estrazione con distinzione maiuscole/minuscole
Consente di specificare se eseguire l'estrazione rilevando la distinzione tra maiuscole e minuscole. Il valore predefinito è False
.
Configura output errori
Usare la finestra di dialogo Configura output errori per specificare la gestione degli errori per le righe che causano errori.
Vedere anche
Guida di riferimento ai messaggi e agli errori di Integration Services
Editor trasformazione Estrazione termini (scheda Estrazione termini)
Editor trasformazione Estrazione termini (scheda Esclusione)
Trasformazione Ricerca termini