Parole non significative
Per assicurare l'efficienza dell'indice full-text, Microsoft SQL Server è dotato di un meccanismo che rimuove le parole più frequenti, inutili ai fini della ricerca. Queste parole, definite non significative, sono elencate in file corrispondenti, specifici per le impostazioni internazionali utilizzate. Nelle impostazioni internazionali per la lingua italiana, ad esempio, parole quali "circa", "con", "devo" e "cui" sono contenute nel file delle parole non significative italiane e vengono escluse dall'indice full-text poiché in pratica risultano inutili ai fini della ricerca. L'indice full-text tuttavia tiene conto della loro posizione. Si consideri ad esempio la frase "Istruzioni non valide per questi modelli Adventure Works Cycles". Nella tabella seguente viene illustrata la posizione delle parole nella frase:
Parola o token | Posizione |
---|---|
Istruzioni |
1 |
non |
2 |
valide |
3 |
per |
4 |
questi |
5 |
modelli |
6 |
Adventure |
7 |
Works |
8 |
Cycles |
9 |
Le parole non significative "non", "per" e "questi" nelle posizioni 2, 4 e 5 vengono escluse dall'indice full-text. Le relative informazioni di posizione vengono comunque mantenute, lasciando invariata la posizione delle altre parole nella frase.
I file delle parole non significative si trovano nella directory $SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\. La creazione di questa directory e l'installazione dei file delle parole non significative vengono eseguite durante l'installazione di SQL Server con il supporto della ricerca full-text. È possibile modificare i file delle parole non significative. Gli amministratori di sistema di società che operano nel settore dell'alta tecnologia, ad esempio, possono aggiungere la parola "computer" al loro elenco di parole non significative.
Importante: |
---|
Le modifiche apportate a un file di parole non significative diventano effettive solo dopo il ripopolamento dei cataloghi full-text. |
Nella tabella seguente vengono descritti i file delle parole non significative e le lingue corrispondenti.
File delle parole non significative | Lingua |
---|---|
Noisechs |
Cinese semplificato |
Noisecht |
Cinese tradizionale |
Noisedan |
Danese |
Noisedeu |
Tedesco |
Noiseeng |
Inglese (Regno Unito) |
Noiseenu |
Inglese (Stati Uniti) |
Noiseesn |
Spagnolo |
Noisefra |
Francese |
Noiseita |
Italiano |
Noisejpn |
Giapponese |
Noisekor |
Coreano |
Noiseneu |
Lingua neutra |
Noisenld |
Olandese |
Noiseplk |
Polacco |
Noiseptb |
Portoghese brasiliano |
Noisepts |
Portoghese iberico |
Noiserus |
Russo |
Noisesve |
Svedese |
Noisetha |
Tailandese |
Noisetrk |
Turco |
Vedere anche
Concetti
Nozioni fondamentali sulla ricerca full-text