의미 없는 단어
전체 텍스트 인덱스가 너무 확장되지 않도록 Microsoft SQL Server에는 검색에 도움이 되지 않지만 자주 사용되는 단어를 무시하는 메커니즘이 있습니다. 이러한 단어를 의미 없는 단어 또는 중지 단어라고 합니다. 의미 없는 단어는 로캘별 의미 없는 단어 파일에 나열됩니다. 예를 들어 영어 로캘의 경우 "a", "and", "is" 및 "the"와 같은 단어는 영어의 의미 없는 단어 파일에 있으며 검색에 도움이 되지 않으므로 전체 텍스트 인덱스에서 제외됩니다. 그러나 전체 텍스트 인덱스는 의미 없는 단어의 위치를 고려합니다. 예를 들어 "Instructions are applicable to these Adventure Works Cycles models"라는 구를 가정합니다. 다음 표에서는 이 구에서의 단어 위치를 설명합니다.
단어 또는 토큰 | 위치 |
---|---|
Instructions |
1 |
are |
2 |
applicable |
3 |
to |
4 |
these |
5 |
Adventure |
6 |
Works |
7 |
Cycles |
8 |
models |
9 |
위치 2, 4, 5에 있는 의미 없는 단어 "are", "to", "these"는 전체 텍스트 인덱스에서 제외됩니다. 그러나 해당 위치 정보는 유지되므로 구의 다른 단어 위치에 영향을 주지 않습니다.
의미 없는 단어 파일은 $SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\ 디렉터리에 있습니다. 전체 텍스트 검색을 지원하도록 SQL Server를 설정하면 이 디렉터리가 만들어지고 의미 없는 단어 파일이 설치됩니다. 의미 없는 단어 파일을 편집할 수 있으므로 예를 들어 하이테크 기업의 시스템 관리자는 "computer"라는 단어를 의미 없는 단어 목록에 추가할 수 있습니다.
중요: |
---|
의미 없는 단어 파일을 편집할 경우 전체 텍스트 카탈로그를 다시 채워야만 변경 내용이 적용됩니다. |
다음 표에서는 의미 없는 단어 파일과 해당 언어를 보여 줍니다.
의미 없는 단어 파일 | 언어 |
---|---|
Noisechs |
중국어(간체) |
Noisecht |
중국어(번체) |
Noisedan |
덴마크어 |
Noisedeu |
독일어 |
Noiseeng |
영국 영어 |
Noiseenu |
미국 영어 |
Noiseesn |
스페인어 |
Noisefra |
프랑스어 |
Noiseita |
이탈리아어 |
Noisejpn |
일본어 |
Noisekor |
한국어 |
Noiseneu |
중립 언어 |
Noisenld |
네덜란드어 |
Noiseplk |
폴란드어 |
Noiseptb |
포르투갈어(브라질) |
Noisepts |
포르투갈어(이베리아) |
Noiserus |
러시아어 |
Noisesve |
스웨덴어 |
Noisetha |
태국어 |
Noisetrk |
터키어 |