Установка полнотекстового поиска SQL Server в Linux
Область применения: SQL Server — Linux
Следующие действия по установке полнотекстового поиска (mssql-server-fts) в Linux. Полнотекстовый поиск позволяет выполнять полнотекстовые запросы к символьным данным в таблицах SQL Server. Известные проблемы с этим выпуском см. в заметках о выпуске SQL Server 2022 в Linux.
Примечание.
Перед установкой полнотекстового поиска SQL Server сначала установите SQL Server. Это позволит настроить ключи и репозитории, которые следует использовать при установке пакета mssql-server-fts.
Установите полнотекстовый поиск SQL Server для своей платформы:
Используйте следующую команду для установки mssql-server-fts в Red Hat Enterprise Linux.
sudo yum install -y mssql-server-fts
Если у вас уже есть mssql-server-fts, можно обновить пакет до последней версии, выполнив следующие команды:
sudo yum check-update
sudo yum update mssql-server-fts
Если вам нужна автономная установка, найдите пакет полнотекстового поиска в заметках о выпуске SQL Server 2022 в Linux. Затем выполните действия по автономной установке, описанные в статье Установка SQL Server.
Поддерживаемые языки
В полнотекстовом поиске используются средства разбиения текста по словам, позволяющие определять отдельные слова на основе языка. Список зарегистрированных разбиений по словам можно получить, запрашивая sys.fulltext_languages
представление каталога. С SQL Server устанавливаются средства разбиения текста по словам для указанных далее языков.
Язык | Код языка |
---|---|
Нейтральные | 0 |
Арабский | 1025 |
Bengali (India) | 1093 |
Букмол | 1044 |
португальский (Бразилия) | 1046 |
British English | 2057 |
Болгарский | 1026 |
Каталанский | 1027 |
Китайский (Гонконг, КНР) | 3076 |
Chinese (Macao SAR) | 5124 |
Chinese (Singapore) | 4100 |
Хорватский | 1050 |
чешский | 1029 |
датский | 1030 |
Голландский | 1043 |
Английский | 1033 |
Французский | 1036 |
Немецкий | 1031 |
Греческий | 1032 |
Гуджарати | 1095 |
Иврит | 1037 |
Хинди | 1081 |
Исландский | 1039 |
Индонезийский | 1057 |
Итальянский | 1040 |
Японский | 1041 |
Каннада | 1099 |
Корейский | 1042 |
Латышский | 1062 |
Литовский | 1063 |
Малайский - Малайзия | 1086 |
Малаялам | 1 100 |
Маратхи | 1102 |
Польский | 1045 |
Португальский | 2070 |
Панджаби | 1094 |
Румынский | 1048 |
русский | 1049 |
Сербский (кириллица) | 3098 |
Сербский (латиница) | 2074 |
Упрощенный китайский | 2052 |
Словацкий | 1051 |
Словенский | 1060 |
Испанский | 3082 |
Шведский | 1053 |
Тамильский | 1097 |
Телугу | 1098 |
Тайский | 1054 |
Традиционный китайский | 1028 |
Турецкий | 1055 |
Украинский | 1058 |
Урду | 1056 |
Вьетнамский | 1066 |
Фильтры
Полнотекстовый поиск также работает с текстом, хранящимся в двоичных файлах. Но в этом случае для обработки файла требуется установленный фильтр. Дополнительные сведения о фильтрах см. в статье Настройка поисковых фильтров и управление ими.
Список установленных фильтров можно просмотреть путем вызова sp_help_fulltext_system_components 'filter'
. Для SQL Server установлены указанные далее фильтры.
Название компонента | Идентификатор класса | Версия |
---|---|---|
.a |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ans |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.asc |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ascx |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.asm |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.asp |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.aspx |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.asx |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.bas |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.bat |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.bcp |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.c |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.cc |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.cls |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.cmd |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.cpp |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.cs |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.csa |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.css |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.csv |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.cxx |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.dbs |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.def |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.dic |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.dos |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.dsp |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.dsw |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ext |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.faq |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.fky |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.h |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.hhc |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.hpp |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.hta |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htm |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.html |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htt |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htw |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.htx |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.hxx |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.i |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.ibq |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.ics |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.idl |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.idq |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.inc |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.inf |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.ini |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.inl |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.inx |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.jav |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.java |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.js |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.kci |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.lgn |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.log |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.lst |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.m3u |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.mak |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.mk |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.odc |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.odh |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.odl |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.pkgdef |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.pkgundef |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.pl |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.prc |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.rc |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.rc2 |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.rct |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.reg |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.rgs |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.rtf |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.rul |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.s |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.scc |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.shtm |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.shtml |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.snippet |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.sol |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.sor |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.srf |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.stm |
E0CA5340-4534-11CF-B952-00AA0051FE20 | 12.0.6828.0 |
.tab |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.tdl |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.tlh |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.tli |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.trg |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.txt |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.udf |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.udt |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.url |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.usr |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vbs |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.viw |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsct |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsixlangpack |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsixmanifest |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vspscc |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vsscc |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.vssscc |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.wri |
C1243CA0-BF96-11CD-B579-08002B30BFEB | 12.0.6828.0 |
.wtx |
C7310720-AC80-11D1-8DF3-00C04FB6EF4F | 12.0.6828.0 |
.xml |
41B9BE05-B3AF-460C-BF0B-2CDD44A093B1 | 12.0.9735.0 |
Семантический поиск
Семантический поиск основан на функции полнотекстового поиска и предназначен для извлечения и индексирования статистически релевантных ключевых фраз. Эта функция позволяет запрашивать значение в документах в базе данных. Кроме того, с его помощью можно находить похожие документы.
Чтобы использовать семантический поиск, необходимо сначала восстановить базу данных статистики языка семантики на компьютере.
Воспользуйтесь программой sqlcmd и выполните следующую команду Transact-SQL на экземпляре SQL Server Linux. Эта команда восстанавливает базу данных статистики языка.
RESTORE DATABASE [semanticsdb] FROM DISK = N'/opt/mssql/misc/semanticsdb.bak' WITH FILE = 1, MOVE N'semanticsdb' TO N'/var/opt/mssql/data/semanticsDB.mdf', MOVE N'semanticsdb_log' TO N'/var/opt/mssql/data/semanticsdb_log.ldf', NOUNLOAD, STATS = 5; GO
Примечание.
При необходимости обновите пути в предыдущей
RESTORE
команде, чтобы настроить конфигурацию.Чтобы зарегистрировать базу данных семантической статистики языка, выполните следующую команду Transact-SQL.
EXECUTE sp_fulltext_semantic_register_language_statistics_db @dbname = N'semanticsdb'; GO