Partilhar via


Pesquisa semântica (SQL Server)

A Pesquisa Semântica Estatística fornece uma visão profunda de documentos não estruturados armazenados em bancos de dados SQL Server extraindo e indexando frases-chave estatisticamente relevantes. Portanto, essas frases-chave também são usadas para identificar e indexar documentos semelhantes ou relacionados.

Você consulta esses índices semânticos usando três funções de conjunto de linhas do Transact-SQL para recuperar os resultados como dados estruturados.

O que é possível fazer com a pesquisa semântica?

A pesquisa semântica se baseia no recurso de pesquisa de texto completo existente em SQL Server, mas permite novos cenários que se estendem além de pesquisas palavra-chave. Enquanto a pesquisa de texto completo permite que você consulte as palavras em um documento, a pesquisa semântica permite a consulta do significado do documento. Agora, as soluções possíveis incluem a extração automática de marcas, a descoberta de conteúdo relacionado e a navegação hierárquica por conteúdo semelhante. Por exemplo, você pode consultar o índice de frases-chave para criar a taxonomia para uma organização ou para um corpo de documentos. Ou, você pode consultar o índice de similaridade do documento para identificar os currículos que correspondem a uma descrição do trabalho.

Os exemplos a seguir demonstram os recursos da Pesquisa Semântica.

Localizar as frases-chave em um documento

A consulta a seguir obtém as frases-chave que foram identificadas no documento de exemplo. Apresenta os resultados em ordem decrescente pela contagem que classifica a significância estatística de cada frase-chave. Essa consulta chama a função semantickeyphrasetable (Transact-SQL).

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC  
  

Localizar documentos semelhantes ou relacionados

A consulta a seguir obtém os documentos que foram identificados como semelhantes ou relacionados ao documento de exemplo. Apresenta os resultados em ordem decrescente pela contagem que classifica a semelhança dos 2 documentos. Essa consulta chama a função semmanticsimilaritytable (Transact-SQL).

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC  
  

Localizar as frases-chave que tornam documentos semelhantes ou relacionados

A consulta a seguir obtém as frases-chave que tornam os 2 documentos de exemplo semelhantes ou relacionados a outro documento. Apresenta os resultados em ordem decrescente pela contagem que classifica o peso de cada frase-chave. Essa consulta chama a função semanticsimilaritydetailstable (Transact-SQL).

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC  
  

Armazenando documentos no SQL Server

Antes de indexar documentos com a Pesquisa Semântica, você precisa armazenar os documentos em um banco de dados SQL Server.

O recurso FileTable no SQL Server 2014 faz arquivos e documentos não estruturados cidadãos de primeira classe do banco de dados relacional. Como resultado, os desenvolvedores de banco de dados podem manipular documentos junto com dados estruturados em operações baseadas em conjuntos Transact-SQL.

Para obter mais informações sobre o recurso FileTable, consulte FileTables (SQL Server). Para obter informações sobre o recurso FILESTREAM, que é outra opção para armazenar documentos no banco de dados, consulte FILESTREAM (SQL Server).

Related Tasks

Instalar e configurar a pesquisa semântica
Descreve os pré-requisitos para a pesquisa semântica estatística e como instalá-los ou verificá-los.

Habilitar a pesquisa semântica em tabelas e colunas
Descreve como habilitar ou desabilitar a indexação semântica estatística em colunas selecionadas que contêm documentos ou texto.

Localizar frases chave em documentos com pesquisa semântica
Descreve como localizar as frases chave em documentos ou colunas de texto configuradas para indexação semântica estatística.

Localizar documentos semelhantes e relacionados com a pesquisa semântica
Descreve como localizar documentos ou valores de texto semelhantes ou relacionados, e informações sobre como eles são semelhantes ou relacionados, em colunas configuradas para indexação semântica estatística.

Gerenciar e monitorar a pesquisa semântica
Descreve o processo de indexação semântica e as tarefas relacionadas a monitoramento e gerenciamento dos índices.

Conteúdo relacionado

Pesquisa de semântica DDL, funções, procedimentos armazenados e exibições
Lista as instruções Transact-SQL e os objetos de banco de dados do SQL Server adicionados ou alterados para oferecer suporte à pesquisa semântica estatística.