Recursos do Azure AI Search
O Azure AI Search fornece recuperação de informações e usa a integração opcional de IA para extrair mais valor do texto e do conteúdo vetorial.
A tabela a seguir resume os recursos por categoria. Para obter mais informações sobre como o Azure AI Search se compara com outras tecnologias de pesquisa, consulte Comparar opções de pesquisa.
Há paridade de recursos em todas as nuvens públicas, privadas e soberanas do Azure, mas alguns recursos não são suportados em regiões específicas. Para obter mais informações, consulte Escolher uma região.
Nota
Procurando recursos de visualização? Consulte a lista de funcionalidades de pré-visualização.
Recursos de indexação
Categoria | Funcionalidades |
---|---|
Origens de dados | Os índices de pesquisa podem aceitar texto de qualquer fonte, desde que seja enviado como um documento JSON. Os indexadores são um recurso que automatiza a importação de dados de fontes de dados suportadas para extrair conteúdo pesquisável em armazenamentos de dados primários. Os indexadores lidam com a serialização JSON para você e a maioria suporta alguma forma de deteção de alteração e exclusão. Você pode se conectar a uma variedade de fontes de dados, incluindo OneLake, Banco de Dados SQL do Azure, Azure Cosmos DB ou armazenamento de Blob do Azure. |
Estruturas de dados hierárquicas e aninhadas | Tipos e coleções complexas permitem modelar praticamente qualquer tipo de estrutura JSON dentro de um índice de pesquisa. A cardinalidade um-para-muitos e muitos-para-muitos pode ser expressa nativamente através de coleções, tipos complexos e coleções de tipos complexos. |
Análise linguística | Os analisadores são componentes utilizados para processamento de texto durante as operações de indexação e pesquisa. Por padrão, você pode usar o analisador Lucene padrão de uso geral ou substituir o padrão por um analisador de linguagem, um analisador personalizado que você configura ou outro analisador predefinido que produz tokens no formato necessário. Os analisadores de linguagem da Lucene ou da Microsoft são usados para lidar de forma inteligente com linguística específica da linguagem, incluindo tempos verbais, gênero, substantivos plurais irregulares (por exemplo, 'mouse' vs. 'mouse'), decomposição de palavras, quebra de palavras (para idiomas sem espaços) e muito mais. Os analisadores lexicais personalizados são usados para formulários de consulta complexos, como correspondência fonética e expressões regulares. |
Pesquisa vetorial e híbrida
Categoria | Funcionalidades |
---|---|
Indexação vetorial | Dentro de um índice de pesquisa, adicione campos vetoriais para dar suporte a cenários de pesquisa vetorial. Os campos vetoriais podem coexistir com campos não vetoriais no mesmo documento de pesquisa. |
Consultas vetoriais | Formule consultas vetoriais únicas e múltiplas. |
Algoritmos de pesquisa vetorial | Use o Mundo Pequeno Navegável Hierárquico (HNSW) ou o exaustivo K-Nearest Neighbors (KNN) para encontrar vetores semelhantes em um índice de pesquisa. |
Filtros vetoriais | Aplique filtros antes ou depois da execução da consulta para obter maior precisão durante a recuperação de informações. |
Recuperação de informações híbridas | Pesquise conceitos e palavras-chave em uma única solicitação de consulta híbrida. A pesquisa híbrida consolida a pesquisa vetorial e de texto, com classificação semântica opcional e ajuste de relevância para obter os melhores resultados. |
Fragmentação e vetorização de dados integradas | Fragmentação de dados nativos através da habilidade Divisão de texto. Vetorização nativa por meio de vetorizadores e habilidades de incorporação, como AzureOpenAIEmbeddingModel, Azure AI Vision multimodal e a habilidade AML que você pode usar para se conectar a pontos de extremidade no catálogo de modelos do Azure AI Studio. A vetorização integrada fornece um pipeline de indexação de ponta a ponta de arquivos de origem para consultas. |
Compressão vetorial integrada e quantização | Use a quantização escalar e binária integrada para reduzir o tamanho do índice vetorial na memória e no disco. Você também pode renunciar ao armazenamento de vetores de que não precisa ou atribuir tipos de dados estreitos a campos vetoriais para reduzir os requisitos de armazenamento. |
IA aplicada e mineração de conhecimento
Categoria | Funcionalidades |
---|---|
Processamento de IA durante a indexação | O enriquecimento de IA refere-se ao processamento de imagem e linguagem natural incorporado em um pipeline de indexador que extrai texto e informações de conteúdo que, de outra forma, não pode ser indexado para pesquisa de texto completo. O processamento de IA é conseguido adicionando e combinando habilidades em um conjunto de habilidades, que é então anexado a um indexador. A IA pode ser habilidades internas da Microsoft, como tradução de texto ou Reconhecimento Ótico de Caracteres (OCR), ou habilidades personalizadas que você fornece. |
Armazenamento de conteúdo enriquecido para análise e consumo em cenários sem pesquisa | O armazenamento de conhecimento é o armazenamento persistente de conteúdo enriquecido, destinado a cenários sem pesquisa, como mineração de conhecimento e processamento de ciência de dados. Um repositório de conhecimento é definido em um conjunto de habilidades, mas criado no Armazenamento do Azure como objetos ou conjuntos de linhas tabulares. |
Enriquecimento em cache | O cache de enriquecimento (visualização) refere-se a enriquecimentos armazenados em cache que podem ser reutilizados durante a execução do conjunto de habilidades. O cache é particularmente valioso em conjuntos de habilidades que incluem OCR e análise de imagem, que são caros de processar. |
Texto completo e outros formulários de consulta
Categoria | Funcionalidades |
---|---|
Pesquisa em texto de forma livre | A pesquisa de texto completo é um caso de uso principal para a maioria dos aplicativos baseados em pesquisa. As consultas podem ser formuladas com uma sintaxe suportada. A Sintaxe de consulta simples fornece operadores lógicos, operadores de pesquisa de expressão, operadores de sufixo e operadores de precedência. A sintaxe de consulta Lucene completa inclui todas as operações em sintaxe simples, com extensões para pesquisa difusa, pesquisa de proximidade, aumento de termos e expressões regulares. |
Relevância | A pontuação simples é um benefício fundamental do Azure AI Search. Os perfis de classificação são utilizados para modelar a relevância como uma função de valores nos próprios documentos. Por exemplo, pode querer que produtos mais recentes ou produtos em desconto apareçam mais em cima nos resultados da pesquisa. Também pode criar perfis de classificação com etiquetas para uma classificação personalizada baseada nas preferências de pesquisa dos clientes que acompanhou e armazenou em separado. O classificador semântico é um recurso premium que reclassifica os resultados com base na relevância semântica para a consulta. Dependendo do seu conteúdo e cenário, ele pode melhorar significativamente a relevância da pesquisa com configuração ou esforço quase mínimo. |
Pesquisa geoespacial | As funções geoespaciais filtram e combinam em coordenadas geográficas. Você pode corresponder à distância ou por inclusão em uma forma de polígono. |
Filtros e facetas | A Navegação por facetas é ativada através de um parâmetro de consulta simples. O Azure AI Search retorna uma estrutura de navegação facetada que você pode usar como o código por trás de uma lista de categorias, para filtragem autodirigida (por exemplo, para filtrar itens de catálogo por faixa de preço ou marca). Os Filtros podem ser utilizados para incorporar a navegação por facetas na IU da sua aplicação, melhorar a formulação de consulta e filtrar com base em critérios especificados pelo utilizador ou programador. Criar filtros com a sintaxe OData. |
Experiência de utilizador | O preenchimento automático pode ser ativado para consultas de digitação antecipada em uma barra de pesquisa. As Sugestões de pesquisa também funcionam em entradas de texto parciais numa barra de pesquisa, mas os resultados são documentos reais no seu índice, em vez de termos de consulta. Os Sinónimos associam termos equivalentes que expandem implicitamente o âmbito de uma consulta, sem que o utilizador tenha de indicar os termos alternativos. O Detetor de ocorrências aplica a formatação de texto a uma palavra-chave correspondente nos resultados de pesquisa. Pode escolher quais os campos que devolvem fragmentos destacados. A ordenação é disponibilizado para vários campos através do esquema de índice e, em seguida, ativada/desativada durante a consulta com um único parâmetro de procura. A paginação e a limitação dos resultados da pesquisa são simples com o controle ajustado que o Azure AI Search oferece sobre os resultados da pesquisa. |
Funcionalidades de segurança
Categoria | Funcionalidades |
---|---|
Encriptação de dados | A encriptação em repouso gerida pela Microsoft está incorporada na camada de armazenamento interno e é irrevogável. As chaves de criptografia gerenciadas pelo cliente que você cria e gerencia no Cofre de Chaves do Azure podem ser usadas para criptografia suplementar de índices e mapas de sinônimos. Para serviços criados após 1º de agosto de 2020, a criptografia CMK se estende a dados em discos temporários, para criptografia dupla total de conteúdo indexado. |
Endpoint protection | As regras de IP para suporte de firewall de entrada permitem configurar intervalos de IP nos quais o serviço de pesquisa aceitará solicitações. Crie um ponto de extremidade privado usando o Azure Private Link para forçar todas as solicitações por meio de uma rede virtual. |
Acesso de entrada | O controle de acesso baseado em função atribui funções a usuários e grupos no Microsoft Entra ID para acesso controlado a conteúdo e operações de pesquisa. Você também pode usar a autenticação baseada em chave se não quiser usar atribuições de função. |
Segurança de saída (indexadores) | O acesso a dados por meio de pontos de extremidade privados permite que um indexador se conecte aos recursos do Azure protegidos por meio do Azure Private Link. O acesso a dados usando uma identidade confiável significa que as cadeias de conexão com fontes de dados externas podem omitir nomes de usuário e senhas. Quando um indexador se conecta à fonte de dados, o recurso permite a conexão se o serviço de pesquisa tiver sido registrado anteriormente como um serviço confiável. |
Funcionalidades do portal
Categoria | Funcionalidades |
---|---|
Ferramentas para criação de protótipos e inspeção | Adicionar índice é um designer de índice no portal que você pode usar para criar um esquema básico que consiste em campos atribuídos e algumas outras configurações. Depois de salvar o índice, você pode preenchê-lo usando um SDK ou a API REST para fornecer os dados. O assistente de importação de dados cria índices, indexadores, conjuntos de habilidades e definições de fonte de dados. Se seus dados existirem no Azure, esse assistente poderá economizar tempo e esforço significativos, especialmente para investigação e exploração de prova de conceito. Importar e vetorizar dados cria um pipeline de indexação completo que inclui fragmentação e vetorização de dados. O assistente cria todos os objetos e definições de configuração. O explorador de pesquisa é usado para testar consultas e refinar perfis de pontuação. Criar aplicativo de demonstração é usado para gerar uma página HTML que pode ser usada para testar a experiência de pesquisa. Debug Sessions é um editor visual que permite depurar um conjunto de habilidades interativamente. Ele mostra dependências, saídas e transformações. |
Monitorização e diagnóstico | Habilite os recursos de monitoramento para ir além das métricas rápidas que estão sempre visíveis no portal. As métricas de consultas por segundo, latência e limitação são capturadas e relatadas nas páginas do portal sem necessidade de configuração extra. |
Programabilidade
Categoria | Funcionalidades |
---|---|
REST | A API REST de serviço destina-se a operações de plano de dados, incluindo todas as operações relacionadas à indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de cliente para recuperar informações e estatísticas do sistema. A API REST de gerenciamento é para criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
SDK do Azure para .NET | Azure.Search.Documents destina-se a operações de plano de dados, incluindo todas as operações relacionadas com indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de cliente para recuperar informações e estatísticas do sistema. Microsoft.Azure.Management.Search destina-se à criação e provisionamento de serviços através do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
SDK do Azure para Java | com.azure.search.documents destina-se a operações de plano de dados, incluindo todas as operações relacionadas com indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de cliente para recuperar informações e estatísticas do sistema. com.microsoft.azure.management.search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
SDK do Azure para Python | azure-search-documents destina-se a operações de plano de dados, incluindo todas as operações relacionadas com indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de cliente para recuperar informações e estatísticas do sistema. azure-mgmt-search destina-se à criação e provisionamento de serviços através do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |
SDK do Azure para JavaScript/TypeScript | azure/search-documents destina-se a operações de plano de dados, incluindo todas as operações relacionadas com indexação, consultas e enriquecimento de IA. Você também pode usar essa biblioteca de cliente para recuperar informações e estatísticas do sistema. azure/arm-search destina-se à criação e provisionamento de serviços por meio do Azure Resource Manager. Você também pode usar essa API para gerenciar chaves e capacidade. |