Criar um serviço Azure AI Search no portal
O Azure AI Search é uma plataforma de recuperação de informações para a empresa. Ele suporta pesquisa tradicional e pesquisa orientada por IA conversacional para experiências de "bate-papo com seus dados" sobre seu conteúdo proprietário.
A maneira mais fácil de criar um serviço é usando o portal do Azure, que é abordado neste artigo.
Você também pode usar o Azure PowerShell, a CLI do Azure, a API REST de Gerenciamento, um modelo de serviço do Azure Resource Manager, um arquivo Bicep ou Terraform.
Antes de começar
Algumas propriedades de serviço são fixas para o tempo de vida do serviço. Antes de criar o serviço, decida um nome, região e camada.
O nome do serviço torna-se parte do ponto de extremidade da URL. O nome deve ser exclusivo e deve estar em conformidade com as regras de nomenclatura.
A região determina a residência de dados e a disponibilidade de determinados recursos. O classificador semântico e a integração da IA do Azure vêm com requisitos de região. Certifique-se de que a sua região de escolha suporta as funcionalidades de que necessita.
A camada de serviço determina a infraestrutura, os limites de serviço e o faturamento. Alguns recursos não estão disponíveis em níveis inferiores ou especializados.
Subscrever (gratuito ou pago)
A pesquisa paga (ou faturável) ocorre quando você escolhe uma camada faturável (Básica ou superior) ao criar o recurso em uma assinatura faturável do Azure.
Para experimentar o Azure AI Search gratuitamente, abra uma subscrição de avaliação e, em seguida, crie o seu serviço de pesquisa escolhendo o escalão Gratuito. Você pode ter um serviço de pesquisa gratuito por assinatura do Azure. Os serviços de pesquisa gratuitos destinam-se à avaliação a curto prazo do produto para aplicações não produtivas. Geralmente, você pode concluir todos os inícios rápidos e a maioria dos tutoriais, exceto aqueles com classificação semântica (requer um serviço faturável). Os serviços gratuitos que estão inativos por um longo período de tempo podem ser excluídos pela Microsoft para abrir espaço para outros serviços.
Como alternativa, você pode usar créditos gratuitos para experimentar serviços pagos do Azure. Com essa abordagem, você pode criar seu serviço de pesquisa em Basic ou superior para obter mais capacidade. O seu cartão de crédito não será cobrado, a menos que altere explicitamente as suas definições e peça para ser cobrado. Outra abordagem é ativar os créditos do Azure em uma assinatura do Visual Studio. Uma assinatura do Visual Studio oferece créditos todos os meses que você pode usar para serviços pagos do Azure.
Encontre a oferta Azure AI Search
Inicie sessão no portal do Azure.
Selecione (Criar recurso") no canto superior esquerdo.
Use a barra de pesquisa para encontrar "Azure AI Search*.
Escolher uma subscrição
Se tiver mais do que uma subscrição, escolha uma para o seu serviço de pesquisa. Se você estiver implementando a criptografia gerenciada pelo cliente ou se usar outros recursos que dependem de identidades de serviço gerenciado para acesso a dados externos, escolha a mesma assinatura usada para o Cofre de Chaves do Azure ou outros serviços para os quais as identidades gerenciadas são usadas.
Definir um grupo de recursos
Um grupo de recursos é um contêiner que contém recursos relacionados para sua solução do Azure. É útil para consolidar recursos da mesma solução, monitorar custos e verificar a data de criação do seu serviço de pesquisa.
Ao longo do tempo, você pode acompanhar os custos atuais e projetados ou pode visualizar cobranças por recursos individuais. A captura de tela a seguir mostra o tipo de informações de custo que você pode esperar ver quando combina vários recursos em um grupo.
Gorjeta
Os grupos de recursos simplificam a limpeza porque excluir um grupo de recursos exclui tudo o que está dentro dele.
Nomeie o serviço
Em Detalhes da instância, forneça um nome de serviço no campo URL . O nome faz parte do ponto de extremidade contra o qual as chamadas de API são emitidas: https://your-service-name.search.windows.net
. Por exemplo, se você quiser que o ponto de extremidade seja https://myservice.search.windows.net
, insira myservice
.
Requisitos do nome do serviço:
- Exclusivo dentro do namespace search.windows.net
- Entre 2-60 caracteres de comprimento
- Consistem em letras minúsculas, dígitos ou traços (
-
) - Não use traços nos dois primeiros caracteres ou como o último caractere
- Não use traços consecutivos em nenhum lugar
Gorjeta
Se você tiver vários serviços de pesquisa, isso ajudará a incluir a região (ou local) no nome do serviço como uma convenção de nomenclatura. Um nome como mysearchservice-westus
pode salvar uma viagem para a página de propriedades ao decidir como combinar ou anexar recursos.
Escolher uma região
Importante
Devido à alta demanda, o Azure AI Search está atualmente indisponível para novas instâncias em algumas regiões.
Se você usar vários serviços do Azure, colocar todos eles na mesma região minimizará ou anulará as cobranças de largura de banda. Não há cobranças pela saída de dados entre os serviços da mesma região.
Geralmente, escolha uma região perto de você, a menos que as seguintes considerações se apliquem:
A região mais próxima está na sua capacidade. Uma vantagem de usar o portal do Azure para configuração de recursos é que ele fornece apenas as regiões e camadas disponíveis.
Você deseja usar fragmentação e vetorização de dados integradas ou habilidades integradas para enriquecimento de IA. As operações integradas têm requisitos regionais.
Você deseja usar o Armazenamento do Azure para indexação baseada em indexador ou precisa armazenar dados de aplicativos que não estejam em um índice. Estado da sessão de depuração, caches de enriquecimento e armazenamentos de conhecimento são recursos do Azure AI Search que dependem do Armazenamento do Azure. A região escolhida para o Armazenamento do Azure tem implicações para a segurança da rede. Especificamente, se estiver a configurar uma firewall, deve colocar os recursos em regiões separadas. Para obter mais informações, consulte Conexões de saída da Pesquisa de IA do Azure para o Armazenamento do Azure.
Lista de verificação para escolher uma região
O Azure AI Search está disponível em uma região próxima? Verifique a lista de regiões suportadas.
Tem um nível específico em mente? Verifique a disponibilidade da região por camada.
Você tem requisitos de continuidade de negócios e recuperação de desastres (BCDR)? Crie dois ou mais serviços de pesquisa em pares regionais dentro de zonas de disponibilidade. Por exemplo, se você estiver operando na América do Norte, poderá escolher Leste dos EUA e Oeste dos EUA, ou Centro-Norte dos EUA e Centro-Sul dos EUA, para cada serviço de pesquisa.
Você precisa de enriquecimento de IA, fragmentação e vetorização de dados integrados ou pesquisa de imagens multimodal? O Azure AI Search, o Azure OpenAI e o Azure AI multiservice devem coexistir na mesma região.
Comece com as regiões do Azure OpenAI porque ele tem a maior variabilidade. O Azure OpenAI fornece modelos de incorporação e modelos de chat para RAG e vetorização integrada.
Verifique as regiões do Azure AI Search para obter uma correspondência com a sua região do Azure OpenAI. Se você estiver usando OCR, reconhecimento de entidade ou outras habilidades apoiadas pela IA do Azure, a coluna Integração da IA indica se o multisserviço da IA do Azure está na mesma região da Pesquisa de IA do Azure.
Verifique as regiões de incorporação multimodal para APIs multimodais e pesquisa de imagens. Essa API é acessada por meio de uma conta multisserviço do Azure AI, mas está disponível em menos regiões do que o multisserviço do Azure AI em geral.
Regiões com maior sobreposição
Atualmente, as seguintes regiões oferecem entre regiões entre os três serviços (Azure AI Search, Azure OpenAI, Azure AI Vision multimodal). Esta lista não é definitiva e pode haver mais opções além das regiões listadas aqui, dependendo da camada. Além disso, o status da região pode mudar rapidamente, portanto, certifique-se de confirmar a escolha da região antes de instalar.
- Américas: Oeste dos EUA
- Europa: França Central, Norte da Europa, Suécia Central
Escolha um escalão
O Azure AI Search é oferecido em vários níveis de preço: Gratuito, Básico, Standard ou Otimizado de Armazenamento. Cada escalão tem a sua própria capacidade e limites. Há também vários recursos que dependem de camadas.
Analise as descrições da camada para obter características de computação, disponibilidade de recursos e disponibilidade de região.
Basic e Standard são as opções mais comuns para cargas de trabalho de produção, mas muitos clientes começam com o serviço gratuito. Entre as camadas faturáveis, as principais diferenças são o tamanho e a velocidade da partição e os limites do número de objetos que você pode criar.
Os serviços de pesquisa criados após 3 de abril de 2024 têm partições maiores e cotas vetoriais mais altas em todos os níveis faturáveis.
Lembre-se de que um nível de preço não pode ser alterado depois que o serviço é criado. Se você precisar de uma camada superior ou inferior, deverá recriar o serviço.
Criar o serviço
Depois de fornecer as entradas necessárias, vá em frente e crie o serviço.
Seu serviço é implantado em poucos minutos. Você pode monitorar o progresso por meio de notificações do Azure. Considere fixar o serviço ao seu painel para facilitar o acesso no futuro.
Configurar a autenticação
A menos que você esteja usando o portal, o acesso programático ao seu novo serviço requer que você forneça o ponto de extremidade de URL e uma conexão autenticada. Você pode usar uma ou ambas as opções:
Ao configurar uma conexão programática, você precisa do ponto de extremidade do serviço de pesquisa. Na página Visão geral, localize e copie o ponto de extremidade de URL no lado direito da página.
Para definir opções de autenticação, use a página Chaves . A maioria dos guias de início rápido e tutoriais usa chaves de API para simplificar, mas se você estiver configurando um serviço para cargas de trabalho de produção, considere usar funções do Azure. Você pode copiar chaves desta página.
Um ponto de extremidade e uma chave não são necessários para tarefas baseadas em portal. O portal já está vinculado ao seu recurso Azure AI Search com direitos de administrador. Para obter um passo a passo do portal, comece com Guia de início rápido: criar um índice do Azure AI Search no portal.
Dimensionar o serviço
Depois que um serviço de pesquisa é provisionado, você pode dimensioná-lo para atender às suas necessidades. Em uma camada faturável, você pode dimensionar o serviço em duas dimensões: réplicas e partições. Para o serviço gratuito, o escalonamento não está disponível e a configuração de réplica e partição não é oferecida.
As partições permitem ao serviço armazenar e pesquisar mais documentos.
As réplicas permitem ao serviço processar uma carga maior de consultas de pesquisa.
A adição de recursos aumenta a sua fatura mensal. A calculadora de preços pode ajudá-lo a compreender as ramificações de faturação da adição de recursos. Lembre-se de que pode ajustar os recursos com base na carga. Por exemplo, pode aumentar os recursos para criar um índice inicial completo e, em seguida, reduzir recursos mais tarde para um nível mais adequado para a indexação incremental.
Importante
Um serviço tem de ter 2 réplicas para SLA só de leitura e 3 réplicas para SLA de leitura/escrita.
- Aceda à página do serviço de pesquisa no portal do Azure.
- No painel de navegação esquerdo, selecione Definições>Dimensionar.
- Utilize a barra de deslize para adicionar recursos de qualquer tipo.
Quando adicionar um segundo serviço
A maioria dos clientes usa apenas um serviço provisionado em um nível suficiente para a carga esperada. Um serviço pode alojar vários índices, sujeitos aos limites máximos do escalão que selecionar, com os índices isolados uns dos outros. No Azure AI Search, as solicitações só podem ser direcionadas para um índice, minimizando a chance de recuperação acidental ou intencional de dados de outros índices no mesmo serviço.
Embora a maioria dos clientes utilize apenas um serviço, a redundância de serviços pode ser necessária se os requisitos operacionais incluírem o seguinte:
Continuidade de negócios e recuperação de desastres (BCDR). O Azure AI Search não fornece failover instantâneo se houver uma interrupção.
Às vezes, as arquiteturas multilocatárias exigem dois ou mais serviços.
Aplicativos implantados globalmente podem exigir serviços de pesquisa em cada geografia para minimizar a latência.
Nota
No Azure AI Search, não é possível segregar operações de indexação e consulta; Assim, você nunca criaria vários serviços para cargas de trabalho segregadas. Um índice é sempre consultado no serviço em que foi criado (não pode criar um índice num serviço e copiá-lo para outro).
Um segundo serviço não é necessário para alta disponibilidade. A alta disponibilidade para consultas é alcançada quando você usa duas ou mais réplicas no mesmo serviço. As atualizações de réplica são sequenciais, o que significa que pelo menos uma está operacional quando uma atualização de serviço é implementada. Para obter mais informações sobre o tempo de atividade, consulte Contratos de nível de serviço.
Adicionar mais serviços a uma subscrição
O Azure AI Search restringe o número de serviços de pesquisa que você pode criar inicialmente em uma assinatura. Se esgotar o seu limite máximo, pode solicitar mais quota.
Você deve ter permissões de Proprietário ou Colaborador na assinatura para solicitar cota. Dependendo da região e da capacidade do datacenter, você pode solicitar automaticamente mais cotas para adicionar serviços à sua assinatura. Se a solicitação falhar, você deve diminuir o número ou registrar um tíquete de suporte. Para um grande aumento na cota, como mais de 30 serviços extras, você deve esperar um prazo de um mês.
Entre no portal do Azure, procure "cotas" em seu painel e selecione o serviço Cotas .
Na página Visão geral da cota, selecione Pesquisar.
Defina filtros para que você possa revisar a cota existente para serviços de pesquisa na assinatura atual. Recomendamos filtrar por uso.
Encontre a região e a camada que precisa de mais cota e selecione o ícone Editar lápis para iniciar sua solicitação.
Em Detalhes da quota, especifique a localização, o escalão e um novo limite para a sua quota de subscrição. Nenhum dos valores pode estar vazio. O novo limite deve ser superior ao limite atual. Se a capacidade regional for limitada, sua solicitação não será aprovada automaticamente. Nesse cenário, um relatório de incidente é gerado em seu nome para investigação e resolução.
Submeta o pedido.
Monitore as notificações no portal do Azure para atualizações de status sobre o novo limite. A maioria dos pedidos é aprovada em 24 horas.
Próximos passos
Depois de provisionar um serviço, você pode continuar no portal para criar seu primeiro índice.
Quer otimizar e economizar em seus gastos com nuvem?