Criar um serviço de Pesquisa de IA do Azure no portal do Azure
A Pesquisa de IA do Azure é uma plataforma de recuperação de informações para a empresa. Ele dá suporte à pesquisa tradicional e à pesquisa de conversação controlada por IA para experiências de "chat com seus dados" em todo o seu conteúdo proprietário.
A maneira mais fácil de criar um serviço de pesquisa é por meio do portal do Azure, que é abordado nesse artigo.
Também é possível usar:
- PowerShell do Azure
- CLI do Azure
- API REST de gerenciamento
- Modelo do Azure Resource Manager
- Bicep
- Terraform
Antes de começar
Algumas propriedades são fixas durante o tempo de vida do serviço de pesquisa. Antes de criar seu serviço, decida as seguintes propriedades:
Propriedade | Descrição |
---|---|
Nome | Torna-se parte da URL do ponto de extremidade. O nome deve ser exclusivo e seguir as regras de nomenclatura. |
Região | Determina a residência de dados e a disponibilidade de determinados recursos. Por exemplo, o classificador semântico e a integração com a IA do Azure têm requisitos de região. Escolha uma região que dê suporte aos recursos necessários. |
Camada | Determina infraestrutura, limites de serviço e cobrança. Alguns recursos não estão disponíveis em camadas inferiores ou especializadas. |
Assine o Azure
A Pesquisa de IA do Azure requer uma assinatura gratuita ou de pagamento conforme o uso do Azure.
Para experimentar a Pesquisa de IA do Azure gratuitamente, inicie uma assinatura de avaliação e, em seguida, crie seu serviço de pesquisa na Camada Gratuita. Cada assinatura do Azure pode ter um serviço de pesquisa gratuito, que se destina à avaliação de curto prazo e não produção do produto. Você pode concluir todos os nossos inícios rápidos e a maioria dos nossos tutoriais na Camada Gratuita. Para obter mais informações, confira Experimentar a Pesquisa de IA do Azure gratuitamente.
Importante
Para abrir espaço para outros serviços, a Microsoft poderá excluir serviços gratuitos que estejam inativos por um longo período de tempo.
Localizar a oferta da IA do Azure Search
Entre no portal do Azure.
No canto superior esquerdo do painel, selecione Criar um recurso.
Use a caixa de pesquisa para encontrar Pesquisa de IA do Azure.
Escolha uma assinatura
Se você tiver várias assinaturas do Azure, escolha uma para o seu serviço de pesquisa.
Se você estiver implementando a criptografia gerenciada pelo cliente ou usando outros recursos que dependem de identidades de serviço gerenciadas para acesso a dados externos, escolha a mesma assinatura que você usa para o Azure Key Vault ou outros serviços que usam identidades gerenciadas.
Definir um grupo de recursos
Um grupo de recursos é um contêiner que mantém os recursos relacionados a uma solução do Azure. Use-o para consolidar recursos da mesma solução, monitorar custos e verificar a data de criação do seu serviço de pesquisa.
Com o tempo, você poderá acompanhar os custos atuais e projetados para recursos individuais e para o grupo de recursos geral. A captura de tela a seguir mostra as informações de custo disponíveis quando você combina vários recursos em um grupo:
Nomeie seu serviço
Insira um nome para o serviço de pesquisa. O nome faz parte do ponto de extremidade na qual as chamadas à API são emitidas: https://your-service-name.search.windows.net
. Por exemplo, se você inserir myservice
, o ponto de extremidade se tornará https://myservice.search.windows.net
.
Ao nomear seu serviço, siga estas regras:
- Use um nome exclusivo no namespace
search.windows.net
. - Use entre 2 e 60 caracteres.
- Use apenas letras minúsculas, dígitos e traços (-).
- Não use traços como os dois primeiros caracteres ou o último caractere.
- Não use traços consecutivos.
Dica
Se você tiver vários serviços de pesquisa, é útil incluir a região no nome do serviço. Por exemplo, ao decidir como combinar ou anexar recursos, o nome myservice-westus
pode economizar uma viagem à página Propriedades.
Escolha uma região
Importante
Devido à alta demanda, a Pesquisa de IA do Azure está atualmente indisponível para novas instâncias em algumas regiões.
Se você estiver usando vários serviços do Azure, colocar todos eles na mesma região minimizará ou anulará os encargos de largura de banda. Não há encargos para saída de dados entre serviços de mesma região.
Na maioria dos casos, escolha uma região próxima a você, a menos que se aplique uma das seguintes condições:
Sua região mais próxima está no limite de capacidade. O portal do Azure tem a vantagem de ocultar regiões e camadas indisponíveis durante a instalação do recurso.
Você deseja usar o agrupamento e a vetorização de dados integrados ou habilidades internas para enriquecimento de IA. As operações integradas têm requisitos de região.
Você deseja usar o Armazenamento do Microsoft Azure para indexação baseada em indexador ou deseja armazenar dados de aplicativos que não estão em um índice. O estado da sessão de depuração, os caches de enriquecimento e os repositórios de conhecimento são recursos da Pesquisa de IA do Azure que dependem do Armazenamento do Microsoft Azure. A região escolhida para o Armazenamento do Microsoft Azure tem implicações para a segurança de rede. Se você estiver configurando um firewall, deverá colocar os recursos em regiões separadas. Para obter mais informações, confira Conexões de saída da Pesquisa de IA do Azure para o Armazenamento do Microsoft Azure.
Lista de verificação para escolher uma região
A Pesquisa de IA do Azure está disponível em alguma região próxima? Verifique a lista de regiões com suporte.
Você tem um nível específico em mente? Verifique a disponibilidade da região por nível.
Você tem requisitos de continuidade dos negócios e recuperação de desastres (BCDR)? Crie dois ou mais serviços de pesquisa em pares regionais dentro das zonas de disponibilidade. Por exemplo, se estiver operando na América do Norte, será possível escolher Leste dos EUA e Oeste dos EUA ou Centro-Norte dos EUA e Centro-Sul dos EUA para cada serviço de pesquisa.
Você precisa de Enriquecimento de IA de IA, fragmentação e vetorização de dados integrados ou pesquisa de imagem multimodal? A Pesquisa de IA do Azure, o OpenAI do Azure e o Multisserviço de IA do Azure devem coexistir na mesma região.
Comece pelas regiões do Azure OpenAI, pois elas têm a maior variabilidade. O OpenAI do Azure fornece modelos de inserção e modelos de chat para RAG e vetorização integrada.
Verifique as regiões da Pesquisa de IA do Azure para uma correspondência com sua região do OpenAI do Azure. Se você estiver usando OCR, reconhecimento de entidade ou outras habilidades com suporte da IA do Azure, a coluna Integração de serviços de IA indicará se o multisserviço da IA do Azure e a Pesquisa de IA do Azure estão na mesma região.
Verifique as regiões de inserção multimodal para APIs multimodais e pesquisa de imagem. Essa API é acessada por meio de uma conta multisserviço da IA do Azure, mas, em geral, está disponível em menos regiões do que o multisserviço da IA do Azure.
Regiões com mais sobreposição
Atualmente, as seguintes regiões oferecem disponibilidade entre regiões para Pesquisa de IA do Azure, Azure OpenAI e Visão de IA do Azure multimodal:
- Américas: Oeste e Leste dos EUA
- Europa: Norte da Suíça e Suécia Central
Essa lista não é definitiva e, dependendo da sua camada, você poderá ter mais opções. O status da região também pode mudar rapidamente, portanto, confirme sua escolha de região antes de criar seu serviço de pesquisa.
Escolha uma faixa
A Pesquisa de IA do Azure é oferecida em vários tipos de preço:
- Grátis
- Basic
- Standard
- Otimizado para armazenamento
Cada camada tem sua própria capacidade e limites, e alguns recursos dependem da camada. Para obter informações sobre características de computação, disponibilidade de recursos e disponibilidade de regiões, confira Escolher uma camada de serviço para Pesquisa de IA do Azure.
As camadas Básica e Standard são as mais comuns para cargas de trabalho de produção, mas muitos clientes começam com a camada Gratuita. As camadas faturáveis diferem principalmente no tamanho da partição, na velocidade da partição e nos limites do número de objetos que você pode criar.
Observação
- Você não pode alterar a camada após a criação do serviço de pesquisa, portanto, escolha com cuidado.
- Os serviços de pesquisa criados após 03/04/2024 têm partições maiores e cotas de vetor mais altas em cada transferência faturável.
Criar seu serviço
Depois de fornecer as entradas necessárias, crie seu serviço de pesquisa.
Seu serviço é implantado em minutos e você pode monitorar o andamento com as notificações do Azure. Considere a possibilidade de fixar o serviço no painel para facilitar o acesso no futuro.
Configurar autenticação
Quando você cria um serviço de pesquisa, a autenticação baseada em chave é o padrão, mas não é a opção mais segura. Recomendamos que você o substitua pelo acesso baseado em função.
Para habilitar o acesso baseado em função para o seu serviço:
Acesse seu serviço de pesquisa no portal do Azure.
No painel à esquerda, selecione Configurações>Chaves. Você pode se conectar ao seu serviço usando chaves de API, funções do Azure ou ambos. Selecione Ambos até atribuir funções, após o que você poderá selecionar Controle de acesso baseado em função.
Dimensione seu serviço
Após implantar seu serviço de pesquisa, você pode escalá-lo para atender às suas necessidades. A Pesquisa de IA do Azure oferece duas dimensões de escala: réplicas e partições. As réplicas permitem que seu serviço lide com uma carga maior de consultas de pesquisa, enquanto as partições permitem que seu serviço armazene e pesquise mais documentos.
A escala está disponível apenas em camadas faturáveis. Na camada Gratuita, você não pode escalar seu serviço ou configurar réplicas e partições.
Importante
Seu serviço deve ter duas réplicas para SLA somente leitura e três réplicas para SLA de leitura/gravação.
A adição de recursos aumentará sua fatura mensal. Use a calculadora de preços para entender as implicações de cobrança. Você pode ajustar os recursos com base na carga, como aumentar os recursos para indexação inicial e diminuí-los posteriormente para indexação incremental.
Para escalonar seu serviço:
Acesse seu serviço de pesquisa no portal do Azure.
No painel à esquerda, selecione Configurações>Escala.
Use os controles deslizantes para adicionar réplicas e partições.
Quando adicionar um segundo serviço
A maioria dos clientes usa um único serviço de pesquisa em uma camada suficiente para a carga esperada. Um serviço pode hospedar vários índices, cada um isolado dos outros, dentro dos limites máximos da camada escolhida. Na Pesquisa de IA do Azure, você pode direcionar solicitações para apenas um índice, reduzindo a chance de recuperar dados de outros índices no mesmo serviço.
No entanto, você pode precisar de um segundo serviço para os seguintes requisitos operacionais:
- BCDR (continuidade dos negócios e recuperação de desastres). Se houver uma interrupção, a Pesquisa de IA do Azure não fornecerá failover instantâneo.
- Arquiteturas multilocatário que exigem dois ou mais serviços.
- Aplicativos implantados globalmente que exigem serviços em cada geografia para minimizar a latência.
Observação
Na Pesquisa de IA do Azure, você não pode separar as operações de indexação e consulta, portanto, não crie vários serviços para cargas de trabalho separadas. Um índice sempre é consultado no serviço em que foi criado e não é possível copiar um índice para outro serviço.
Um segundo serviço não é necessário para alta disponibilidade. Você obtém alta disponibilidade para consultas usando duas ou mais réplicas no mesmo serviço. Como as réplicas são atualizadas sequencialmente, pelo menos uma está operacional quando uma atualização de serviço é implementada. Para obter mais informações sobre tempo de atividade, consulte Contratos de Nível de Serviço.
Adicione mais serviços à sua assinatura
A Pesquisa de IA do Azure limita o número de serviços de pesquisa que você pode criar inicialmente em uma assinatura. Se você atingir o limite, poderá solicitar mais cotas.
Você deve ter permissões de Proprietário ou Colaborador para a assinatura para solicitar cota. Dependendo da sua região e da capacidade do data center, talvez você consiga solicitar cota automaticamente para adicionar serviços à sua assinatura. Se a solicitação falhar, reduza o número ou registre um tíquete de suporte. Espere um prazo de um mês para um grande aumento de cota, como mais de 30 serviços extras.
Para solicitar mais cota de assinatura:
Acesse seu painel no portal do Azure.
Use a caixa de pesquisa para encontrar o serviço Cotas.
Na guia Visão geral, selecione o bloco Pesquisar.
Defina filtros para examinar a cota existente para serviços de pesquisa na sua assinatura atual. É recomendável filtrar por uso.
Ao lado do nível e da região que precisam de mais cotas, selecione Solicitar ajuste
.
Em Nova Solicitação de Cota, insira um novo limite para a cota da sua assinatura. O novo limite deve ser maior que o limite atual. Se a capacidade regional estiver limitada, sua solicitação não será aprovada automaticamente e um relatório de incidentes será gerado em seu nome para investigação e resolução.
Envie sua solicitação.
Monitore as notificações no portal do Azure para atualizações sobre o novo limite. A maioria das solicitações é aprovada dentro de 24 horas.
Próximas etapas
Agora que você implantou seu serviço de pesquisa, continue no portal do Azure para criar seu primeiro índice:
Deseja otimizar e reduzir seus gastos com a nuvem?