Escolher uma camada de serviço para o Azure AI Search
Parte da criação de um serviço de pesquisa é escolher um nível de preço (ou SKU) fixo para o tempo de vida do serviço. No portal do Azure, a camada é especificada na página Selecionar Camada de Preço quando você cria o serviço. No PowerShell ou na CLI do Azure, a camada é especificada por meio do -Sku
parâmetro.
O nível determina:
- Número máximo de índices e outros objetos permitidos no serviço
- Tamanho e velocidade das partições (armazenamento físico)
- Taxa faturável como um custo mensal fixo, mas também um custo incremental se você adicionar capacidade
Em alguns casos, a camada escolhida determina a disponibilidade de recursos premium.
As taxas de cobrança são mostradas na página Selecionar Nível de Preço do portal do Azure. Você pode verificar a página de preços para tarifas regionais e revisar Planejar e gerenciar custos para saber mais sobre o modelo de faturamento.
Nota
Os serviços de pesquisa criados após 3 de abril de 2024 têm partições maiores e cotas vetoriais mais altas em quase todos os níveis. Para obter mais informações, consulte Limites de serviço.
Descrições dos níveis
Os níveis incluem Gratuito, Básico, Standard e Otimizado para armazenamento. Standard e Storage Optimized estão disponíveis com várias configurações e capacidades. A captura de tela a seguir do portal do Azure mostra as camadas disponíveis, menos os preços (que você pode encontrar no portal do Azure e na página de preços).
Free cria um serviço de pesquisa limitado para projetos menores, como a execução de tutoriais e exemplos de código. Internamente, os recursos do sistema são compartilhados entre vários assinantes. Não é possível dimensionar um serviço gratuito, executar cargas de trabalho significativas e alguns recursos premium não estão disponíveis. Você só pode ter um serviço de pesquisa gratuito por assinatura do Azure. Se o serviço estiver inativo por um longo período de tempo, ele poderá ser excluído para liberar capacidade, especialmente se a região estiver sob restrições de capacidade.
Os níveis faturáveis mais usados incluem:
O Basic tem a capacidade de cumprir o SLA com seu suporte para três réplicas.
Standard (S1, S2, S3) é o padrão. Ele oferece mais flexibilidade no dimensionamento para cargas de trabalho. Você pode dimensionar partições e réplicas. Com recursos dedicados sob seu controle, você pode implantar projetos maiores, otimizar o desempenho e aumentar a capacidade.
Alguns níveis são projetados para certos tipos de trabalho:
Standard 3 High Density (S3 HD) é um modo de hospedagem para o S3, onde o hardware subjacente é otimizado para um grande número de índices menores e destina-se a cenários de multilocação. O S3 HD tem a mesma carga por unidade que o S3, mas o hardware é otimizado para leituras rápidas de arquivos em um grande número de índices menores.
Os níveis otimizados para armazenamento (L1, L2) oferecem maior capacidade de armazenamento a um preço mais baixo por TB do que os níveis Standard. Essas camadas são projetadas para índices grandes que não mudam com muita frequência. A principal compensação é a maior latência de consulta, que você deve validar para seus requisitos específicos de aplicativo.
Você pode saber mais sobre as várias camadas na página de preços, no artigo Limites de serviço na Pesquisa de IA do Azure e na página do portal do Azure quando estiver provisionando um serviço.
Disponibilidade da região por nível
A lista de regiões com suporte fornece os locais onde o Azure AI Search é oferecido.
Atualmente, várias regiões estão na capacidade para níveis específicos e não podem ser usadas para novos serviços de pesquisa. Se você usar o portal do Azure para criar um serviço de pesquisa, o portal do Azure excluirá quaisquer combinações de camada de região que não estejam disponíveis.
País/Região | Nível desativado (SKU) devido ao excesso de capacidade | Alternativa sugerida |
---|---|---|
E.U.A. Leste 2 | Básico, S1 | E.U.A. Central |
E.U.A. Centro-Sul | Todos os níveis | E.U.A. Central |
US Gov - Virginia | Todos os níveis | US Gov - Arizona |
Europa Ocidental | Todos os níveis | Suécia Europa Central/Norte |
EUA Oeste 3 | Básico, S1 | E.U.A. Central |
Europa do Norte | S2, S3, S3 HD, L1, L2 | Sul do Reino Unido |
Disponibilidade de recursos por camada
A maioria dos recursos está disponível em todos os níveis, incluindo o nível gratuito. Em alguns casos, a camada determina a disponibilidade de um recurso. A tabela a seguir descreve as restrições.
Caraterística | Considerações de nível |
---|---|
indexadores | Os indexadores não estão disponíveis no S3 HD. Os indexadores têm mais limitações no nível gratuito. |
parâmetro de configuração do indexador executionEnvironment |
A capacidade de fixar todo o processamento do indexador apenas nos clusters de pesquisa alocados ao seu serviço de pesquisa requer S2 e superior. |
Enriquecimento da IA | É executado no nível Gratuito, mas não recomendado. |
Identidades gerenciadas ou confiáveis para acesso de saída (indexador) | Não disponível no nível Gratuito. |
Chaves de criptografia gerenciadas pelo cliente | Não disponível no nível Gratuito. |
Acesso a firewall IP | Não disponível no nível Gratuito. |
Ponto de extremidade privado (integração com o Azure Private Link) | Para conexões de entrada a um serviço de pesquisa, não disponível no nível Gratuito. Para conexões de saída de indexadores com outros recursos do Azure, não disponíveis em Free ou S3 HD. Para indexadores que usam conjuntos de habilidades, não disponível em Free, Basic, S1 ou S3 HD. |
Zonas de Disponibilidade | Não disponível no nível Gratuito ou Básico. |
Classificador semântico | Não disponível no nível Gratuito. |
Recursos que consomem muitos recursos podem não funcionar bem, a menos que você dê capacidade suficiente. Por exemplo, o enriquecimento de IA tem habilidades de longa duração que expiram em um serviço gratuito, a menos que o conjunto de dados seja pequeno.
Limites superiores
As camadas determinam o armazenamento máximo do próprio serviço, além do número máximo de índices, indexadores, fontes de dados, conjuntos de habilidades e mapas de sinônimos que você pode criar. Para obter uma análise completa de todos os limites, consulte Limites de serviço na Pesquisa de IA do Azure.
Tamanho e velocidade da partição
O preço do nível inclui detalhes sobre o armazenamento por partição, que varia de 15 GB para níveis básicos e até 2 TB para níveis otimizados para armazenamento (L2). Outras características de hardware, como velocidade de operações, latência e taxas de transferência, não são publicadas, mas as camadas projetadas para arquiteturas de solução específicas são criadas em hardware que tem os recursos para suportar esses cenários. Para obter mais informações sobre partições, consulte Estimar e gerenciar capacidade e confiabilidade no Azure AI Search.
Nota
Partições de maior capacidade ficaram disponíveis em regiões selecionadas a partir de abril de 2024. Uma segunda onda de partições de maior capacidade foi lançada em maio de 2024. Se estiver a utilizar um serviço de pesquisa mais antigo, considere a possibilidade de criar um novo serviço de pesquisa para beneficiar de mais capacidade com a mesma taxa de faturação. Para obter mais informações, consulte Limites de serviço. Para verificar a idade do seu serviço de pesquisa, consulte Como verificar a data de criação do serviço.
Taxas de faturação
Os níveis têm taxas de cobrança diferentes, com taxas mais altas para níveis que são executados em hardware mais caro ou fornecem recursos mais caros. A taxa de cobrança de camada pode ser encontrada nas páginas de preços do Azure para o Azure AI Search.
Depois de criar um serviço, a taxa de faturamento se torna um custo fixo de execução do serviço o tempo todo e um custo incremental se você optar por adicionar mais capacidade.
Os serviços de pesquisa são alocados recursos de computação na forma de partições (para armazenamento) e réplicas (instâncias do mecanismo de consulta). Inicialmente, um serviço é criado com um de cada um, e a taxa de faturamento inclui ambos os recursos. No entanto, se você dimensionar a capacidade, os custos sobem ou diminuem em incrementos da taxa faturável.
O exemplo a seguir fornece uma ilustração. Suponha uma taxa de faturamento hipotética de US$ 100 por mês. Se você mantiver o serviço de pesquisa em sua capacidade inicial de uma partição e uma réplica, então US $ 100 é o que você pode esperar pagar no final do mês. No entanto, se você adicionar mais duas réplicas para obter alta disponibilidade, a conta mensal aumentará para US$ 300 (US$ 100 para o primeiro par de réplicas e partições, seguido por US$ 200 para as duas réplicas).
Este modelo de faturação baseia-se no conceito de aplicação da taxa de faturação às unidades de pesquisa numérica (SU) utilizadas por um serviço de pesquisa. Todos os serviços são inicialmente provisionados em uma SU, mas você pode aumentar as SUs adicionando partições ou réplicas para lidar com cargas de trabalho maiores. Para obter mais informações, consulte Como estimar os custos de um serviço de pesquisa.
Upgrade ou downgrade de nível
Não há suporte interno para atualizar ou fazer downgrade de camadas. Se você quiser mudar para uma camada diferente, a abordagem é:
Crie um novo serviço de pesquisa na nova camada.
Implante seu conteúdo de pesquisa no novo serviço. Siga esta lista de verificação para se certificar de que tem todo o conteúdo.
Exclua o serviço de pesquisa antigo quando tiver certeza de que ele não é mais necessário.
Para índices grandes que você não deseja reconstruir do zero, considere usar o exemplo de backup e restauração para movê-los.
Próximos passos
A melhor maneira de escolher um nível de preço é começar com um nível de menor custo e, em seguida, permitir que a experiência e os testes informem sua decisão de manter o serviço ou criar um novo em um nível mais alto. Para as próximas etapas, recomendamos que você crie um serviço de pesquisa em uma camada que possa acomodar o nível de teste que você se propõe a fazer e, em seguida, revise as orientações a seguir para obter recomendações sobre como estimar o custo e a capacidade.