Administración de capacidad

Completado

Para crear una solución de Búsqueda de Azure AI, debe crear un recurso de Búsqueda de Azure AI en la suscripción de Azure. Dependiendo de la solución específica que quiera crear, puede que también necesite recursos de Azure para el almacenamiento de datos y otros servicios de aplicación.

Niveles de servicio y administración de la capacidad

Al crear un recurso de Búsqueda de Azure AI, debe especificar un plan de tarifa. El plan de tarifa que seleccione determinará las limitaciones de capacidad del servicio de búsqueda y las opciones de configuración disponibles, así como el costo del servicio. Los planes de tarifa disponibles son:

  • Gratis (F): use este plan para explorar el servicio o probar los tutoriales de la documentación del producto.
  • Básico (B): Use este nivel para soluciones de búsqueda a pequeña escala que incluyan un máximo de 15 índices y 5 GB de datos de índice.
  • Estándar (S): use este plan para soluciones a escala empresarial. Hay varias variantes de este plan, como S, S2 y S3, que ofrecen una mayor capacidad en términos de índices y almacenamiento, y S3HD, que está optimizado para un rendimiento de lectura rápido en un número menor de índices.
  • Almacenamiento optimizado (L): use un plan de almacenamiento optimizado (L1 o L2) cuando necesite crear índices de gran tamaño, a expensas de una mayor latencia de consulta.

Nota:

Es importante seleccionar el plan de tarifa más adecuado para su solución, ya que no se puede cambiar más adelante. Si observa que el plan de tarifa elegido ya no se ajusta a su solución, debe crear un nuevo recurso de Búsqueda de Azure AI y volver a crear todos los índices y objetos.

Réplicas y particiones

Según el plan de tarifa que seleccione, puede optimizar su solución para aumentar la escalabilidad y disponibilidad mediante la creación de réplicas y particiones.

  • Las réplicas son instancias del servicio de búsqueda; puede considerarlas como nodos de un clúster. Aumentar el número de réplicas puede ayudar a garantizar que haya suficiente capacidad para atender varias solicitudes de consulta simultáneas mientras se administran las operaciones de indexación en curso.

  • Las particiones se usan para distribuir un índice en varias ubicaciones de almacenamiento, lo que permite dividir las operaciones de E/S, como realizar consultas o volver a generar un índice.

La combinación de réplicas y particiones que configure determinará las unidades de búsqueda que usa la solución. En pocas palabras, el número de unidades de búsqueda es el número de réplicas multiplicado por el número de particiones (R x P = SU). Por ejemplo, un recurso con cuatro réplicas y tres particiones usa 12 unidades de búsqueda.

Sugerencia

Para obtener más información sobre los planes de tarifa y la administración de la capacidad, consulte la documentación de Búsqueda de Azure AI.