Límites de servicio en Azure AI Search
Los límites máximos sobre el almacenamiento, las cargas de trabajo, las cantidades de índices y otros objetos dependen de si se crea Azure AI Search conforme a un plan de tarifa Gratis, Básico, Estándar u Optimizado para almacenamiento.
Gratis es un servicio multiinquilino compartido incluido en su suscripción de Azure.
Básico proporciona recursos informáticos dedicados para cargas de trabajo de producción en una escala menor, pero comparte algunas infraestructuras de red con otros inquilinos.
Estándar se ejecuta en máquinas dedicadas, con más almacenamiento y capacidad de procesamiento en cada nivel. Estándar incluye cuatro niveles: S1, S2, S3 y S3 HD. S3 High Density (S3 HD) está diseñado para multiinquilino y grandes cantidades de índices pequeños (3000 índices por servicio). S3 HD no proporciona la característica de indexador y la ingesta de datos debe usar las API que envían datos del origen al índice.
El plan de tarifa Almacenamiento optimizado se ejecuta en máquinas dedicadas con más almacenamiento total, ancho de banda de almacenamiento y memoria que el plan Estándar. Este nivel tiene como objetivo índices grandes que cambian con lentitud. El plan Optimizado para almacenamiento se ofrece en dos niveles: L1 y L2.
Límites de suscripción
Puede crear varios servicios de búsqueda facturables (Básico y avanzado), hasta el número máximo de servicios permitidos en cada nivel por región. Por ejemplo, puede crear hasta 16 servicios en el nivel Básico y otros 16 en el nivel S1 dentro de la misma suscripción y región. Después, podría crear 16 servicios Básico adicionales en otra región para un total combinado de 32 servicios básicos en la misma suscripción. Para más información sobre los niveles, consulte Elegir un nivel (o SKU) para Azure AI Search.
El límite máximo de servicios se puede elevar a petición. Si necesita tener más servicios en la misma suscripción, envíe una solicitud de soporte técnico.
Resource | Gratis 1 | Basic | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Máximo de servicios por región | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Número máximo de unidades de búsqueda (SU)2 | N/D | 3 unidades de búsqueda | 36 unidades de búsqueda | 36 unidades de búsqueda | 36 unidades de búsqueda | 36 unidades de búsqueda | 36 unidades de búsqueda | 36 unidades de búsqueda |
1 Puede tener un servicio de búsqueda gratuito por suscripción de Azure. El nivel gratuito se basa en la infraestructura compartida con otros clientes. Dado que el hardware no está dedicado, no se admite el escalado vertical y el almacenamiento está limitado a 50 MB. Es posible que se elimine un servicio de búsqueda gratuito después de largos períodos de inactividad para que haya espacio para más servicios.
2 Las unidades de búsqueda (SU) son unidades facturables, asignadas como réplica o como partición. Necesita ambos. Para obtener más información sobre las combinaciones de SU, consulte Estimación y administración de la capacidad de un servicio de búsqueda.
Límites de servicio
En la tabla siguiente se tratan los SLA, los recuentos de particiones y los recuentos de réplicas en el nivel de servicio.
Resource | Gratuito | Básico | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Acuerdo de Nivel de Servicio (SLA) | No | Sí | Sí | Sí | Sí | Sí | Sí | Sí |
Particiones | N/D | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Réplicas | N/D | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Nivel Basic admite tres particiones y tres réplicas, para un total de nueve unidades de búsqueda (SU) en nuevos servicios de búsqueda creados después del 3 de abril de 2024. Los servicios básicos más antiguos están limitados a una partición y tres réplicas.
Un servicio de búsqueda está sujeto a un límite máximo de almacenamiento (tamaño de partición multiplicado por el número de particiones) o por un límite máximo en el número máximo de índices o indexadores, lo que ocurra primero.
Los acuerdos de nivel de servicio (SLA) se aplican a los servicios facturables que tienen dos o más réplicas para cargas de trabajo de consulta, o tres o más réplicas para cargas de trabajo de consulta e indexación. El número de particiones no se tiene en cuenta en el contrato de nivel de servicio. Para más información, consulte Confiabilidad en Azure AI Search.
Los servicios gratuitos no tienen particiones ni réplicas fijas y comparten recursos con otros suscriptores.
Almacenamiento de particiones (GB)
Los límites de almacenamiento por servicio varían en dos aspectos: fecha de creación del servicio, y región. Hay límites más altos para los servicios más recientes en la mayoría de las regiones admitidas.
En esta tabla se muestra la progresión de los aumentos de cuota de almacenamiento en GB a lo largo del tiempo. Las particiones de mayor capacidad se pusieron en línea a partir de abril de 2024, en las regiones enumeradas en las notas al pie. Una mayor capacidad se limita a nuevos servicios de búsqueda. No hay ninguna actualización local en este momento.
Fecha de creación del servicio | Básico | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Antes del 3 de abril de 2024 | 2 | 25 | 100 | 200 | 1024 | 2 048 |
3 de abril de 2024 hasta el 17 de mayo de 2024 1 | 15 | 160 | 512 | 1,024 | 1024 | 2 048 |
Después del 17 de mayo de 2024 2 | 15 | 160 | 512 | 1024 | 2,048 | 4,096 |
1 Almacenamiento de capacidad superior para Basic, S1, S2, S3 en estas regiones. Americas: Sur de Brasil, Centro de Canadá, Este de Canadá, Este de EE. UU., Este de EE. UU. 2, Centro de EE. UU., Centro-norte de EE. UU., Centro-sur de EE. UU., Oeste de EE. UU., Oeste de EE. UU. 2, Oeste de EE. UU. 3, Centro-oeste de EE. UU. Europa: Centro de Francia. Norte de Italia, Norte de Europa, Este de Noruega, Centro de Polonia, Norte de Suiza, Centro de Suecia. Sur de Reino Unido, Oeste de Reino Unido. Oriente Medio: Norte de Emiratos Árabes Unidos. África: Norte de Sudáfrica. Asia Pacífico: Este de Australia, Sudeste de Australia, India Central, oeste de la India, Este de Asia, sudeste de Asia, Este de Japón, oeste de JapónCentro de Corea del Sur, Corea del Sur.
2 Almacenamiento de capacidad superior para L1 y L2. Más regiones proporcionan mayor capacidad en cada nivel facturable. Europa: Norte de Alemania, Centro-oeste de Alemania y Oeste de Suiza. Azure Government: (Texas, Arizona y Virginia). Africa: Norte de Sudáfrica. Asia Pacífico: Norte de China 3, Este de China 3.
Algunas regiones todavía se ejecutan en una infraestructura anterior, sujeta a los límites del 3 de abril. Antes de crear un nuevo servicio, compruebe regiones admitidas para asegurarse de que la región que prefiera proporciona la capacidad adicional.
Límites de índice
Recurso | Gratuito | Básico 1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Índices máximos | 3 | 5 o 15 | 50 | 200 | 200 | 1000 GB por partición o 3000 por servicio | 10 | 10 |
Campos simples máximos por índice 2 | 1 000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
Dimensiones máximas por campo de vector | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 |
Colecciones complejas máximas por índice | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Elementos máximos en todas las colecciones complejas por documento 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Profundidad máxima de campos complejos | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Proveedores de sugerencias máximos por índice | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Perfiles de puntuación máximos por índice | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Funciones máximas por perfil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Tamaño máximo de índice 4 | N/D | N/D | N/D | 1,88 TB | 2,34 TB | 100 GB | N/D | N/D |
1 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los índices. El nivel básico es el único nivel con un límite inferior de 100 campos por índice.
2 El límite superior de los campos incluye campos de primer nivel y subcampos anidados en una colección compleja. Por ejemplo, si un índice contiene 15 campos y tiene dos colecciones complejas con 5 subcampos cada uno, el recuento de campos del índice es 25. Los índices que tengan una colección de campos muy grandes pueden ser lentos. Limite los campos y atributos a solo los que necesite y ejecute la indexación y la prueba de consulta para asegurarse de que el rendimiento sea aceptable.
3 Existe un límite superior para los elementos porque tener un gran número de ellos aumenta significativamente el almacenamiento necesario para el índice. Un elemento de una colección compleja se define como un miembro de esa colección. Por ejemplo, supongamos un documento de hotel con una colección de habitaciones compleja, donde cada habitación de dicha colección se considera un elemento. Durante la indexación, el motor de indexación puede procesar de forma segura un máximo de 3000 elementos en todo el documento. Este límite se presentó en api-version=2019-05-06
y se aplica solo a colecciones complejas, no a colecciones de cadenas ni a campos complejos.
4 En la mayoría de los niveles, el tamaño máximo del índice está disponible en el servicio de búsqueda. Para S2, S3 y S3 HD, el tamaño máximo de cualquier índice es el número proporcionado en la tabla. Se aplica a los servicios de búsqueda creados después del 3 de abril de 2024.
Es posible que encuentre alguna variación en los límites máximos si el servicio casualmente se aprovisiona en un clúster más eficaz. Los límites aquí representan el denominador común. Los índices creados con las especificaciones anteriores se pueden transportar entre los niveles de servicio equivalentes de cualquier región.
Límites de documento
El número máximo de documentos por índice son:
- 24 mil millones en Básico, S1, S2, S3
- 2 mil millones en S3 HD
- 288 mil millones en L1
- 576 mil millones en L2
Cada instancia de una colección compleja cuenta como un documento independiente en términos de estos límites.
El tamaño máximo de cada documento es de aproximadamente 16 megabytes. El tamaño del documento es en realidad un límite del tamaño de la carga de la solicitud de la API de indexación, que es de 16 megabytes. Esa carga puede ser un solo documento o un lote de documentos. Para un lote con un único documento, el tamaño máximo del documento es de 16 MB de JSON.
El tamaño del documento se aplica a la indexación en modo de inserción que carga documentos en un servicio de búsqueda. Si usa un indexador para la indexación en modo de extracción, los archivos de origen pueden tener cualquier tamaño de archivo, sujeto a los límites del indexador. En el caso del indexador de blobs, los límites de tamaño de archivo son mayores para los niveles superiores. Por ejemplo, el límite S1 es de 128 megabytes, el límite S2 es de 256 megabytes, etc.
Al calcular el tamaño del documento, recuerde indexar solo los campos que agregan valor a los escenarios de búsqueda y excluya los campos de origen que no tienen ningún propósito en las consultas que se van a ejecutar.
Límites de tamaño del índice vectorial
Al indexar documentos con campos vectoriales, la Búsqueda de Azure AI construye índices vectoriales internos mediante los parámetros de algoritmo que proporcione. El tamaño de estos índices vectoriales está restringido por la memoria reservada para el vector de búsqueda del nivel de servicio (o SKU
). Para obtener instrucciones sobre cómo administrar y maximizar el almacenamiento de vectores, consulte Tamaño del índice vector y permanencia dentro de los límites.
Los límites de vectores varían según:
Desde abril de 2024, existen límites de vectores más elevados para los nuevos servicios de búsqueda en las regiones que proporcionan la capacidad adicional, que son la mayoría.
En esta tabla se muestra la progresión de los aumentos de la cuota de vectores en GB a lo largo del tiempo. La cuota es por partición, por lo que si escala un nuevo servicio Estándar (S1) a 6 particiones, la cuota total de vectores es 35 multiplicada por 6.
Fecha de creación del servicio | Básico | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Antes del 1 de julio de 2023 1 | 0.5 | 1 | 6 | 12 | 12 | 36 |
1 de julio de 2023 hasta el 3 de abril de 2024 2 | 1 | 3 | 12 | 36 | 12 | 36 |
3 de abril de 2024 hasta el 17 de mayo de 2024 3 | 5 | 35 | 150 | 300 | 12 | 36 |
Después del 17 de mayo de 2024 4 | 5 | 35 | 150 | 300 | 150 | 300 |
1 Límites de vectores iniciales durante la versión preliminar temprana.
2 Límites de vectores durante el período de versión preliminar posterior. Tres regiones no tenían los límites más altos: Centro-oeste de Alemania, India Occidental, Centro de Catar.
3 Cuota de vectores superior en función de las particiones más grandes para los niveles y regiones admitidos.
4 Cuota de vectores superior para más niveles y regiones en función de las actualizaciones de tamaño de partición.
El servicio aplica una cuota de tamaño de índice vectorial para cada partición en el servicio de búsqueda. Cada partición adicional aumenta la cuota de tamaño de índice vectorial disponible. Esta cuota supone un límite estricto que sirve para asegurar que su servicio funcione correctamente, lo que significa que realizar más intentos de indexación una vez que se ha superado el límite provoca errores. Puede reanudar la indexación una vez que libere la cuota disponible eliminando algunos documentos vectoriales o escalando verticalmente en particiones.
Importante
Los límites de vectores más altos están vinculados a tamaños de partición mayores. Las regiones que se ejecutan en una infraestructura anterior están sujetas a los límites de julio a abril. Revise la lista de regiones para ver el estado de los límites de almacenamiento de las particiones.
Límites de indexador
Los tiempos de ejecución máximos existen para proporcionar equilibrio y estabilidad al servicio como un todo, pero es posible que los conjuntos de datos más grandes necesiten más tiempo de indexación que el que permite el máximo. Si un trabajo de indexación no se puede completar en el tiempo máximo permitido, intente ejecutarlo en una programación. El programador realiza un seguimiento del estado de la indexación. Si un trabajo programado de indexación se interrumpe por cualquier motivo, el indizador puede reanudarlo donde se quedó en la siguiente ejecución programada.
Recurso | Gratis 1 | Básico 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Indexadores máximos | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Orígenes de datos máximos | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Conjuntos de habilidades máximos 4 | 3 | 5 o 15 | 50 | 200 | 200 | N/D | 10 | 10 |
Carga máxima de indexación por invocación | 10 000 documentos | Limitado solamente por el número máximo de documentos | Limitado solamente por el número máximo de documentos | Limitado solamente por el número máximo de documentos | Limitado solamente por el número máximo de documentos | N/D | Sin límite | Sin límite |
Programación mínima | 5 minutos | 5 minutos | 5 minutos | 5 minutos | 5 minutos | 5 minutos | 5 minutos | 5 minutos |
Tiempo de ejecución máximo 5 | De 1 a 3 o de 3 a 10 minutos | 2 o 24 horas | 2 o 24 horas | 2 o 24 horas | 2 o 24 horas | N/D | 2 o 24 horas | 2 o 24 horas |
Indexador de blobs: tamaño máximo de blob, MB | 16 | 16 | 128 | 256 | 256 | N/D | 256 | 256 |
Indexador de blobs: número máximo de caracteres del contenido extraído de un blob 6 | 32 000 | 64 000 | 4 millones | 8 millones | 16 millones | N/D | 4 millones | 4 millones |
1 Los servicios gratuitos tienen un tiempo de ejecución máximo del indexador de 3 minutos para servicios de blob y de 1 minuto para todos los demás orígenes de datos. La invocación del indexador es una vez cada 180 segundos. Para la indexación de IA que llama a los servicios de Azure AI, los servicios gratuitos se limitan a 20 transacciones gratuitas por indexador por día, donde una transacción se define como un documento que pasa correctamente a través de la canalización de enriquecimiento (sugerencia: puedes restablecer un indexador para restablecer su recuento).
2 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los indexadores, los orígenes de datos y los conjuntos de aptitudes.
3 Los servicios S3 HD no incluyen compatibilidad con el indexador.
4 Máximo de 30 habilidades por conjunto de habilidades.
5 Con respecto a la duración máxima de 2 o 24 horas para los indexadores: un máximo de 2 horas es el más común y es lo que debe planear. Hace referencia a los indexadores que se ejecutan en el entorno público, que se usan para descargar el procesamiento intensivo de cálculo y dejar más recursos para las consultas. El límite de 24 horas se aplica si configura el indexador para que se ejecute en un entorno privado usando solo la infraestructura asignada al servicio de búsqueda. Tenga en cuenta que algunos indexadores más antiguos no pueden ejecutarse en el entorno público y esos indexadores siempre tienen un rango de procesamiento de 24 horas. Si tiene indexadores no programados que se ejecutan continuamente durante 24 horas, se puede asumir que esos indexadores no se pudieron migrar a la infraestructura más reciente. Como regla general, para los trabajos de indexación que no se pueden finalizar en dos horas, coloque el indexador en una programación de 5 minutos para que el indexador pueda reanudar el trabajo rápidamente dónde lo dejó. En el nivel Gratis, el tiempo de ejecución máximo de 3 a 10 minutos es para los indexadores con conjuntos de aptitudes.
6 El número máximo de caracteres se basa en unidades de código Unicode, específicamente UTF-16.
Nota:
Como se indica en el apartado Límites de índice, los indexadores también aplicarán el límite superior de 3000 elementos en todas las colecciones complejas por documento a partir de la versión de la API de disponibilidad general más reciente que admita tipos complejos (2019-05-06
) en adelante, lo que significa que si ha creado un indexador con una versión anterior de la API, no estará sujeto a ese límite. Para conservar la máxima compatibilidad, los indexadores que se crearon con una versión anterior de la API y, después, se actualizaron con una versión de la API 2019-05-06
, o posterior, seguirá estando excluido de los límites. Los clientes deben ser conscientes del impacto negativo de tener colecciones muy complejas (como se ha indicado anteriormente) y recomendamos encarecidamente que se creen todos los indexadores con la versión de la API de disponibilidad general más reciente.
Límites de recursos compartidos de Private Link
Los indexadores pueden acceder a otros recursos de Azure mediante puntos de conexión privados administrados con la API de recursos compartidos de Private Link. En esta sección se describen los límites asociados a esta funcionalidad.
Recurso | Gratuito | Básico | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Compatibilidad con indexador de puntos de conexión privados | No | Sí | Sí | Sí | Sí | No | Sí | Sí |
Compatibilidad con puntos de conexión privados para indexadores con un conjunto de aptitudes1 | No | N.º | No | Sí | Sí | No | Sí | Sí |
Compatibilidad con puntos de conexión privados para indexadores con un conjunto de aptitudes y vectorización integrada 2 | No | Sí | Sí | Sí | Sí | No | Sí | Sí |
Número máximo de puntos de conexión privados | N/D | 10 o 30 | 100 | 400 | 400 | N/D | 20 | 20 |
Máximo de tipos de recursos distintos3 | N/D | 4 | 7 | 15 | 15 | N/D | 4 | 4 |
1 El análisis de imágenes y el enriquecimiento con IA consumen muchos recursos informáticos y una cantidad desproporcionada de la potencia de procesamiento disponible. Por este motivo, las conexiones privadas están deshabilitadas en niveles inferiores para garantizar el rendimiento y la estabilidad del propio servicio de búsqueda.
2Los servicios de alta capacidad creados después del 3 de abril de 2024 en las regiones enumeradas en Partition Storage y la ejecución de cargas de trabajo de vectorización integrada en tiempo de indexación admiten vínculos privados compartidos en niveles de pago. El sistema debe detectar al menos una aptitud que inserte datos.
3 El número de tipos de recursos distintos se calcula como el número de valores de groupId
únicos utilizados en todos los recursos de vínculo privado compartidos para un servicio de búsqueda determinado, independientemente del estado del recurso.
Límites de sinónimos
El número máximo de asignaciones de sinónimos varía según el nivel. Cada regla puede tener hasta 20 expansiones, donde una expansión es un término equivalente. Por ejemplo, dado el término "gato", la asociación con "gatito", "felino" y "felis" (el género de gatos) contaría como 3 expansiones.
Recurso | Gratuito | Básico | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Asignaciones máximas de sinónimos | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Número máximo de reglas por asignación | 5000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Límites de alias de índice
El número máximo de alias de índice varía según el nivel y la fecha de creación del servicio. En todos los niveles, si el servicio se creó después de octubre de 2022, el número máximo de alias es el doble del número máximo de índices permitido. Si el servicio se creó antes de octubre de 2022, el límite es el número de índices permitidos.
Fecha de creación del servicio | Gratuito | Básico | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Antes de octubre de 2022 | 3 | 5 o 15 1 | 50 | 200 | 200 | 1000 GB por partición o 3000 por servicio | 10 | 10 |
Después de octubre de 2022 | 6 | 30 | 100 | 400 | 400 | 2000 GB por partición o 6000 por servicio | 20 | 20 |
1 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los índices
Límites de datos (enriquecimiento de inteligencia artificial)
Una canalización de enriquecimiento con IA que realiza llamadas a un recurso de lenguaje de Azure AI para el reconocimiento de entidades, la vinculación de entidades, la extracción de frases clave, el análisis de sentimiento, la detección de idioma y la detección de información personal está sujeta a los límites de datos. El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length
. Si tiene que dividir los datos antes de enviarlos al analizador de opiniones, use la aptitud División de texto.
Limitaciones
Las solicitudes de API se limitan a medida que el sistema se aproxima a la capacidad máxima. La limitación se comporta de forma diferente para las distintas API. Las API de consulta (Search/Suggest/Autocomplete) y las de indexación se limitan dinámicamente en función de la carga del servicio. Las API de índice y las API de operaciones de servicio tienen límites estáticos de frecuencia de solicitud.
Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un índice:
- Enumerar índices (GET /indexes): 3 por segundo por unidad de búsqueda
- Obtener índice (GET /indexes/myindex): 10 por segundo por unidad de búsqueda
- Crear índice (POST /indexes): 12 por minuto por unidad de búsqueda
- Crear o actualizar índice (PUT /indexes/myindex): 6 por segundo por unidad de búsqueda
- Eliminar índice (DELETE /indexes/myindex): 12 por minuto por unidad de búsqueda
Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un servicio:
- Estadísticas de servicio (GET /servicestats): 4 por segundo por unidad de búsqueda
Limitaciones de restricción del clasificador semántico
El clasificador semántico usa un sistema de puesta en cola para administrar solicitudes simultáneas. Este sistema permite a los servicios de búsqueda obtener la mayor cantidad de consultas por segundo posible. Cuando se alcanza el límite de solicitudes simultáneas, se colocan solicitudes adicionales en una cola. Si la cola está llena, se rechazan las solicitudes adicionales y se deben reintentar.
Las consultas del clasificador semántico totales por segundo varían en función de los factores siguientes:
- Nivel del servicio de búsqueda. Tanto los límites de la capacidad de cola como los de solicitudes simultáneas varían según el nivel de servicio.
- Número de unidades de búsqueda en el servicio de búsqueda. La manera más sencilla de aumentar la cantidad máxima de consultas simultáneas del clasificador semántico es agregar más unidades de búsqueda al servicio de búsqueda.
- Capacidad total del clasificador semántico disponible en la región.
- Cantidad de tiempo que se tarda en atender una consulta mediante el clasificador semántico. Esto varía en función de la disponibilidad que tenga el servicio de búsqueda.
En la tabla siguiente se describen los límites de restricción del clasificador semántico por nivel de servicio, sujeto a la capacidad disponible en la región. Puede ponerse en contacto con el soporte técnico de Microsoft para solicitar un aumento del límite.
Resource | Básico | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|
Solicitudes simultáneas máximas (por unidad de búsqueda) | 2 | 3 | 4 | 4 | 4 | 4 | 4 |
Tamaño máximo de cola de solicitudes (por unidad de búsqueda) | 4 | 6 | 8 | 8 | 8 | 8 | 8 |
Límites de solicitud de API
Existen límites en las consultas porque las consultas sin enlazar pueden desestabilizar el servicio de búsqueda. Normalmente, estas consultas se crean mediante programación. Si la aplicación genera consultas de búsqueda mediante programación, se recomienda diseñarla de manera que no genere consultas de tamaño ilimitado.
Existen límites en las cargas por motivos similares, lo que garantiza la estabilidad del servicio de búsqueda. El límite se aplica a toda la solicitud, incluidos todos sus componentes. Por ejemplo, si la solicitud agrupa por lotes varios documentos o comandos, toda la solicitud debe ajustarse al límite admitido.
Si debe superar un límite admitido, debe probar la carga de trabajo para que sepa qué esperar.
Con excepción de donde se indique, las siguientes solicitudes de API se aplican a todas las interfaces programables, incluidos los SDK de Azure.
General:
- El límite máximo de carga admitido es de 16 MB para la indexación y la solicitud de consultas a través de la API de REST y los SDK.
- Longitud máxima de la URL de 8 KB (solo se aplica a las API de REST)
API de indexación:
- máximo de 1000 documentos por lote de cargas, combinaciones o eliminaciones de índices.
API de consulta:
- máximo de 32 campos en la cláusula $orderby.
- Máximo de 100 000 caracteres en una cláusula de búsqueda.
- El número máximo de cláusulas en la búsqueda es de 3000.
- Límites máximos de consultas de caracteres comodín y expresiones regulares, según lo exigido por Lucene. Limita el número de patrones, variaciones o coincidencias a 1000 instancias. Este límite se aplica para evitar la sobrecarga del motor.
Búsqueda de términos:
- el tamaño máximo admitido de términos de búsqueda es de 32 766 bytes (32 KB menos 2 bytes) de texto con codificación UTF-8. Se aplica a la búsqueda de palabras clave y a la propiedad de texto de la búsqueda vectorial.
- El tamaño máximo admitido de términos de búsqueda es de 1000 caracteres para la búsqueda de prefijos y la búsqueda de expresiones regulares.
Límites de respuesta de API
- Máximo de 1000 documentos devueltos por página de resultados de búsqueda
- Máximo de 100 sugerencias devueltas por solicitud de Sugerir API
El motor de búsqueda devuelve 50 resultados de forma predeterminada, pero puede invalidar este parámetro hasta el límite máximo.
Límites de clave de API
Las claves de API se usan para la autenticación del servicio. Hay dos tipos. Las claves de administración se especifican en el encabezado de solicitud y conceden acceso completo de lectura y escritura al servicio. Las claves de consulta son de solo lectura, se especifican en la dirección URL y normalmente se distribuyen a las aplicaciones cliente.
- Máximo de 2 claves de administración por servicio
- Máximo de 50 claves de consultas por servicio