Límites y cuotas del servicio

Artículo
2025-01-15

Este contenido se aplica a: v4.0 (GA) | Versiones anteriores: v3.1 (GA) v3.0 (GA)

Este contenido se aplica a: v2.1 | Última versión v4.0 (GA)

Este artículo contiene una referencia rápida y una descripción detallada de las cuotas y los límites del servicio de Documento de inteligencia de Azure AI de todos los planes de tarifa. También contiene algunos procedimientos recomendados para evitar la limitación de solicitudes.

Uso del modelo

Tipos de documento admitidos	Lectura	Layout	Modelos creados previamente	Modelos personalizados	Funcionalidades de complementos
PDF	✔️	✔️	✔️	✔️	✔️
Imágenes: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = compatible ✖️ = no compatible

Para Document Intelligence v4.0 2024-11-30 (disponibilidad general) admite las características de página y línea con las restricciones siguientes:

El ángulo, la anchura/altura y la unidad no son compatibles.
En los objetos detectados no se admiten polígonos delimitadores ni regiones delimitadoras.
El intervalo de páginas (pages) no se admite como parámetro.
No se admite el objeto lines.

Tipos de documento admitidos	Lectura	Layout	Modelos creados previamente	Modelos personalizados
PDF	✔️	✔️	✔️	✔️
Imágenes: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = compatible ✖️ = no compatible

Facturación

La facturación de Documento de inteligencia se calcula mensualmente en función del tipo de modelo y del número de páginas analizadas. Puede encontrar métricas de uso en el panel de métricas en Azure Portal. El panel muestra el número de páginas que procesa el Documento de inteligencia Azure AI. Puede comprobar el costo estimado invertido en el recurso mediante la calculadora de precios de Azure. Para obtener instrucciones detalladas, consulte Comprobación del uso y estimación del costo. Estos son algunos detalles:

Al enviar un documento para su análisis, el servicio analiza todas las páginas a menos que especifique un intervalo de páginas mediante el parámetro pages en la solicitud. Cuando el servicio analiza los documentos de Microsoft Excel y PowerPoint a través del modelo de lectura, OCR o diseño, cuenta cada hoja de cálculo de Excel y la diapositiva de PowerPoint como una página.
Cuando el servicio analiza archivos PDF y TIFF, cuenta cada página del archivo PDF o cada imagen del archivo TIFF como una página sin límites máximos de caracteres.
Cuando el servicio analiza los archivos HTML y Microsoft Word que admiten los modelos de lectura y diseño, las páginas se cuentan en bloques de 3000 caracteres cada una. Por ejemplo, si el documento contiene 7 000 caracteres, las dos páginas con 3 000 caracteres cada una y una página con 1 000 caracteres sumarán un total de tres páginas.
Los modelos de lectura y diseño no admiten el análisis de imágenes insertadas o vinculadas en archivos Microsoft Word, Excel, PowerPoint y HTML. Por lo tanto, el servicio no los cuenta como imágenes agregadas.
El entrenamiento de un modelo personalizado siempre es gratuito con Documento de inteligencia. Solo se generan cargos cuando el servicio usa un modelo para analizar un documento.
Los precios de los contenedores son los mismos que los de los servicios en la nube.
Documento de inteligencia ofrece un nivel gratuito (F0) donde puede probar todas las características de Documento de inteligencia. Los límites del nivel gratis analizan la respuesta solo a las dos primeras páginas de una solicitud.
Documento de inteligencia tiene un modelo de precios basado en compromisos para cargas de trabajo grandes.
El modelo de diseño es necesario para generar etiquetas para el conjunto de datos del entrenamiento personalizado. Si el conjunto de datos que se usa para el entrenamiento personalizado no tiene archivos de etiqueta disponibles, el servicio los genera automáticamente y se le factura el uso del modelo de diseño.

Quota	Gratis (F0)¹	Estándar (S0)
Límite de transacciones de análisis por segundo	1	15 (valor predeterminado)
Ajustable	No	Sí ²
Límite de operaciones Get por segundo	1	50 (valor predeterminado)
Ajustable	No	Sí ²
Límite de operaciones de administración de modelos por segundo	1	5 (valor predeterminado)
Ajustable	No	Sí ²
Límite de operaciones de lista por segundo	1	10 (valor predeterminado)
Ajustable	No	Sí ²
Tamaño máximo del documento	4 MB	500 MB
Ajustable	No	No
Número máximo de páginas (análisis)	2	2000
Ajustable	No	No
Tamaño máximo del archivo de etiquetas	10 MB	10 MB
Ajustable	No	No
Tamaño máximo de la respuesta json de OCR	500 MB	500 MB
Ajustable	No	No
Número máximo de modelos de plantilla	500	5000
Ajustable	No	No
Número máximo de modelos neuronales	100	500
Ajustable	No	No

Uso del modelo personalizado

Quota	Gratis (F0)¹	Estándar (S0)
Límite del modelo de redactado	5	500 (valor predeterminado)
Ajustable	No	No
*Tamaño del conjunto de datos de entrenamiento Neuronal y Generativa**	1 GB³	1 GB (valor predeterminado)
Ajustable	No	No
Tamaño del conjunto de datos de entrenamiento: plantilla	50 MB⁴	50 MB (valor predeterminado)
Ajustable	No	No
Número máximo de páginas (entrenamiento): plantilla	500	500 (valor predeterminado)
Ajustable	No	No
*Número máximo de páginas (entrenamiento) Neuronal y Generativa**	50.000	50 000 (valor predeterminado)
Ajustable	No	No
Entrenamiento de modelos neuronales personalizados	10 horas al mes ⁵	sin límite (pago por hora), comience con 10 horas gratuitas cada mes
Ajustable	No	Sí ³
*Número máx. de páginas (entrenamiento) clasificador**	10 000	10 000 (valor predeterminado)
Ajustable	No	No
*Número máximo de tipos de documento (clases) Clasificador**	500	500 (valor predeterminado)
Ajustable	No	No
*Tamaño del conjunto de datos de entrenamiento clasificador**	1 GB	2GB (valor predeterminado)
Ajustable	No	No
*Número mínimo de muestras por clase Clasificador**	5	5 (valor predeterminado)
Ajustable	No	No

Uso del modelo personalizado

Quota	Gratis (F0)¹	Estándar (S0)
Límite del modelo de redactado	5	200 (valor predeterminado)
Ajustable	No	No
Tamaño del conjunto de datos de entrenamiento: neuronal	1 GB³	1 GB (valor predeterminado)
Ajustable	No	No
Tamaño del conjunto de datos de entrenamiento: plantilla	50 MB⁴	50 MB (valor predeterminado)
Ajustable	No	No
Número máximo de páginas (entrenamiento): plantilla	500	500 (valor predeterminado)
Ajustable	No	No
Número máximo de páginas (entrenamiento): neuronal	50.000	50 000 (valor predeterminado)
Ajustable	No	No
Entrenamiento de modelos neuronales personalizados	10 al mes	20 al mes
Ajustable	No	Sí ³
*Número máx. de páginas (entrenamiento) clasificador**	10 000	10 000 (valor predeterminado)
Ajustable	No	No
*Número máximo de tipos de documento (clases) Clasificador**	500	500 (valor predeterminado)
Ajustable	No	No
*Tamaño del conjunto de datos de entrenamiento clasificador**	1 GB	1 GB (valor predeterminado)
Ajustable	No	No
*Número mínimo de muestras por clase Clasificador**	5	5 (valor predeterminado)
Ajustable	No	No

Uso del modelo personalizado

Quota	Gratis (F0)¹	Estándar (S0)
Límite del modelo de redactado	5	200 (valor predeterminado)
Ajustable	No	No
Tamaño del conjunto de datos de entrenamiento: neuronal	1 GB³	1 GB (valor predeterminado)
Ajustable	No	No
Tamaño del conjunto de datos de entrenamiento: plantilla	50 MB⁴	50 MB (valor predeterminado)
Ajustable	No	No
Número máximo de páginas (entrenamiento): plantilla	500	500 (valor predeterminado)
Ajustable	No	No
Número máximo de páginas (entrenamiento): neuronal	50.000	50 000 (valor predeterminado)
Ajustable	No	No
Entrenamiento de modelos neuronales personalizados	10 al mes	20 al mes
Ajustable	No	Sí ³
*Número máx. de páginas (entrenamiento) clasificador**	10 000	10 000 (valor predeterminado)
Ajustable	No	No
*Número máximo de tipos de documento (clases) Clasificador**	500	500 (valor predeterminado)
Ajustable	No	No
*Tamaño del conjunto de datos de entrenamiento clasificador**	1 GB	1 GB (valor predeterminado)
Ajustable	No	No
*Número mínimo de muestras por clase Clasificador**	5	5 (valor predeterminado)
Ajustable	No	No

Límites del modelo personalizado

Quota	Gratis (F0)¹	Estándar (S0)
Límite del modelo de redactado	5	200 (valor predeterminado)
Ajustable	No	No
Tamaño del conjunto de datos de entrenamiento	50 MB	50 MB (valor predeterminado)
Ajustable	No	No
Número máximo de páginas (entrenamiento)	500	500 (valor predeterminado)
Ajustable	No	No

¹ Para Gratis (F0) plan de tarifa, consulte también asignaciones mensuales en la página de precios.
² Consulte procedimientos recomendados, y instrucciones de ajuste.
³ recuento de entrenamiento de modelos neuronales se restablece cada mes natural. Abra una solicitud de soporte técnico para aumentar el límite de entrenamiento mensual. A partir de la API v4.0, las solicitudes de entrenamiento de más de 20 solicitudes en un mes natural se facturan en el nivel de entrenamiento. Consulte Precios para obtener detalles.

⁴ Este límite se aplica a todos los documentos que estén en la carpeta del conjunto de datos de entrenamiento antes de cualquier actualización relacionada con el etiquetado.

⁵ Este límite solo se aplica a v 4.0 (2024-11-30 GA) los modelos neuronales personalizados. A partir de v 4.0, se admite el entrenamiento de documentos más grandes durante más tiempo (hasta 10 horas de forma gratuita y se incurre en cargos después). Para obtener más información, consulte página de modelos neuronales personalizados.

Descripción detallada, ajuste de cuota y procedimientos recomendados

Los límites predeterminados se pueden ampliar solicitando un aumento a través de un vale de soporte. Antes de solicitar un aumento de cuota (en los casos en que sea aplicable), asegúrese de que es necesario. El servicio de Documento de inteligencia emplea el escalado automático para que los recursos de proceso necesarios se lleven on-demand, mantener bajos los costes del cliente y desaprovisionar los recursos no utilizados al no mantener una cantidad excesiva de capacidad del hardware.

Si la aplicación devuelve el código de respuesta 429 (demasiadas solicitudes) está por encima del umbral de una o varias de las transacciones por segundo (TPS):

Límite de transacciones de análisis por segundo TPS para enviar solicitudes de análisis (POST)
Límite de operaciones Get por segundo TPS para el sondeo de resultados en operaciones de análisis (GET)
Límite de operaciones de administración de modelos por segundo Operaciones relacionadas con la administración de modelos como compilación/entrenamiento y copia.
Límite de operaciones de lista por segundo Operaciones relacionadas con modelos de listado, operaciones.

Procedimientos recomendados generales para mitigar la limitación durante el escalado automático

Para minimizar los problemas relacionados con la limitación (código de respuesta 429), se recomienda usar las técnicas siguientes:

Implemente lógica de reintento en la aplicación
Evite cambios bruscos en la carga de trabajo. Aumente la carga de trabajo gradualmente.
Ejemplo. La aplicación usa Documento de inteligencia y la carga de trabajo actual es de 10 TPS (transacciones por segundo). El segundo siguiente aumenta la carga a 40 TPS. El resultado es un código de respuesta 429 para algunas solicitudes, ya que supera el límite de 15 TPS para enviar operaciones de análisis. Puede revertir el procesamiento para permanecer bajo los 15 TPS o solicitar un aumento de TPS para admitir sus volúmenes más altos.

En las secciones siguientes se describen los casos específicos de ajuste de las cuotas. Ir a Documento de inteligencia: aumentar el límite de solicitud simultáneo

Aumento del límite de solicitudes de transacciones por segundo

De manera predeterminada, el número de transacciones por segundo está limitado a 15 transacciones por segundo para un recurso de Documento de inteligencia. En el plan de tarifa Estándar, esta cantidad se puede aumentar. Antes de enviar la solicitud, asegúrese de que está familiarizado con el material de esta sección y tenga en cuenta estos procedimientos recomendados.

El primer paso sería activar el escalado automático. Siga las instrucciones de este documento para habilitar el escalado automático en el recurso: Habilitar el escalado automático. Con el escalado automático activado, su recurso puede seguir aceptando solicitudes por encima de los límites de TPS configurados si hay capacidad en el servicio. Aún así, puede dar lugar a una solicitud limitada.

El aumento del límite de solicitudes simultáneas no afecta directamente a los costos. El servicio de Documento de inteligencia usa el modelo de "pague por lo que se usa". El límite define hasta dónde se puede escalar el servicio antes de empezar a limitar las solicitudes.

El valor existente de las diferentes categorías de límite de solicitudes está disponible a través de Azure Portal, en la pestaña de supervisión de la hoja de información general de recursos.

Creación y envío de una solicitud de soporte técnico para el aumento de TPS

Inicie el aumento del límite de transacciones por segundo (TPS) para el recurso mediante el envío de la solicitud de soporte técnico:

Inicie sesión en el Portal de Azure
Seleccionar el recurso de Documento de inteligencia para el que desea aumentar el límite de TPS
Seleccione Nueva solicitud de soporte técnico (grupo Soporte técnico y solución de problemas). Aparece una nueva ventana con información rellenada automáticamente sobre la suscripción y el recurso de Azure
Escriba una nota de Resumen (como "Aumentar límite de TPS para Documento de inteligencia").
Seleccione "Validación de cuota o uso" para el campo de tipo de problema.
Seleccione Siguiente: Soluciones.
Continúe con la creación de la solicitud.
En la pestaña Detalles, escriba la siguiente información en el campo Descripción:
- de que la solicitud se refiere a la cuota de Documento de inteligencia.
- Proporcione una expectativa de TPS a la que le gustaría escalar para satisfacer las necesidades. Aunque los aumentos de TPS son gratuitos, solo debería solicitar un TPS que sea razonable para su carga de trabajo.
- Información de recursos de Azure
- Termine de escribir la información necesaria y seleccione el botón Crear en la pestaña Revisar y crear.
- Anote el número de la solicitud de soporte técnico que aparece en las notificaciones de Azure Portal. Busque Soporte técnico para que se pongan en contacto con usted en breve para su posterior procesamiento.

Ejemplo de un procedimiento recomendado para un patrón de carga de trabajo

En este ejemplo se presenta la estrategia que se recomienda seguir para mitigar la posible limitación de solicitudes debido a que el escalado automático está en curso. No es una receta exacta, sino una mera plantilla que le invitamos a seguir y ajustar según sea necesario.

Supongamos que un recurso de Documento de inteligencia tiene establecido el límite predeterminado. Inicie la carga de trabajo para enviar las solicitudes de análisis. Si observa que se produce una limitación frecuente con el código de respuesta 429 al comprobar la finalización, empiece por implementar un retraso exponencial en la solicitud de respuesta de análisis GET. Por ejemplo, mediante el uso de un tiempo de espera progresivamente más prolongado entre reintentos para respuestas de error consecutivas,como el patrón 2-5-13-34 de retrasos entre solicitudes. En general, se recomienda no hacer una llamada a la respuesta de análisis de get más de una vez cada dos segundos para la solicitud POST correspondiente. La respuesta analyze también contiene un encabezado retry-after que indica cuánto tiempo debe esperar en segundos antes de comprobar si se ha completado esa solicitud.

Si se encuentra limitado por el número de solicitudes POST de documentos que se envían, considere la posibilidad de agregar un retraso entre las solicitudes. Si la carga de trabajo requiere un mayor grado de procesamiento simultáneo, debe crear una solicitud de soporte técnico para aumentar los límites de servicio en las transacciones por segundo.

Por lo general, se recomienda probar la carga de trabajo y los patrones de carga de trabajo antes de pasar a producción.

Pasos siguientes

Códigos de error y solución de problemas

Compartir a través de

Límites y cuotas del servicio

Uso del modelo

Facturación

Uso del modelo personalizado

Uso del modelo personalizado

Uso del modelo personalizado

Límites del modelo personalizado

Descripción detallada, ajuste de cuota y procedimientos recomendados

Procedimientos recomendados generales para mitigar la limitación durante el escalado automático

Aumento del límite de solicitudes de transacciones por segundo

Creación y envío de una solicitud de soporte técnico para el aumento de TPS

Ejemplo de un procedimiento recomendado para un patrón de carga de trabajo

Pasos siguientes

Comentarios

Recursos adicionales