Квоты и ограничения службы

Статья
04/02/2025

Это содержимое относится к:v4.0 (GA) | Предыдущие версии:v3.1 (GA)v3.0 (GA)

Это содержимое относится к:v2.1 | Последняя версия:v4.0 (GA)

В этой статье содержится краткий справочник и подробное описание квот и ограничений службы аналитики документов Azure для всех ценовых категорий. Она также содержит некоторые рекомендации по предотвращению ограничения запросов.

Использование модели

Поддерживаемые типы документов	Читать	Макет	Предварительно созданные модели	Пользовательские модели	Дополнительные возможности
PDF	✔️	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `PNGBMP`, `TIFFHEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTXXLS`	✔️	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Для Аналитики документов версии 4.0 2024-11-30 (GA) поддерживаются функции страниц и строк со следующими ограничениями:

Угол, ширина и высота и единица не поддерживаются.
Для каждого обнаруженного объекта ограничивающие многоугольники или ограничивающие области не поддерживаются.
Диапазон страниц (pages) не поддерживается в качестве параметра.
Объект lines не поддерживается.

Поддерживаемые типы документов	Читать	Макет	Предварительно созданные модели	Пользовательские модели
PDF	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `PNGBMP`, `TIFFHEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTXXLS`	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Выставление счетов

Выставление счетов за анализ документов осуществляется ежемесячно на основе типа модели и количества проанализированных страниц. Метрики использования можно найти на панели мониторинга метрик в портале Azure. На панели мониторинга отображается количество страниц, которые обрабатываются в azure AI Document Intelligence. Вы можете проверить предполагаемые затраты, потраченные на ресурс, с помощью калькулятора цен Azure. Подробные инструкции см. в разделе "Проверка использования и оценка затрат". Ниже приведены некоторые сведения:

При отправке документа для анализа служба анализирует все страницы, если только не указать диапазон страниц с помощью параметра в запросе pages . Когда служба анализирует документы Microsoft Excel и PowerPoint с помощью модели чтения, OCR или макета, она подсчитывает каждый лист Excel и слайд PowerPoint как одну страницу.
При анализе PDF-файлов и TIFF служба подсчитывает каждую страницу в PDF-файле или каждый образ в TIFF-файле как одну страницу без максимальных ограничений символов.
При анализе файлов Microsoft Word и HTML, которые поддерживают модели чтения и макета, сервис подсчитывает страницы в блоках по 3000 символов. Например, если в документе содержится 7 000 символов, две страницы с 3 000 символами каждая и одна страница с 1 000 символами в сумме составляют три страницы.
Модели чтения и макета не поддерживают анализ внедренных или связанных изображений в Microsoft Word, Excel, PowerPoint и HTML-файлах. Поэтому служба не учитывает их как добавленные изображения.
Обучение пользовательской модели всегда бесплатно с помощью аналитики документов. Плата взимается только в том случае, если служба использует модель для анализа документа.
Цены на контейнеры аналогичны ценам на облачную службу.
Аналитика документов предлагает бесплатный уровень (F0), где можно протестировать все функции аналитики документов. Бесплатный уровень ограничивает анализ ответа только первыми двумя страницами в запросе.
Аналитика документов имеет модель ценообразования на основе обязательств для больших рабочих нагрузок.
Модель макета необходима для создания меток для набора данных для пользовательского обучения. Если набор данных, используемый для пользовательского обучения, не имеет доступных файлов меток, служба создает их для вас и выставляет счета за использование модели макета.

Квота	Бесплатный (F0) ¹	Standard (S0)
Анализ предела транзакций в секунду	1	15 (значение по умолчанию)
Регулируется	Нет	Да ²
Получить ограничение на количество операций в секунду	1	50 (значение по умолчанию)
Регулируется	Нет	Да ²
Ограничение операций управления моделями в секунду	1	5 (значение по умолчанию)
Регулируется	Нет	Да ²
Ограничение на количество операций списка в секунду	1	10 (значение по умолчанию)
Регулируется	Нет	Да ²
Максимальный размер документа	4 МБ	500 МБ
Регулируется	Нет	Нет
Максимальное количество страниц (анализ)	2	2000
Регулируется	Нет	Нет
Максимальный размер файла меток	10 МБ	10 МБ
Регулируется	Нет	Нет
Максимальный размер JSON-ответа OCR	500 МБ	500 МБ
Регулируется	Нет	Нет
Максимальное число моделей шаблонов	500	5000
Регулируется	Нет	Нет
Максимальное число нейронных моделей	100	500
Регулируется	Нет	Нет

Использование пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	500 (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных для обучения Нейронный и генерированный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное количество страниц (обучение) Нейронные и генеративные**	50,000	50 000 (значение по умолчанию)
Регулируется	Нет	Нет
Обучение настраиваемой нейронной модели	10 часов в месяц ⁵	без ограничения (оплата по часам), начинайте с 10 бесплатных часов каждый месяц
Регулируется	Нет	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10 000	10 000 (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Классификатор**	1 ГБ	2 ГБ (значение по умолчанию)
Регулируется	Нет	Нет
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируется	Нет	Нет

Использование пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Нейронный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное количество страниц (обучение) Нейронное**	50,000	50 000 (значение по умолчанию)
Регулируется	Нет	Нет
Обучение настраиваемой нейронной модели	10 в месяц	20 в месяц
Регулируется	Нет	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10 000	10 000 (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Классификатор**	1 ГБ	1 ГБ (значение по умолчанию)
Регулируется	Нет	Нет
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируется	Нет	Нет

Использование пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Нейронный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное количество страниц (обучение) Нейронное**	50,000	50 000 (значение по умолчанию)
Регулируется	Нет	Нет
Обучение настраиваемой нейронной модели	10 в месяц	20 в месяц
Регулируется	Нет	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10 000	10 000 (значение по умолчанию)
Регулируется	Нет	Нет
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируется	Нет	Нет
*Размер набора данных обучения Классификатор**	1 ГБ	1 ГБ (значение по умолчанию)
Регулируется	Нет	Нет
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируется	Нет	Нет

Ограничения пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	Нет	Нет
Размер набора данных для обучения	50 МБ	50 МБ (значение по умолчанию)
Регулируется	Нет	Нет
Максимальное количество страниц (обучение)	500	500 (значение по умолчанию)
Регулируется	Нет	Нет

¹ Ценовая категория "Бесплатно " (F0) также отображает ежемесячные лимиты на странице с ценами.
² См. рекомендации и инструкции по корректировке.
³ Количество обучений нейронных моделей сбрасывается каждый календарный месяц. Откройте запрос на поддержку, чтобы увеличить ежемесячный лимит обучения. Начиная с API версии 4.0, учебные запросы, превышающие 20 запросов в календарном месяце, рассчитываются по тарифу обучения. Подробные сведения см. в разделе Цены.

⁴ Это ограничение применяется ко всем документам, найденным в папке обучающего набора данных до любых обновлений, связанных с метками.

⁵ Это ограничение применяется только для v 4.0 (2024-11-30 GA) пользовательских нейронных моделей. Начиная с v 4.0, мы поддерживаем тренировку крупных документов в течение длительных периодов времени (до 10 часов бесплатно, после чего взимается плата). Дополнительные сведения см. на странице пользовательской нейронной модели.

Подробное описание, корректировка квоты и рекомендации

Ограничения по умолчанию можно расширить, запросить увеличение с помощью запроса в службу поддержки. Прежде чем запросить увеличение квоты (если есть такая возможность), убедитесь, что без этого не обойтись. Служба интеллектуального анализа документов использует автомасштабирование для привлечения необходимых вычислительных ресурсов, снижения затрат клиента и освобождения неиспользуемых ресурсов, избегая поддержания избыточной емкости оборудования.

Если ваше приложение возвращает код ответа 429 (слишком много запросов), вы превысили пороговое значение для одной или нескольких лимитов на количество транзакций в секунду (TPS).

Лимит транзакций в секунду для анализа TPS для отправки запросов на анализ (POST)
Получить ограничение операций в секунду TPS для опроса результатов операций анализа (GET)
Ограничение на операции управления моделями в секунду Операции, связанные с управлением моделями, такими как сборка/обучение и копирование.
Ограничение на количество операций списка в секунду для действий с моделями и операциями.

Общие рекомендации по предотвращению регулирования количества запросов во время автомасштабирования

Чтобы минимизировать проблемы троттлинга (Код ответа 429), рекомендуется использовать следующие методы:

Реализуйте в приложении логику повторных попыток
Избегайте внесения резких изменений в рабочую нагрузку. Постепенное увеличение рабочей нагрузки
Пример. Приложение использует аналитику документов, а текущая рабочая нагрузка составляет 10 TPS (транзакции в секунду). В следующую секунду вы увеличиваете нагрузку до 40 TPS. Результатом является код ответа 429 для некоторых запросов, так как вы превышаете ограничение 15 TPS для отправки операций анализа. Вы можете либо сократить нагрузку на обработку, чтобы оставаться ниже 15 TPS, либо запросить увеличение предела TPS для поддержки большего объема данных.

В следующих разделах описаны конкретные случаи настройки квот. Переход к аналитике документов: увеличение количества одновременных запросов

Увеличение лимита запросов на количество транзакций в секунду

По умолчанию количество транзакций в секунду ограничено 15 транзакциями в секунду на ресурс Интеллектуального анализа документов. Для ценовой категории "Стандартный" это количество можно увеличить. Перед отправкой запроса убедитесь в том, что вам знакомы материалы в этом разделе, а также эти рекомендации.

Первым шагом было бы включение автоматического масштабирования. Следуйте этому документу, чтобы включить автоматическое масштабирование ресурса * включить автоматическое масштабирование. При автоматическом масштабировании ресурс может продолжать принимать запросы по ограничениям TPS, настроенным, если в службе есть емкость. Он по-прежнему может вызвать ограничение запросов.

Увеличение максимального количества одновременных запросов напрямую не влияет на затраты. Служба аналитики документов использует модель "Платить только за то, что вы используете". Ограничение определяет, как высоко служба может масштабироваться перед началом регулирования запросов.

Существующее значение различных категорий ограничений запросов доступно через портал Azure на вкладке мониторинга в колонке обзора ресурсов.

Создание и отправка запроса на поддержку для увеличения TPS

Чтобы увеличить ограничение на количество транзакций в секунду для ресурса, отправьте запрос в службу поддержки:

Войдите на портал Azure
Выберите ресурс аналитики документов, для которого требуется увеличить ограничение TPS
Выберите "Новый запрос на поддержку" (группа "Поддержка и устранение неисправностей"). Появится новое окно с автоматически заполненными сведениями о подписке Azure и ресурсе Azure
Введите -Summary- (например, "Увеличить ограничение TPS для документной аналитики")
Выберите "Квота или проверка использования" в поле типа проблемы.
Выберите -Далее: решения-
Продолжайте создание запроса.
В поле "Описание" введите следующие сведения на вкладке "Сведения".
- Обратите внимание, что запрос касается квоты на использование Document Intelligence.
- Укажите ожидаемое количество транзакций в секунду, до которого вы хотите выполнить масштабирование, чтобы соответствовать вашим требованиям. Хотя увеличение TPS бесплатно, вы должны запрашивать только тот TPS, который соответствует вашей рабочей нагрузке.
- Сведения о ресурсах Azure
- Завершите ввод необходимых сведений и нажмите кнопку "Создать" в -Review + create- tab
- Запишите номер запроса на поддержку в уведомлениях на портале Azure. Ожидайте, что служба поддержки свяжется с вами в ближайшее время для дальнейшей обработки.

Пример рекомендованного шаблона рабочей нагрузки

В этом примере представлен подход, который мы рекомендуем использовать для предотвращения возможного ограничения запросов в связи с выполнением автомасштабирования. Это не точный рецепт, но просто шаблон, который мы приглашаем следовать и настраивать по мере необходимости.

Предположим, что ресурс аналитики документов имеет набор ограничений по умолчанию. Запустите рабочую нагрузку для отправки запросов на анализ. Если вы обнаружите, что часто возникает ограничение с кодом ответа 429 при проверке завершения, начните с реализации экспоненциального бэкоффа в запросе на анализ с методом GET. используя увеличивающиеся интервалы между повторными попытками для последующих сообщений об ошибках (например, по схеме 2-5-13-34 для задержек между запросами). Как правило, мы не рекомендуем вызывать ответ на получение анализа более одного раза каждые 2 секунды для соответствующего запроса POST. Ответ analyze также содержит заголовок retry-after, указывающий, сколько секунд нужно подождать, прежде чем проверять завершение этого запроса.

Если вы обнаружите, что количество POST-запросов для отправки документов ограничивается, попробуйте добавить задержку между запросами. Если для рабочей нагрузки требуется более высокая степень параллельной обработки, необходимо создать запрос на поддержку, чтобы увеличить ограничения службы на транзакции в секунду.

Как правило, мы рекомендуем протестировать рабочую нагрузку и шаблоны рабочей нагрузки перед переходом в рабочую среду.

Следующие шаги

Подробнее о кодах ошибок и устранении неполадок

Поделиться через

Квоты и ограничения службы

Использование модели

Выставление счетов

Использование пользовательской модели

Использование пользовательской модели

Использование пользовательской модели

Ограничения пользовательской модели

Подробное описание, корректировка квоты и рекомендации

Общие рекомендации по предотвращению регулирования количества запросов во время автомасштабирования

Увеличение лимита запросов на количество транзакций в секунду

Создание и отправка запроса на поддержку для увеличения TPS

Пример рекомендованного шаблона рабочей нагрузки

Следующие шаги

Обратная связь

Дополнительные ресурсы