Квоты и ограничения службы

Статья
01/15/2025

Это содержимое относится к: версии 4.0 (GA) | Предыдущие версии:v3.1 (GA) версии 3.0 (GA)

Это содержимое относится к: версии 2.1 Последняя версия: версия 4.0 (GA) |

В этой статье содержится краткий справочник и подробное описание квот и ограничений службы аналитики документов Azure для всех ценовых категорий. Она также содержит некоторые рекомендации по предотвращению регулирования количества запросов.

Использование модели

Поддерживаемые типы документов	Читать	Макет	Предварительно созданные модели	Пользовательские модели	Возможности надстройки
PDF	✔️	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `BMPPNG`, `TIFFHEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTXXLS`	✔️	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Для Аналитики документов версии 4.0 2024-11-30 (GA) поддерживаются функции страниц и строк со следующими ограничениями:

Угол, ширина и высота и единица не поддерживаются.
Для каждого обнаруженного объекта ограничивающие многоугольники или ограничивающие области не поддерживаются.
Диапазон страниц (pages) не поддерживается в качестве параметра.
Объект lines не поддерживается.

Поддерживаемые типы документов	Читать	Макет	Предварительно созданные модели	Пользовательские модели
PDF	✔️	✔️	✔️	✔️
Изображения: `JPEG/JPG`, , `BMPPNG`, `TIFFHEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTXXLS`	✔️	✖️	✖️	✖️

✔️ = поддерживается = не поддерживается ✖️

Выставление счетов

Выставление счетов аналитики документов вычисляется ежемесячно на основе типа модели и количества проанализированных страниц. Метрики использования можно найти на панели мониторинга метрик в портал Azure. На панели мониторинга отображается количество страниц, которые обрабатываются в azure AI Document Intelligence. Вы можете проверить предполагаемые затраты, потраченные на ресурс, с помощью калькулятора цен Azure. Подробные инструкции см. в разделе "Проверка использования и оценка затрат". Ниже приведены некоторые сведения:

При отправке документа для анализа служба анализирует все страницы, если только не указать диапазон страниц с помощью параметра в запросе pages . Когда служба анализирует документы Microsoft Excel и PowerPoint с помощью модели чтения, OCR или макета, она подсчитывает каждый лист Excel и слайд PowerPoint как одну страницу.
При анализе PDF-файлов и TIFF служба подсчитывает каждую страницу в PDF-файле или каждый образ в TIFF-файле как одну страницу без максимальных ограничений символов.
При анализе microsoft Word и HTML-файлов, которые поддерживают модели чтения и макета, он подсчитывает страницы в блоках из 3000 символов. Например, если в документе содержится 7 000 символов, две страницы с 3000 символами на каждой и одной странице с 1000 символами добавляются в общей сложности три страницы.
Модели чтения и макета не поддерживают анализ внедренных или связанных изображений в Microsoft Word, Excel, PowerPoint и HTML-файлах. Поэтому служба не подсчитывает их как добавленные изображения.
Обучение пользовательской модели всегда бесплатно с помощью аналитики документов. Плата взимается только в том случае, если служба использует модель для анализа документа.
Цены на контейнеры аналогичны ценам на облачную службу.
Аналитика документов предлагает бесплатный уровень (F0), где можно протестировать все функции аналитики документов. Уровень "Бесплатный" ограничивает ответ только на первые две страницы в запросе.
Аналитика документов имеет модель ценообразования на основе обязательств для больших рабочих нагрузок.
Модель макета необходима для создания меток для набора данных для пользовательского обучения. Если набор данных, используемый для пользовательского обучения, не имеет доступных файлов меток, служба создает их для вас и выставляет счета за использование модели макета.

Квота	Бесплатный (F0) ¹	Standard (S0)
Анализ транзакций в секунду	1	15 (значение по умолчанию)
Регулируется	No	Да ²
Получение ограничения операций в секунду	1	50 (значение по умолчанию)
Регулируется	No	Да ²
Ограничение операций управления моделями в секунду	1	5 (значение по умолчанию)
Регулируется	No	Да ²
Вывод списка операций в секунду	1	10 (значение по умолчанию)
Регулируется	No	Да ²
Максимальный размер документа	4 МБ	500 МБ
Регулируется	No	No
Максимальное количество страниц (анализ)	2	2000
Регулируется	No	No
Максимальный размер файла меток	10 МБ	10 МБ
Регулируется	No	No
Максимальный размер JSON-ответа OCR	500 МБ	500 МБ
Регулируется	No	No
Максимальное число моделей шаблонов	500	5000
Регулируется	No	No
Максимальное число нейронных моделей	100	500
Регулируется	No	No

Использование пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	500 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных для обучения Нейронный и генерированный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Нейронные и генеривные**	50,000	50 000 (значение по умолчанию)
Регулируется	No	No
Обучение настраиваемой нейронной модели	10 часов в месяц ⁵	без ограничения (оплата по часам), начинайте с 10 бесплатных часов каждый месяц
Регулируется	No	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10,000	10 000 (значение по умолчанию)
Регулируется	No	No
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Классификатор**	1 ГБ	2 ГБ (значение по умолчанию)
Регулируется	No	No
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируется	No	No

Использование пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Нейронный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Нейронное**	50,000	50 000 (значение по умолчанию)
Регулируется	No	No
Обучение настраиваемой нейронной модели	10 в месяц	20 в месяц
Регулируется	No	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10,000	10 000 (значение по умолчанию)
Регулируется	No	No
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Классификатор**	1 ГБ	1 ГБ (значение по умолчанию)
Регулируется	No	No
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируется	No	No

Использование пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Нейронный**	1 ГБ ³	1 ГБ (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Шаблон**	50 МБ ⁴	50 МБ (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Шаблон**	500	500 (значение по умолчанию)
Регулируется	No	No
*Максимальное количество страниц (обучение) Нейронное**	50,000	50 000 (значение по умолчанию)
Регулируется	No	No
Обучение настраиваемой нейронной модели	10 в месяц	20 в месяц
Регулируется	No	Да ³
*Максимальное количество страниц (обучение) Классификатор**	10,000	10 000 (значение по умолчанию)
Регулируется	No	No
*Максимальное число типов документов (классов) Классификатор**	500	500 (значение по умолчанию)
Регулируется	No	No
*Размер набора данных обучения Классификатор**	1 ГБ	1 ГБ (значение по умолчанию)
Регулируется	No	No
*Минимальное количество выборок на класс Классификатор**	5	5 (значение по умолчанию)
Регулируется	No	No

Ограничения пользовательской модели

Квота	Бесплатный (F0) ¹	Standard (S0)
Ограничение при объединении моделей	5	200 (значение по умолчанию)
Регулируется	No	No
Размер набора данных для обучения	50 МБ	50 МБ (значение по умолчанию)
Регулируется	No	No
Максимальное количество страниц (обучение)	500	500 (значение по умолчанию)
Регулируется	No	No

¹ Ценовая категория "Бесплатно " (F0) также отображает ежемесячные пособия на странице цен.
² См . рекомендации и инструкции по корректировке.
³ Число обучающих моделей нейронных моделей сбрасывается каждый календарный месяц. Откройте запрос на поддержку, чтобы увеличить ежемесячный лимит обучения. Начиная с API версии 4.0, учебные запросы более 20 в календарном месяце выставляются на уровне обучения. Подробные сведения см. в разделе Цены.

⁴ Это ограничение применяется ко всем документам, найденным в папке обучающего набора данных до любых обновлений, связанных с метками.

⁵ Это ограничение применяется только для v 4.0 (2024-11-30 GA) пользовательских нейронных моделей. Начиная с v 4.0, мы поддерживаем обучение более крупных документов в течение более длительных периодов (до 10 часов бесплатно и взимаем плату после). Дополнительные сведения см. на странице пользовательской нейронной модели.

Подробное описание, корректировка квоты и рекомендации

Ограничения по умолчанию можно расширить, запросить увеличение с помощью запроса в службу поддержки. Прежде чем запросить увеличение квоты (если есть такая возможность), убедитесь, что без этого не обойтись. Служба аналитики документов использует автомасштабирование для привлечения необходимых вычислительных ресурсов, снижения затрат клиента и отмены неиспользуемых ресурсов on-demand, не сохраняя чрезмерную емкость оборудования.

Если приложение возвращает код ответа 429 (слишком много запросов), пороговое значение для одного или нескольких транзакций в секунду (TPS):

Анализ транзакций в секунду ограничивает TPS для отправки запросов на анализ (POST)
Получение операций в секунду ограничение TPS для опроса результатов для операций анализа (GET)
Операции управления моделями в секунду ограничивают операции, связанные с управлением моделями, такими как сборка и обучение и копирование.
Вывод списка операций в секунду, связанных с перечислением моделей, операций.

Общие рекомендации по предотвращению регулирования количества запросов во время автомасштабирования

Чтобы свести к минимуму проблемы, связанные с регулированием количества запросов (код отклика 429), рекомендуется использовать следующие методы:

Реализуйте в приложении логику повторных попыток
Избегайте внесения резких изменений в рабочую нагрузку. Постепенное увеличение рабочей нагрузки
Пример. Приложение использует аналитику документов, а текущая рабочая нагрузка составляет 10 TPS (транзакции в секунду). В следующую секунду вы увеличиваете нагрузку до 40 TPS. Результатом является код ответа 429 для некоторых запросов, так как вы превышаете ограничение 15 TPS для отправки операций анализа. Вы можете либо отключить обработку, чтобы остаться до 15 TPS, либо запросить увеличение TPS для поддержки более высоких томов.

В следующих разделах описаны конкретные случаи настройки квот. Переход к аналитике документов: увеличение количества одновременных запросов

Увеличение лимита запросов на число транзакций в секунду

По умолчанию количество транзакций в секунду ограничено 15 транзакциями в секунду на ресурс Интеллектуального анализа документов. Для ценовой категории "Стандартный" это количество можно увеличить. Перед отправкой запроса убедитесь в том, что вам знакомы материалы в этом разделе, а также эти рекомендации.

Кулак будет включать автоматическое масштабирование. Следуйте этому документу, чтобы включить автоматическое масштабирование ресурса * включить автоматическое масштабирование. При автоматическом масштабировании ресурс может продолжать принимать запросы по ограничениям TPS, настроенным, если в службе есть емкость. Он по-прежнему может привести к регулированию запроса.

Увеличение максимального количества одновременных запросов напрямую не влияет на затраты. Служба аналитики документов использует модель "Платить только за то, что вы используете". Ограничение определяет, как высоко служба может масштабироваться перед началом регулирования запросов.

Существующее значение различных категорий ограничений запросов доступно через портал Azure на вкладке мониторинга в колонке обзора ресурсов.

Создание и отправка запроса на поддержку для увеличения TPS

Чтобы увеличить ограничение на количество транзакций в секунду для ресурса, отправьте запрос в службу поддержки:

Войдите на портал Azure
Выберите ресурс аналитики документов, для которого требуется увеличить ограничение TPS
Выберите "Новый запрос на поддержку" (-Support + troubleshooting-group). Появится новое окно с автоматически заполненными сведениями о подписке Azure и ресурсе Azure
Введите -Summary- (например, "Увеличить ограничение TPS для аналитики документов")
Выберите "Квота или проверка использования" для поля типа проблемы.
Нажмите кнопку -Далее: решения
Продолжайте создание запроса.
В поле "Описание" введите следующие сведения на вкладке "Сведения".
- Обратите внимание, что запрос относится к квоте аналитики документов.
- Укажите ожидаемое количество транзакций в секунду, до которого необходимо выполнить масштабирование в соответствии с вашими потребностями. Хотя увеличение TPS бесплатно, вы должны запросить только TPS, который является разумным для вашей рабочей нагрузки.
- Сведения о ресурсах Azure
- Завершите ввод необходимых сведений и нажмите кнопку "Создать" в -Review + create- tab
- Запишите номер запроса на поддержку в уведомлениях на портале Azure. Обратитесь в службу поддержки, чтобы обратиться к вам в ближайшее время для дальнейшей обработки.

Пример рекомендованного шаблона рабочей нагрузки

В этом примере представлен подход, который мы рекомендуем использовать для предотвращения возможного регулирования количества запросов в связи с выполнением автомасштабирования. Это не точный рецепт, но просто шаблон, который мы приглашаем следовать и настраивать по мере необходимости.

Предположим, что ресурс аналитики документов имеет набор ограничений по умолчанию. Запустите рабочую нагрузку для отправки запросов на анализ. Если при проверке завершения отображается частое регулирование с кодом ответа 429 при проверке завершения, начните с реализации экспоненциальной обратной передачи в запросе на анализ GET. используя увеличивающиеся интервалы между повторными попытками для последующих сообщений об ошибках (например, по схеме 2-5-13-34 для задержек между запросами). Как правило, мы не рекомендуем вызывать ответ на получение анализа более одного раза каждые 2 секунды для соответствующего запроса POST. Ответ analyze также содержит заголовок retry-after, указывающий, сколько времени следует ожидать в секундах перед проверкой завершения этого запроса.

Если вы обнаружите, что количество запросов POST для отправляемых документов начинает регулироваться, попробуйте добавить задержку между запросами. Если для рабочей нагрузки требуется более высокая степень параллельной обработки, необходимо создать запрос на поддержку, чтобы увеличить ограничения службы на транзакции в секунду.

Как правило, мы рекомендуем протестировать рабочую нагрузку и шаблоны рабочей нагрузки перед переходом в рабочую среду.

Следующие шаги

Подробнее о кодах ошибок и устранении неполадок

Поделиться через

Квоты и ограничения службы

Использование модели

Выставление счетов

Использование пользовательской модели

Использование пользовательской модели

Использование пользовательской модели

Ограничения пользовательской модели

Подробное описание, корректировка квоты и рекомендации

Общие рекомендации по предотвращению регулирования количества запросов во время автомасштабирования

Увеличение лимита запросов на число транзакций в секунду

Создание и отправка запроса на поддержку для увеличения TPS

Пример рекомендованного шаблона рабочей нагрузки

Следующие шаги

Обратная связь

Дополнительные ресурсы