Что такое Azure AI Content Understanding (предварительная версия)?
Внимание
- Служба "Распознавание содержимого ИИ Azure" доступна в предварительной версии. Общедоступные предварительные выпуски предоставляют ранний доступ к функциям, которые находятся в активной разработке.
- Функции, подходы и процессы могут изменяться или иметь ограниченные возможности до общедоступной доступности.
- Дополнительные сведения см. в дополнительных условиях использования для предварительных версий Microsoft Azure.
Azure AI Content Understanding — это новая служба Azure AI, основанная на искусственном интеллекте, предназначенная для обработки и приема содержимого любых типов (документов, изображений, видео и аудио) в определяемый пользователем формат выходных данных.
Content Understanding предлагает упрощенный процесс, чтобы понять большие объемы неструктурированных данных, ускоряя время к значению, создавая выходные данные, которые можно интегрировать в автоматизацию и аналитические рабочие процессы.
Зачем обрабатывать с помощью распознавания содержимого?
Упрощение и упрощение рабочих процессов. Azure AI Content Understanding стандартизирует извлечение содержимого, структуры и аналитических сведений из различных типов контента в единый процесс.
Упрощение извлечения полей. Извлечение полей content Understanding упрощает создание структурированных выходных данных из неструктурированного содержимого. Определение схемы для извлечения, классификации или создания значений полей без сложного проектирования запросов
Повышение точности. Понимание содержимого использует несколько моделей ИИ для одновременного анализа и перекрестной проверки информации, что приводит к более точным и надежным результатам.
Варианты использования содержимого
Автоматизация. Content Understanding поддерживает сценарии автоматизации, преобразовав неструктурированное содержимое в структурированные данные, которые можно интегрировать в различные рабочие процессы и приложения. Оценки достоверности свести к минимуму оценку человека и снизить затраты. Например, автоматизация процессов закупок и платежей путем извлечения полей из счетов.
Поиск и получение дополненного поколения (RAG). Понимание содержимого позволяет получать содержимое любого модальности в индекс поиска. Структурированное представление выходных данных повышает релевантность сценариев RAG.
Аналитика и отчеты: извлеченные выходные данные области распознавания содержимого повышают аналитические данные и отчеты, позволяя предприятиям получать ценные аналитические сведения, проводить более глубокий анализ и принимать обоснованные решения на основе точных отчетов.
Приложения
К общим приложениям для распознавания контента относятся:
Приложение | Description | Быстрое начало |
---|---|---|
Аналитика после вызова | Предприятия и центры вызовов могут создавать аналитические сведения из записей звонков для отслеживания ключевых ключевых показателей эффективности, повышения качества работы продукта, создания бизнес-аналитики, создания дифференцированных интерфейсов клиентов и более точного ответа на запросы. | Краткое руководство по анализу вызовов |
Управление ресурсами мультимедиа | Поставщики программного обеспечения и мультимедиа могут использовать content Understanding для извлечения более подробных и целевых сведений из видео для решений по управлению ресурсами мультимедиа. | Краткое руководство по управлению ресурсами мультимедиа |
Автоматизация налогов | Компании по подготовке налогов могут использовать Content Understanding для создания единого представления информации из различных документов и создания комплексных налоговых возвратов. | Краткое руководство по автоматизации налогов |
Основные сведения о диаграммах | Предприятия могут улучшить понимание диаграмм, автоматив анализ и интерпретацию различных типов диаграмм и схем с помощью распознавания содержимого. | Краткое руководство по анализу диаграмм |
Дополнительные примеры см . в кратком руководстве .
Компоненты
Компонент | Description |
---|---|
Анализатор | Анализатор является основным компонентом распознавания содержимого. Он позволяет клиентам настраивать параметры извлечения содержимого и схему извлечения полей. После настройки анализатор последовательно применяет эти параметры для обработки всех входящих данных. |
Извлечение содержимого | Извлечение содержимого позволяет пользователям указывать типы информации, которые необходимо определить и извлечь из входящего содержимого. Указанные пользователем сведения включают такие параметры, как OCR анализ текста, анализ макета, штрихкоды, таблицы и многое другое, что позволяет пользователям сосредоточиться на наиболее релевантных элементах содержимого. |
Надстройки | Надстройки для распознавания содержимого повышают извлечение содержимого путем включения добавленных элементов, таких как штрихкоды, таблицы и обнаруженные лица. |
Извлечение полей | Извлечение полей позволяет пользователям определять структуру и схему нужных полей для извлечения из входных файлов. См . ограничения служб для полного списка поддерживаемых типов полей. Поля можно создать с помощью одного из следующих методов: • Извлечение: непосредственно извлекает значения, как они отображаются в входном содержимом, например даты из квитанций или элементов из счетов. • Классификация: классифицируйте содержимое из предопределенного набора категорий, таких как тональность вызовов или тип диаграммы. • Создание: свободное создание значений из входных данных, таких как сводка аудиозаписи или создание описания сцены из видео. |
Источник заземления | Понимание содержимого определяет определенные регионы в содержимом, из которого было создано значение. Исходное приземление позволяет пользователям в сценариях автоматизации быстро проверить правильность значений полей, что приводит к повышению достоверности извлеченных данных. |
Степень достоверности | Понимание содержимого предоставляет оценки достоверности от 0 до 1, чтобы оценить надежность результатов. Высокие оценки указывают на точное извлечение данных, обеспечивая прямую обработку в рабочих процессах автоматизации. |
Ответственное применение ИИ
Azure AI Content Understanding предназначен для защиты от обработки вредного содержимого. Дополнительные сведения см. в заметке о прозрачности и нашем кодексе поведения.
Конфиденциальность и безопасность данных
Разработчики, использующие службу "Распознавание содержимого", должны просматривать политики Майкрософт по данным клиентов. Дополнительные сведения см. на странице "Данные", "Защита и конфиденциальность".
Внимание
Если вы используете продукты или службы Майкрософт для обработки биометрических данных, вы несете ответственность за: (i) предоставление уведомления субъектам данных, в том числе в отношении периодов хранения и уничтожения; (ii) получение согласия от субъектов данных; и (iii) удаление биометрических данных, все в соответствии с соответствующими требованиями и обязательными в соответствии с применимыми требованиями к защите данных. "Биометрические данные" имеет смысл, указанный в статье 4 GDPR, и, если применимо, эквивалентные термины в других требованиях к защите данных. Дополнительные сведения см. в разделе "Данные и конфиденциальность лиц".
Начало работы
Наши краткие руководства помогут вам быстро приступить к работе со службой "Распознавание содержимого":