Решения для распознавания содержимого (предварительная версия)

Статья
01/16/2025

Внимание

Служба "Распознавание содержимого ИИ Azure" доступна в предварительной версии. Общедоступные предварительные выпуски предоставляют ранний доступ к функциям, которые находятся в активной разработке.
Функции, подходы и процессы могут изменяться или иметь ограниченные возможности до общедоступной доступности.
Дополнительные сведения см. в дополнительных условиях использования для предварительных версий Microsoft Azure.

Распознавание содержимого аудиоанализаторов позволяет транскрибировать и диаризации беседного звука, извлекать структурированные поля, такие как сводки, тональности и ключевые темы. Настройте шаблон аудиоанализатора в соответствии с потребностями бизнеса с помощью портала Azure AI Foundry, чтобы начать создание результатов.

Ниже приведены распространенные сценарии использования службы "Распознавание содержимого" с данными беседы:

Получите аналитические сведения о клиентах с помощью анализа сводных данных и анализа тональности.
Оценка и проверка качества звонков и соответствия в центрах вызовов.
Создание автоматических сводок и метаданных для публикации podcast.

Возможности анализатора звука

Content Understanding служит краеугольным камнем для решений управления ресурсами мультимедиа, что позволяет использовать следующие возможности для аудиофайлов:

Извлечение содержимого

Транскрибирование. Преобразует аудиозапись беседы в доступные для поиска и анализируемые текстовые расшифровки в формате WebVTT. Настраиваемые поля можно создать из данных транскрибирования. Метки времени и метки времени уровня предложения доступны по запросу.
Diarization. Различает динамиков в беседе, приписав части расшифровки конкретным ораторам.
Обнаружение роли докладчика. Определяет роли агента и клиента в контактных данных центра звонков.
Обнаружение языка. Автоматически обнаруживает язык в аудио или использует указанные указания языка или языкового стандарта.

Извлечение полей

Извлечение полей позволяет извлекать структурированные данные из звуковых файлов, таких как сводки, тональности и упомянутые сущности из журналов вызовов. Сначала можно настроить рекомендуемый шаблон анализатора или создать его с нуля.

Основные преимущества

Content Understanding предлагает расширенные возможности звука, в том числе:

Настраиваемое извлечение данных. Настройте выходные данные в соответствии с вашими потребностями, изменив схему поля, что позволяет точно создавать и извлекать данные.
Генеривные модели. Используйте модели создания искусственного интеллекта для указания на естественном языке содержимого, которое требуется извлечь, и служба создает требуемые выходные данные.
Интегрированная предварительная обработка. Преимущества встроенных шагов предварительной обработки, таких как транскрибирование, диаризация и обнаружение ролей, предоставляя широкий контекст для генеривных моделей.
Адаптация сценария. Адаптируйте службу к вашим требованиям, создав настраиваемые поля и извлекая соответствующие данные.

Шаблоны анализатора аудиоанализатора для распознавания содержимого

Content Understanding предлагает настраиваемые шаблоны аудиоанализатора:

Анализ после вызова. Анализ записей вызовов для создания расшифровок бесед, сводок вызовов, оценки тональности и т. д.
Анализ беседы. Создание транскрибирования, сводок и оценки тональности из аудиозаписей беседы.

Начните с шаблона или создайте пользовательский анализатор для удовлетворения конкретных бизнес-потребностей.

Требования к входным данным

Подробный список поддерживаемых звуковых форматов см. на странице ограничений службы и кодеков .

Поддерживаемые языки и регионы

Полный список поддерживаемых регионов, языков и языковых стандартов см . на странице поддержки языков и регионов.

Конфиденциальность и безопасность данных

Разработчики, использующие Content Understanding, должны просматривать политики Майкрософт по данным клиентов. Дополнительные сведения см. на странице "Данные", "Защита" и "Конфиденциальность ".

Следующие шаги

Попробуйте обработать звуковое содержимое с помощью службы "Основные сведения о содержимом" на портале Azure AI Foundry.
Узнайте, как анализировать шаблоны анализатора содержимого аудио.
Просмотрите пример кода: извлечение звукового содержимого.
Просмотрите пример кода: шаблоны анализаторов.

Поделиться через