Решения для распознавания содержимого (предварительная версия)
Внимание
- Служба "Распознавание содержимого ИИ Azure" доступна в предварительной версии. Общедоступные предварительные выпуски предоставляют ранний доступ к функциям, которые находятся в активной разработке.
- Функции, подходы и процессы могут изменяться или иметь ограниченные возможности до общедоступной доступности.
- Дополнительные сведения см. в дополнительных условиях использования для предварительных версий Microsoft Azure.
Распознавание содержимого аудиоанализаторов позволяет транскрибировать и диаризации беседного звука, извлекать структурированные поля, такие как сводки, тональности и ключевые темы. Настройте шаблон аудиоанализатора в соответствии с потребностями бизнеса с помощью портала Azure AI Foundry, чтобы начать создание результатов.
Ниже приведены распространенные сценарии использования службы "Распознавание содержимого" с данными беседы:
- Получите аналитические сведения о клиентах с помощью анализа сводных данных и анализа тональности.
- Оценка и проверка качества звонков и соответствия в центрах вызовов.
- Создание автоматических сводок и метаданных для публикации podcast.
Возможности анализатора звука
Content Understanding служит краеугольным камнем для решений управления ресурсами мультимедиа, что позволяет использовать следующие возможности для аудиофайлов:
Извлечение содержимого
Транскрибирование. Преобразует аудиозапись беседы в доступные для поиска и анализируемые текстовые расшифровки в формате WebVTT. Настраиваемые поля можно создать из данных транскрибирования. Метки времени и метки времени уровня предложения доступны по запросу.
Diarization
. Различает динамиков в беседе, приписав части расшифровки конкретным ораторам.Обнаружение роли докладчика. Определяет роли агента и клиента в контактных данных центра звонков.
Обнаружение языка. Автоматически обнаруживает язык в аудио или использует указанные указания языка или языкового стандарта.
Извлечение полей
Извлечение полей позволяет извлекать структурированные данные из звуковых файлов, таких как сводки, тональности и упомянутые сущности из журналов вызовов. Сначала можно настроить рекомендуемый шаблон анализатора или создать его с нуля.
Основные преимущества
Content Understanding предлагает расширенные возможности звука, в том числе:
Настраиваемое извлечение данных. Настройте выходные данные в соответствии с вашими потребностями, изменив схему поля, что позволяет точно создавать и извлекать данные.
Генеривные модели. Используйте модели создания искусственного интеллекта для указания на естественном языке содержимого, которое требуется извлечь, и служба создает требуемые выходные данные.
Интегрированная предварительная обработка. Преимущества встроенных шагов предварительной обработки, таких как транскрибирование, диаризация и обнаружение ролей, предоставляя широкий контекст для генеривных моделей.
Адаптация сценария. Адаптируйте службу к вашим требованиям, создав настраиваемые поля и извлекая соответствующие данные.
Шаблоны анализатора аудиоанализатора для распознавания содержимого
Content Understanding предлагает настраиваемые шаблоны аудиоанализатора:
Анализ после вызова. Анализ записей вызовов для создания расшифровок бесед, сводок вызовов, оценки тональности и т. д.
Анализ беседы. Создание транскрибирования, сводок и оценки тональности из аудиозаписей беседы.
Начните с шаблона или создайте пользовательский анализатор для удовлетворения конкретных бизнес-потребностей.
Требования к входным данным
Подробный список поддерживаемых звуковых форматов см. на странице ограничений службы и кодеков .
Поддерживаемые языки и регионы
Полный список поддерживаемых регионов, языков и языковых стандартов см . на странице поддержки языков и регионов.
Конфиденциальность и безопасность данных
Разработчики, использующие Content Understanding, должны просматривать политики Майкрософт по данным клиентов. Дополнительные сведения см. на странице "Данные", "Защита" и "Конфиденциальность ".
Следующие шаги
- Попробуйте обработать звуковое содержимое с помощью службы "Основные сведения о содержимом" на портале Azure AI Foundry.
- Узнайте, как анализировать шаблоны анализатора содержимого аудио.
- Просмотрите пример кода: извлечение звукового содержимого.
- Просмотрите пример кода: шаблоны анализаторов.