Поделиться через


Решения для распознавания содержимого (предварительная версия)

Внимание

  • Служба "Распознавание содержимого ИИ Azure" доступна в предварительной версии. Общедоступные предварительные выпуски предоставляют ранний доступ к функциям, которые находятся в активной разработке.
  • Функции, подходы и процессы могут изменяться или иметь ограниченные возможности до общедоступной доступности.
  • Дополнительные сведения см. в дополнительных условиях использования для предварительных версий Microsoft Azure.

Распознавание содержимого аудиоанализаторов позволяет транскрибировать и диаризации беседного звука, извлекать структурированные поля, такие как сводки, тональности и ключевые темы. Настройте шаблон аудиоанализатора в соответствии с потребностями бизнеса с помощью портала Azure AI Foundry, чтобы начать создание результатов.

Ниже приведены распространенные сценарии использования службы "Распознавание содержимого" с данными беседы:

  • Получите аналитические сведения о клиентах с помощью анализа сводных данных и анализа тональности.
  • Оценка и проверка качества звонков и соответствия в центрах вызовов.
  • Создание автоматических сводок и метаданных для публикации podcast.

Возможности анализатора звука

Иллюстрация рабочего процесса распознавания содержимого.

Content Understanding служит краеугольным камнем для решений управления ресурсами мультимедиа, что позволяет использовать следующие возможности для аудиофайлов:

Извлечение содержимого

  • Транскрибирование. Преобразует аудиозапись беседы в доступные для поиска и анализируемые текстовые расшифровки в формате WebVTT. Настраиваемые поля можно создать из данных транскрибирования. Метки времени и метки времени уровня предложения доступны по запросу.

  • Diarization. Различает динамиков в беседе, приписав части расшифровки конкретным ораторам.

  • Обнаружение роли докладчика. Определяет роли агента и клиента в контактных данных центра звонков.

  • Обнаружение языка. Автоматически обнаруживает язык в аудио или использует указанные указания языка или языкового стандарта.

Извлечение полей

Извлечение полей позволяет извлекать структурированные данные из звуковых файлов, таких как сводки, тональности и упомянутые сущности из журналов вызовов. Сначала можно настроить рекомендуемый шаблон анализатора или создать его с нуля.

Основные преимущества

Content Understanding предлагает расширенные возможности звука, в том числе:

  • Настраиваемое извлечение данных. Настройте выходные данные в соответствии с вашими потребностями, изменив схему поля, что позволяет точно создавать и извлекать данные.

  • Генеривные модели. Используйте модели создания искусственного интеллекта для указания на естественном языке содержимого, которое требуется извлечь, и служба создает требуемые выходные данные.

  • Интегрированная предварительная обработка. Преимущества встроенных шагов предварительной обработки, таких как транскрибирование, диаризация и обнаружение ролей, предоставляя широкий контекст для генеривных моделей.

  • Адаптация сценария. Адаптируйте службу к вашим требованиям, создав настраиваемые поля и извлекая соответствующие данные.

Шаблоны анализатора аудиоанализатора для распознавания содержимого

Content Understanding предлагает настраиваемые шаблоны аудиоанализатора:

  • Анализ после вызова. Анализ записей вызовов для создания расшифровок бесед, сводок вызовов, оценки тональности и т. д.

  • Анализ беседы. Создание транскрибирования, сводок и оценки тональности из аудиозаписей беседы.

Начните с шаблона или создайте пользовательский анализатор для удовлетворения конкретных бизнес-потребностей.

Требования к входным данным

Подробный список поддерживаемых звуковых форматов см. на странице ограничений службы и кодеков .

Поддерживаемые языки и регионы

Полный список поддерживаемых регионов, языков и языковых стандартов см . на странице поддержки языков и регионов.

Конфиденциальность и безопасность данных

Разработчики, использующие Content Understanding, должны просматривать политики Майкрософт по данным клиентов. Дополнительные сведения см. на странице "Данные", "Защита" и "Конфиденциальность ".

Следующие шаги

  • Попробуйте обработать звуковое содержимое с помощью службы "Основные сведения о содержимом" на портале Azure AI Foundry.
  • Узнайте, как анализировать шаблоны анализатора содержимого аудио.
  • Просмотрите пример кода: извлечение звукового содержимого.
  • Просмотрите пример кода: шаблоны анализаторов.