Rozwiązania audio usługi Content Understanding (wersja zapoznawcza)

Artykuł
01/16/2025

Ważne

Usługa Azure AI Content Understanding jest dostępna w wersji zapoznawczej. Publiczne wersje zapoznawcze zapewniają wczesny dostęp do funkcji, które są w aktywnym rozwoju.
Funkcje, podejścia i procesy mogą ulec zmianie lub mieć ograniczone możliwości przed ogólną dostępnością.
Aby uzyskać więcej informacji, zobacz Dodatkowe warunki użytkowania dla wersji zapoznawczych platformy Microsoft Azure.

Analizatory audio usługi Content Understanding umożliwiają transkrypcję i diaryzacja dźwięku konwersacyjnego, wyodrębniając pola ustrukturyzowane, takie jak podsumowania, tonacje i kluczowe tematy. Dostosuj szablon analizatora audio do potrzeb biznesowych przy użyciu portalu Azure AI Foundry, aby rozpocząć generowanie wyników.

Poniżej przedstawiono typowe scenariusze korzystania z usługi Content Understanding z danymi audio konwersacji:

Uzyskaj szczegółowe informacje o klientach dzięki podsumowaniu i analizie tonacji.
Ocenianie i weryfikowanie jakości połączeń i zgodności w centrach obsługi telefonicznej.
Tworzenie automatycznych podsumowań i metadanych na potrzeby publikowania podcastów.

Możliwości analizatora audio

Usługa Content Understanding służy jako podstawa rozwiązań do zarządzania zasobami multimediów, umożliwiając następujące możliwości dla plików audio:

Wyodrębnianie zawartości

Transkrypcja. Konwertuje audio konwersacyjne na transkrypcje oparte na wyszukiwaniu i analizowaniu na podstawie tekstu w formacie WebVTT. Pola dostosowywalne można wygenerować na podstawie danych transkrypcji. Znaczniki czasu na poziomie zdania i na poziomie wyrazu są dostępne na żądanie.
Diarization. Rozróżnia osoby mówiące w konwersacji, przypisując części transkrypcji określonym głośnikom.
Wykrywanie roli osoby mówiącej. Identyfikuje agenta i role klientów w danych połączeń centrum kontaktów.
Wykrywanie języka. Automatycznie wykrywa język w dźwięku lub używa określonych wskazówek dotyczących języka/ustawień regionalnych.

Wyodrębnianie pól

Wyodrębnianie pól umożliwia wyodrębnianie danych ustrukturyzowanych z plików audio, takich jak podsumowania, tonacje i wymienione jednostki z dzienników wywołań. Możesz zacząć od dostosowania sugerowanego szablonu analizatora lub utworzenia go od podstaw.

Najważniejsze korzyści

Usługa Content Understanding oferuje zaawansowane funkcje audio, w tym:

Dostosowywalne wyodrębnianie danych. Dostosuj dane wyjściowe do konkretnych potrzeb, modyfikując schemat pola, umożliwiając precyzyjne generowanie i wyodrębnianie danych.
Modele generowania. Użyj modeli generacyjnych sztucznej inteligencji, aby określić w języku naturalnym zawartość, którą chcesz wyodrębnić, a usługa generuje żądane dane wyjściowe.
Zintegrowane wstępne przetwarzanie. Skorzystaj z wbudowanych kroków przetwarzania wstępnego, takich jak transkrypcja, diaryzacja i wykrywanie ról, zapewniając bogaty kontekst dla modeli generowania.
Możliwość dostosowywania scenariusza. Dostosuj usługę do swoich wymagań, generując pola niestandardowe i wyodrębniając odpowiednie dane.

Szablony analizatora audio usługi Content Understanding

Usługa Content Understanding oferuje dostosowywalne szablony analizatora audio:

Analiza po wywołaniu. Przeanalizuj nagrania połączeń, aby wygenerować transkrypcje konwersacji, podsumowania wywołań, oceny tonacji i nie tylko.
Analiza konwersacji. Generowanie transkrypcji, podsumowań i ocen tonacji na podstawie nagrań audio konwersacji.

Zacznij od szablonu lub utwórz analizator niestandardowy, aby spełnić określone potrzeby biznesowe.

Wymagania dotyczące danych wejściowych

Aby uzyskać szczegółową listę obsługiwanych formatów audio, zapoznaj się z naszą stroną Limity usług i koderów .

Obsługiwane języki i regiony

Aby uzyskać pełną listę obsługiwanych regionów, języków i ustawień regionalnych, zobacz naszą stronę Obsługa języków i regionów.

Prywatność i zabezpieczenia danych

Deweloperzy korzystający z usługi Content Understanding powinni przejrzeć zasady firmy Microsoft dotyczące danych klientów. Aby uzyskać więcej informacji, odwiedź naszą stronę Dane, ochrona i prywatność .

Następne kroki

Spróbuj przetwarzać zawartość audio przy użyciu usługi Content Understanding w portalu usługi Azure AI Foundry.
Dowiedz się, jak analizować szablony analizatora zawartości audio.
Przejrzyj przykładowy kod: wyodrębnianie zawartości audio.
Przejrzyj przykładowy kod: szablony analizatora.

Udostępnij za pośrednictwem