Wprowadzenie

Ukończone

Załóżmy, że jesteś deweloperem, który pracuje w firmie zajmującej się transkrypcją medyczną. Klienci Twojej firmy są zespołem lekarzy, którzy rejestrują swoje notatki jako pliki dźwiękowe na ręcznych cyfrowych rejestratorach głosowych. Udostępniają swoje pliki firmie za pośrednictwem udostępnionego dysku w chmurze, a ich notatki są kombinacją krótkich notatek i dłuższych dyktowania.

Twoja firma musi utrzymywać dużą liczbę pracowników transkrypcji, a te dwa typy plików audio stanowią interesujące wyzwania dla Twojej firmy:

  • Transkrypcje firmy wymagają dużo czasu na przetworzenie ilości krótkich notatek od klientów, dlatego trudno jest firmie zwrócić transkrypcje w przedziale czasowym zdefiniowanym w umowie dotyczącej poziomu usług (SLA) firmy.

  • Dłuższe dyktowania często nie można transkrybować w jednej sesji, a transkrypcji firmy trudno pamiętać, gdzie odeszli podczas poprzedniej sesji.

Wiesz już, że usługi sztucznej inteligencji platformy Azure firmy Microsoft udostępniają deweloperom interfejsy API do tworzenia aplikacji korzystających z funkcji zamiany mowy na mowę platformy Azure na funkcje tekstowe, a kierownik poprosił Cię o zbadanie, jak można używać mowy do funkcji tekstowych w celu utworzenia aplikacji, której można użyć do przesunięcia niektórych zadań transkrypcji, zmniejszając w ten sposób niektóre problemy z kosztami operacyjnymi i umową dotyczącą poziomu usług.

W tym module dowiesz się, jak za pomocą usług Azure AI utworzyć mowę na aplikację tekstową, która konwertuje przykładowy plik WAVE na tekst.