Wprowadzenie

Ukończone

Możliwości mowy sztucznej inteligencji umożliwiają zarządzanie systemami domowymi i automatycznymi za pomocą instrukcji głosowych, uzyskiwanie odpowiedzi z komputerów na pytania mówione, generowanie podpisów z dźwięku i wiele innych.

Aby umożliwić taką interakcję, system sztucznej inteligencji musi obsługiwać co najmniej dwie możliwości:

  • Rozpoznawanie mowy — możliwość wykrywania i interpretowania wypowiedzianych danych wejściowych
  • Synteza mowy — możliwość generowania mówionych danych wyjściowych

Usługa Azure AI Speech oferuje funkcje zamiany mowy na tekst, zamianę tekstu na mowę i tłumaczenie mowy za pomocą rozpoznawania i syntezy mowy. Możesz użyć wstępnie utworzonych i niestandardowych modeli usługi Rozpoznawanie mowy dla różnych zadań, od transkrypcji dźwięku po tekst z wysoką dokładnością, do identyfikowania osób mówiących w konwersacjach, tworzenia niestandardowych głosów i nie tylko. Następnie dowiesz się, jak działają funkcje mowy sztucznej inteligencji.