Wprowadzenie
Możliwości mowy sztucznej inteligencji umożliwiają zarządzanie systemami domowymi i automatycznymi za pomocą instrukcji głosowych, uzyskiwanie odpowiedzi z komputerów na pytania mówione, generowanie podpisów z dźwięku i wiele innych.
Aby umożliwić taką interakcję, system sztucznej inteligencji musi obsługiwać co najmniej dwie możliwości:
- Rozpoznawanie mowy — możliwość wykrywania i interpretowania wypowiedzianych danych wejściowych
- Synteza mowy — możliwość generowania mówionych danych wyjściowych
Usługa Azure AI Speech oferuje funkcje zamiany mowy na tekst, zamianę tekstu na mowę i tłumaczenie mowy za pomocą rozpoznawania i syntezy mowy. Możesz użyć wstępnie utworzonych i niestandardowych modeli usługi Rozpoznawanie mowy dla różnych zadań, od transkrypcji dźwięku po tekst z wysoką dokładnością, do identyfikowania osób mówiących w konwersacjach, tworzenia niestandardowych głosów i nie tylko. Następnie dowiesz się, jak działają funkcje mowy sztucznej inteligencji.