Introduktion
Med AI-talfunktioner kan vi hantera hem- och autosystem med röstinstruktioner, få svar från datorer för talade frågor, generera bildtexter från ljud och mycket mer.
För att aktivera den här typen av interaktion måste AI-systemet ha stöd för minst två funktioner:
- Taligenkänning – möjligheten att identifiera och tolka talade indata
- Talsyntes – förmågan att generera talade utdata
Azure AI Speech tillhandahåller funktioner för tal till text, text till tal och talöversättning via taligenkänning och syntes. Du kan använda fördefinierade och anpassade Speech Service-modeller för en mängd olika uppgifter, från transkribering av ljud till text med hög noggrannhet, till att identifiera talare i konversationer, skapa anpassade röster med mera. Härnäst får du lära dig hur AI-talfunktioner fungerar.