Samenvatting

1 minuut

In deze module hebt u geleerd over twee belangrijke aspecten van spraaktechnologie: spraakherkenning en synthese. Spraakherkenning omvat het omzetten van gesproken woorden in gegevens, vaak getranscribeerd in tekst, met behulp van een akoestisch model en een taalmodel. Deze tekst kan worden gebruikt voor verschillende doeleinden, zoals ondertiteling, transcripties, geautomatiseerde notitiedicteren en verwerking van gebruikersinvoer. Spraaksynthese gaat daarentegen over stemgegevens, meestal door tekst naar spraak te converteren. Gesynthetiseerde spraak kan worden gebruikt voor het genereren van gesproken antwoorden, het maken van spraakmenu's, het voorlezen van e-mailberichten of teksten en het uitzenden van aankondigingen. U hebt ook geleerd over de AI Speech-service van Microsoft Azure, die spraakherkennings- en synthesemogelijkheden biedt via functies zoals spraak-naar-tekst- en tekst-naar-spraak-API's.

De belangrijkste punten van deze module zijn de functionaliteiten van de Azure AI Speech-service. Met de Spraak-naar-tekst-API kunt u realtime transcriptie van audio in tekst uitvoeren met behulp van een model op basis van het Universal Language Model dat door Microsoft is getraind. Het kan worden gebruikt voor realtime transcripties tijdens presentaties of demo's, of voor batchtranscripties van opgeslagen audiobestanden. De Text to Speech-API converteert tekstinvoer naar hoorbare spraak, die kan worden aangepast met verschillende stemmen, talen en regionale uitsprakenAzure AI Speech is een veelzijdig hulpprogramma dat toegankelijk is via verschillende platforms zoals Azure AI Speech Studio, Azure AI Studio, Opdrachtregelinterface (CLI), REST API's en SDK's (Software Development Kits).

Meer informatie over Azure AI Speech vindt u in de servicedocumentatie.

Samenvatting

Feedback