Een Azure AI-spraakherkennings- en generatietechnologie kiezen
Azure AI-services helpen ontwerpers en ontwikkelaars van workloads om intelligente, geavanceerde, marktklare en verantwoordelijke toepassingen te maken met kant-en-klare en vooraf gebouwde en aanpasbare API's en modellen.
In dit artikel worden Azure AI-services behandeld die spraakherkennings- en generatiemogelijkheden bieden, zoals spraak-naar-tekst- en tekst-naar-spraakconversies, audioomzetting, sprekerherkenning en leesondersteuning voor mensen met leerverschillen.
Notitie
Als u inzichten wilt verzamelen over termen of woordgroepen of gedetailleerde contextuele analyse van gesproken of geschreven taal wilt krijgen, raadpleegt u Een op Azure AI gerichte taalverwerkingstechnologie kiezen.
Services
De volgende Azure AI-services kunnen spraakherkennings- en generatiemogelijkheden bieden voor uw workload.
Azure AI Speech biedt verwerking van natuurlijke taal voor tekstanalyse.
- Gebruik de Speech-service wanneer u gesproken spraak moet transcriberen of vertalen, sprekers in een gesprek identificeren. U kunt de service ook gebruiken als een goedkoper alternatief voor natuurlijke klinkende spraakgeneratie naar de hogere kwaliteit Whisper in de OpenAI-modellen.
- Gebruik de Speech-service niet voor chatten, samenvatting van inhoud, toezicht of het begeleiden van gebruikers via scripts. Gebruik in plaats daarvan andere modellen voor die dingen.
Insluitende lezer is een hulpprogramma waarmee bewezen technieken worden geïmplementeerd om het leesbegrip voor opkomende lezers, taalleerders en mensen met leerverschillen te verbeteren.
- Gebruik Insluitende lezer om een verbeterde leesbaarheid te bieden die is afgestemd op taalleerders of mensen met leerverschillen.
- Gebruik geen Insluitende lezer voor traditionele tekst-naar-spraakgebruiksvoorbeelden.
Azure AI Spraak
Azure AI Speech biedt spraak-naar-tekst- en tekst-naar-spraakmogelijkheden met een Spraak-resource. U kunt spraak naar tekst transcriberen met hoge nauwkeurigheid, natuurlijke klinkende tekst naar spraakstemmen produceren, gesproken audio vertalen en sprekerherkenning gebruiken tijdens gesprekken. Maak aangepaste stemmen, voeg specifieke woorden toe aan uw basiswoordenlijst of ontwikkel uw eigen modellen. Voer Spraak uit, waar u maar wilt: in de cloud of aan de rand in containers.
Spraak is beschikbaar voor veel talen en regio's.
Functies
De volgende tabel bevat een lijst met mogelijkheden die beschikbaar zijn in de Azure AI Speech-service.
Mogelijkheid | Beschrijving |
---|---|
Batchtranscriptie | Transcribeer een grote hoeveelheid audiogegevens in de opslag. Zowel de REST API voor spraak-naar-tekst als speech-CLI bieden ondersteuning voor batchtranscriptie. |
Intentieherkenning | Een intentie is iets dat de gebruiker wil doen: een vlucht reserveren, de weersverwachting controleren of iemand bellen. Met intentieherkenning kunnen uw toepassingen, hulpprogramma's en apparaten bepalen wat de gebruiker wil initiëren of doen op basis van opties. U definieert de intentie van de gebruiker in het CLU-model (Intent Recognizer of Conversational Language Understanding). |
Uitspraakbeoordeling | Evalueert de uitspraak van spraak en geeft sprekers feedback over de nauwkeurigheid en de vloeiendheid van gesproken audio. |
Sprekerherkenning | Sprekerherkenning kan helpen bepalen wie er spreekt in een audioclip. De service kan sprekers verifiëren en identificeren op basis van hun unieke spraakkenmerken, met behulp van spraakbiometrie. |
Spraak naar tekst | Converteert audiostreams naar tekst in realtime of in batch. |
Tekst naar spraak | Hiermee kunnen uw toepassingen, hulpprogramma's of apparaten tekst omzetten in menselijke gesynthetiseerde spraak. |
Spraakomzetting | Biedt spraak-naar-spraak- en spraak-naar-tekstomzetting van audiostreams in meerdere talen. |
Videovertaling | Vertaal en genereer automatisch video's in meerdere talen. |
Gebruiksgevallen
In de volgende tabel worden enkele manieren beschreven waarop u Azure AI Speech kunt gebruiken.
Gebruiksscenario | Mogelijkheid om te gebruiken | Beschrijving |
---|---|---|
Audio-inhoud maken | Spraak-naar-tekst | U kunt neurale stemmen gebruiken om interacties met chatbots en spraakassistenten natuurlijker en aantrekkelijker te maken, digitale teksten zoals e-books te converteren naar audioboeken en navigatiesystemen in de auto te verbeteren. |
Transcriptie van callcenter | Spraak-naar-tekst | U kunt aanroepen in realtime transcriberen of een batch aan aanroepen verwerken, persoonlijke identificatiegegevens redacteren en inzichten extraheren, zoals sentiment om u te helpen met de use-case van uw callcenter. |
Ondertiteling | Spraak-naar-tekst | Synchroniseer bijschriften met uw invoeraudio, pas grof taalgebruiksfilters toe, haal gedeeltelijke resultaten op, pas aanpassingen toe en identificeer gesproken talen voor meertalige scenario's. |
Taalonderwijs | Spraak-naar-tekst | Geef feedback over de beoordeling van de uitspraak aan taalleerders, ondersteuning voor realtime transcriptie voor externe leergesprekken en lees lesmateriaal hardop voor met neurale stemmen. |
Spraakassistenten | Tekst-naar-spraak | Maak natuurlijke, menselijke, gespreksinterfaces voor hun toepassingen en ervaringen. De functie spraakassistent biedt snelle en betrouwbare interactie tussen een apparaat en een assistent-implementatie. |
Insluitende lezer
Insluitende lezer, onderdeel van Azure AI-services, is een inclusief ontworpen hulpprogramma waarmee bewezen technieken worden geïmplementeerd om het leesbegrip voor nieuwe lezers, taalleerders en mensen met leerverschillen zoals dyslexie te verbeteren. Met de Insluitende lezer-clientbibliotheek kunt u dezelfde technologie gebruiken die wordt gebruikt in Microsoft Word en Microsoft OneNote om de gebruikers van uw workload een geweldige ervaring te bieden.
Functies
Hier volgt een lijst met mogelijkheden die uw workload kan gebruiken om uw gebruikers te helpen hun leesbegripdoelen te bereiken.
- Inhoud isoleren om de leesbaarheid te verbeteren
- Afbeeldingen weergeven voor algemene woorden en termen
- Hulp bij het begrijpen van spraak- en grammaticaonderdelen door werkwoorden, zelfstandige naamwoorden, voornaamwoorden en meer te markeren
- Inhoud hardop voorlezen, zoals door de gebruiker geselecteerde tekst in de gebruikersinterface van uw workload
- Vertaal inhoud in veel talen in realtime, wat helpt bij het verbeteren van het begrip voor lezers die een nieuwe taal leren
- Woorden opsplitsen in lettergrepen om de leesbaarheid te verbeteren of nieuwe woorden te laten klinken
Volgende stappen
- Wat is de Speech-service?
- Leertraject: Oplossingen voor natuurlijke taalverwerking ontwikkelen met Azure AI-services