Delen via


Een Azure AI-spraakherkennings- en generatietechnologie kiezen

Azure AI-services helpen ontwerpers en ontwikkelaars van workloads om intelligente, geavanceerde, marktklare en verantwoordelijke toepassingen te maken met kant-en-klare en vooraf gebouwde en aanpasbare API's en modellen.

In dit artikel worden Azure AI-services behandeld die spraakherkennings- en generatiemogelijkheden bieden, zoals spraak-naar-tekst- en tekst-naar-spraakconversies, audioomzetting, sprekerherkenning en leesondersteuning voor mensen met leerverschillen.

Notitie

Als u inzichten wilt verzamelen over termen of woordgroepen of gedetailleerde contextuele analyse van gesproken of geschreven taal wilt krijgen, raadpleegt u Een op Azure AI gerichte taalverwerkingstechnologie kiezen.

Services

De volgende Azure AI-services kunnen spraakherkennings- en generatiemogelijkheden bieden voor uw workload.

  • Azure AI Speech biedt verwerking van natuurlijke taal voor tekstanalyse.

    • Gebruik de Speech-service wanneer u gesproken spraak moet transcriberen of vertalen, sprekers in een gesprek identificeren. U kunt de service ook gebruiken als een goedkoper alternatief voor natuurlijke klinkende spraakgeneratie naar de hogere kwaliteit Whisper in de OpenAI-modellen.
    • Gebruik de Speech-service niet voor chatten, samenvatting van inhoud, toezicht of het begeleiden van gebruikers via scripts. Gebruik in plaats daarvan andere modellen voor die dingen.
  • Insluitende lezer is een hulpprogramma waarmee bewezen technieken worden geïmplementeerd om het leesbegrip voor opkomende lezers, taalleerders en mensen met leerverschillen te verbeteren.

    • Gebruik Insluitende lezer om een verbeterde leesbaarheid te bieden die is afgestemd op taalleerders of mensen met leerverschillen.
    • Gebruik geen Insluitende lezer voor traditionele tekst-naar-spraakgebruiksvoorbeelden.

Azure AI Spraak

Azure AI Speech biedt spraak-naar-tekst- en tekst-naar-spraakmogelijkheden met een Spraak-resource. U kunt spraak naar tekst transcriberen met hoge nauwkeurigheid, natuurlijke klinkende tekst naar spraakstemmen produceren, gesproken audio vertalen en sprekerherkenning gebruiken tijdens gesprekken. Maak aangepaste stemmen, voeg specifieke woorden toe aan uw basiswoordenlijst of ontwikkel uw eigen modellen. Voer Spraak uit, waar u maar wilt: in de cloud of aan de rand in containers.

Spraak is beschikbaar voor veel talen en regio's.

Functies

De volgende tabel bevat een lijst met mogelijkheden die beschikbaar zijn in de Azure AI Speech-service.

Mogelijkheid Beschrijving
Batchtranscriptie Transcribeer een grote hoeveelheid audiogegevens in de opslag. Zowel de REST API voor spraak-naar-tekst als speech-CLI bieden ondersteuning voor batchtranscriptie.
Intentieherkenning Een intentie is iets dat de gebruiker wil doen: een vlucht reserveren, de weersverwachting controleren of iemand bellen. Met intentieherkenning kunnen uw toepassingen, hulpprogramma's en apparaten bepalen wat de gebruiker wil initiëren of doen op basis van opties. U definieert de intentie van de gebruiker in het CLU-model (Intent Recognizer of Conversational Language Understanding).
Uitspraakbeoordeling Evalueert de uitspraak van spraak en geeft sprekers feedback over de nauwkeurigheid en de vloeiendheid van gesproken audio.
Sprekerherkenning Sprekerherkenning kan helpen bepalen wie er spreekt in een audioclip. De service kan sprekers verifiëren en identificeren op basis van hun unieke spraakkenmerken, met behulp van spraakbiometrie.
Spraak naar tekst Converteert audiostreams naar tekst in realtime of in batch.
Tekst naar spraak Hiermee kunnen uw toepassingen, hulpprogramma's of apparaten tekst omzetten in menselijke gesynthetiseerde spraak.
Spraakomzetting Biedt spraak-naar-spraak- en spraak-naar-tekstomzetting van audiostreams in meerdere talen.
Videovertaling Vertaal en genereer automatisch video's in meerdere talen.

Gebruiksgevallen

In de volgende tabel worden enkele manieren beschreven waarop u Azure AI Speech kunt gebruiken.

Gebruiksscenario Mogelijkheid om te gebruiken Beschrijving
Audio-inhoud maken Spraak-naar-tekst U kunt neurale stemmen gebruiken om interacties met chatbots en spraakassistenten natuurlijker en aantrekkelijker te maken, digitale teksten zoals e-books te converteren naar audioboeken en navigatiesystemen in de auto te verbeteren.
Transcriptie van callcenter Spraak-naar-tekst U kunt aanroepen in realtime transcriberen of een batch aan aanroepen verwerken, persoonlijke identificatiegegevens redacteren en inzichten extraheren, zoals sentiment om u te helpen met de use-case van uw callcenter.
Ondertiteling Spraak-naar-tekst Synchroniseer bijschriften met uw invoeraudio, pas grof taalgebruiksfilters toe, haal gedeeltelijke resultaten op, pas aanpassingen toe en identificeer gesproken talen voor meertalige scenario's.
Taalonderwijs Spraak-naar-tekst Geef feedback over de beoordeling van de uitspraak aan taalleerders, ondersteuning voor realtime transcriptie voor externe leergesprekken en lees lesmateriaal hardop voor met neurale stemmen.
Spraakassistenten Tekst-naar-spraak Maak natuurlijke, menselijke, gespreksinterfaces voor hun toepassingen en ervaringen. De functie spraakassistent biedt snelle en betrouwbare interactie tussen een apparaat en een assistent-implementatie.

Insluitende lezer

Insluitende lezer, onderdeel van Azure AI-services, is een inclusief ontworpen hulpprogramma waarmee bewezen technieken worden geïmplementeerd om het leesbegrip voor nieuwe lezers, taalleerders en mensen met leerverschillen zoals dyslexie te verbeteren. Met de Insluitende lezer-clientbibliotheek kunt u dezelfde technologie gebruiken die wordt gebruikt in Microsoft Word en Microsoft OneNote om de gebruikers van uw workload een geweldige ervaring te bieden.

Functies

Hier volgt een lijst met mogelijkheden die uw workload kan gebruiken om uw gebruikers te helpen hun leesbegripdoelen te bereiken.

  • Inhoud isoleren om de leesbaarheid te verbeteren
  • Afbeeldingen weergeven voor algemene woorden en termen
  • Hulp bij het begrijpen van spraak- en grammaticaonderdelen door werkwoorden, zelfstandige naamwoorden, voornaamwoorden en meer te markeren
  • Inhoud hardop voorlezen, zoals door de gebruiker geselecteerde tekst in de gebruikersinterface van uw workload
  • Vertaal inhoud in veel talen in realtime, wat helpt bij het verbeteren van het begrip voor lezers die een nieuwe taal leren
  • Woorden opsplitsen in lettergrepen om de leesbaarheid te verbeteren of nieuwe woorden te laten klinken

Volgende stappen