Dela via


Uttalsutvärdering i Azure AI Foundry-portalen

Viktigt!

Objekt markerade (förhandsversion) i den här artikeln är för närvarande i offentlig förhandsversion. Den här förhandsversionen tillhandahålls utan ett serviceavtal och vi rekommenderar det inte för produktionsarbetsbelastningar. Vissa funktioner kanske inte stöds eller kan vara begränsade. Mer information finns i Kompletterande villkor för användning av Microsoft Azure-förhandsversioner.

Uttalsbedömningen använder tal till text-funktionen för att ge subjektiv och objektiv feedback för språksträvare. Att öva uttal och få feedback i tid är viktigt för att förbättra språkkunskaperna. Utvärderingar som drivs av erfarna lärare kan ta mycket tid och arbete och göra en högkvalitativ utvärdering dyr för eleverna. Uttalsbedömning kan göra språkbedömningen mer engagerande och tillgänglig för elever med alla bakgrunder.

Kommentar

Information om tillgänglighet för uttalsutvärdering finns i språk som stöds och tillgängliga regioner.

Den här artikeln beskriver hur du använder uttalsutvärderingsverktyget utan att skriva någon kod via AI Foundry. Information om hur du integrerar uttalsbedömning i dina talprogram finns i Använda uttalsbedömning.

Läs- och talscenarier

För uttalsbedömning finns det två scenarier: Läsning och tal.

  • Läsning: Det här scenariot är utformat för skriptutvärdering. Det kräver att eleven läser en viss text. Referenstexten tillhandahålls i förväg.
  • Talar: Det här scenariot är utformat för oskriven utvärdering. Det kräver att eleven talar om ett visst ämne. Referenstexten anges inte i förväg.

Utföra en skriptad utvärdering

Följ dessa steg för att utvärdera uttalet av referenstexten:

  1. Gå till Uttalsbedömning i AI Foundry.

    Skärmbild av hur du går till uttalsbedömning i AI Foundry.

  2. På fliken Läs väljer du ett språk som stöds och som du vill utvärdera uttalet.

    Skärmbild av att välja ett språk som stöds på läsfliken som du vill utvärdera uttalet.

  3. Du kan använda etablerade textexempel eller ange ett eget skript.

    När du läser texten bör du vara nära mikrofonen för att se till att den inspelade rösten inte är för låg.

    Skärmbild av var du kan spela in ljud med en mikrofon på läsfliken.

    Annars kan du ladda upp inspelat ljud för uttalsbedömning. När det har laddats upp utvärderas ljudet automatiskt av systemet, enligt följande skärmbild.

    Skärmbild av uppladdning av inspelat ljud som ska utvärderas.

Utföra en oskriven utvärdering

Om du vill utföra en oskriven utvärdering väljer du fliken Talar. Med den här funktionen kan du utföra oskrivna utvärderingar utan att ange referenstext i förväg. Så här går du tillväga:

  1. Gå till Uttalsbedömning i AI Foundry.

  2. På fliken Tal väljer du ett språk som stöds och som du vill utvärdera uttalet.

    Skärmbild av att välja ett språk som stöds på talarfliken som du vill utvärdera uttalet.

  3. Sedan kan du välja bland exempelämnen som tillhandahålls eller ange ett eget ämne. Med det här valet kan du utvärdera din förmåga att tala om ett visst ämne utan ett fördefinierat skript.

    Skärmbild av inmatning av ett ämne på talarfliken för att utvärdera din förmåga att tala om ett visst ämne utan ett fördefinierat skript.

    När du spelar in ditt tal för uttalsbedömning är det viktigt att se till att inspelningstiden ligger inom det rekommenderade intervallet 15 sekunder (motsvarande mer än 50 ord) till 10 minuter. Det här tidsintervallet är optimalt för att utvärdera innehållet i ditt tal korrekt. Om du vill få en ämnespoäng ska ditt talade ljud innehålla minst tre meningar.

    Du kan också ladda upp inspelat ljud för uttalsbedömning. När det har laddats upp utvärderas ljudet automatiskt av systemet.

Utvärderingsresultat för uttal

När du har spelat in ditt tal eller laddat upp det inspelade ljudet matas resultatet av utvärderingen ut. Resultatet inkluderar ditt talade ljud och feedback om din talutvärdering. Du kan lyssna på ditt talade ljud och ladda ned det om det behövs.

Du kan också kontrollera uttalsutvärderingsresultatet i JSON. Precisionspoängen på ordnivå, stavelsenivå och fonetiknivå ingår i JSON-filen.

Skärmbild som visar utvärderingsresultatet i visningsfönstret, som innehåller avskrift och feedback om ditt tal.

Ordet är markerat enligt feltypen. Feltyperna i uttalsbedömningen representeras med olika färger. Den här visuella skillnaden gör det enklare att identifiera och analysera specifika fel. Den ger en tydlig översikt över feltyperna och frekvenserna i det talade ljudet, vilket hjälper dig att fokusera på områden som behöver förbättras. Du kan växla på/av varje feltyp för att fokusera på specifika typer av fel eller exkludera vissa typer från visningen. Den här funktionen ger flexibilitet i hur du granskar och analyserar felen i ditt talade ljud. När du hovrar över varje ord kan du se noggrannhetspoäng för hela ordet eller specifika fonem.

Längst ned i utvärderingsresultatet visas bedömningsresultat. För skriptbaserad uttalsbedömning tillhandahålls endast uttalspoängen (inklusive noggrannhetspoäng, flytpoäng, fullständighetspoäng och prosodypoäng). För utvärdering av oskrivna uttal visas både uttalspoäng (inklusive noggrannhetspoäng, flytpoäng och prosodipoäng) och innehållspoäng (inklusive ordförrådspoäng, grammatikpoäng och ämnespoäng).

Uttalsbedömningens kornighet

Uttalsutvärdering ger olika utvärderingsresultat i olika kornigheter, från enskilda fonem till hela textinmatningen.

  • På fulltextnivå ger uttalsbedömning ytterligare fluency, completeness och Prosody-poäng: Fluency anger hur nära talet matchar en infödd talares användning av tysta pauser mellan ord; Fullständighet anger hur många ord som uttalas i talet till referenstextens indata. Prosody anger hur väl en talare förmedlar element av naturlighet, uttrycksfullhet och övergripande prosodi i sitt tal. En övergripande poäng aggregerad från Noggrannhet, Fluency, Completeness och Prosody ges sedan för att ange den övergripande uttalskvaliteten för det givna talet. Uttalsutvärdering erbjuder också innehållspoäng (vokabulär, grammatik och ämne) på fulltextnivå.
  • På ordnivå kan uttalsbedömning automatiskt identifiera fel och ge noggrannhetspoäng samtidigt, vilket ger mer detaljerad information om utelämnande, upprepning, infogningar och felpronunciation i det givna talet.
  • Precisionspoäng på stavelsenivå är för närvarande tillgängliga via JSON-filen eller Speech SDK.
  • På fonetiknivå ger uttalsbedömningen noggrannhetspoäng för varje fonme, vilket hjälper eleverna att bättre förstå uttalsinformationen i sitt tal.

Utöver baslinjepoängen för noggrannhet, flyt och fullständighet innehåller uttalsbedömningsfunktionen i AI Foundry mer omfattande poäng för att ge detaljerad feedback om olika aspekter av talprestanda och förståelse. De förbättrade poängen är följande: Prosody-poäng, Vokabulärpoäng, Grammatikpoäng och Ämnespoäng. Dessa poäng ger värdefulla insikter om talprosodi, ordförrådsanvändning, grammatik korrekthet och ämnesförståelse.

Skärmbild av övergripande uttalspoäng och övergripande innehållspoäng i AI Foundry.

Längst ned i utvärderingsresultatet visas två övergripande poäng: Uttalspoäng och Innehållspoäng. På fliken Läs hittar du uttalspoängen som visas. På fliken Tal visas både uttalspoängen och innehållspoängen.

Uttalspoäng: Den här poängen representerar en aggregerad bedömning av uttalskvaliteten och innehåller fyra underaspekter. Dessa poäng är tillgängliga på både läs- och talflikarna för både skriptade och oskrivna utvärderingar.

  • Noggrannhetspoäng: Utvärderar uttalets korrekthet.
  • Flytpoäng: Mäter nivån av jämnhet och naturlighet i tal.
  • Fullständighetspoäng: Visar antalet ord som uttalas korrekt.
  • Prosodypoäng: Utvärderar användningen av lämplig intonation, rytm och stress. Flera feltyper relaterade till prosody-utvärdering introduceras, till exempel Oväntad paus, Avbrott saknas och Monoton. Dessa feltyper ger mer detaljerad information om uttalsfel jämfört med föregående motor.

Innehållspoäng: Den här poängen ger en aggregerad utvärdering av innehållet i talet och innehåller tre underaspekter. Den här poängen är endast tillgänglig på talarfliken för en oskriven utvärdering.

  • Vokabulärpoäng: Utvärderar talarens effektiva användning av ord och deras lämplighet i den givna kontexten för att uttrycka idéer korrekt och nivån på lexikal komplexitet.
  • Grammatikpoäng: Utvärderar korrekt grammatikanvändning och olika meningsmönster. Den tar hänsyn till lexikal noggrannhet, grammatisk noggrannhet och mångfald av meningsstrukturer, vilket ger en mer omfattande utvärdering av språkkunskaper.
  • Ämnespoäng: Utvärderar nivån på förståelse och engagemang för ämnet som beskrivs i talet. Den utvärderar talarens förmåga att effektivt uttrycka tankar och idéer relaterade till det angivna ämnet.

Dessa övergripande poäng ger en omfattande utvärdering av både uttal och innehåll, vilket ger eleverna värdefull feedback om olika aspekter av deras talprestanda och förståelse. Med dessa förbättrade funktioner kan språkinlärarna få djupare insikter om sina fördelar och områden för förbättring av både uttal och innehållsuttryck.

Kommentar

Innehålls- och prosodyutvärderingar är endast tillgängliga i språkvarianten en-US .

Utvärderingspoäng i strömningsläge

Uttalsbedömning stöder oavbrutet strömningsläge. Ai Foundry-demonstrationen tillåter upp till 60 minuters inspelning i strömningsläge för utvärdering. Så länge du inte trycker på knappen stoppa inspelning slutförs inte utvärderingsprocessen och du kan pausa och återuppta utvärderingen på ett bekvämt sätt.

Uttalsbedömning utvärderar flera aspekter av uttalet. Längst ned i utvärderingsresultatet kan du se Uttalspoäng som aggregerad övergripande poäng, som innehåller 4 delaspekter: Noggrannhetspoäng, Fluency score, Completeness score och Prosody score. Eftersom noggrannhetspoängen, fluency-poängen och Prosody-poängen varierar över tid under inspelningsprocessen, visar vi en metod i AI Foundry för att visa ungefärlig övergripande poäng stegvis före slutet av utvärderingen, som endast viktades med Noggrannhetspoäng, Fluency-poäng och Prosody-poäng. Completeness-poängen beräknas endast i slutet av utvärderingen när du trycker på stoppknappen, så det slutliga uttalets övergripande poäng aggregeras från Noggrannhetspoäng, Fluency score, Completeness score och Prosody score med vikt.

Se demoexemplen nedan för hela processen med att utvärdera uttal i strömningsläge.

Starta inspelning

När du börjar spela in börjar poängen längst ned att ändras från 0.

Skärmbild av övergripande utvärderingspoäng när du börjar spela in.

Under inspelning

Under inspelningen av ett långt stycke kan du pausa inspelningen när som helst. Du kan fortsätta att utvärdera inspelningen så länge du inte trycker på stoppknappen.

Skärmbild av övergripande utvärderingspoäng vid inspelning.

Slutför inspelningen

När du har tryckt på stoppknappen kan du se uttalspoäng, noggrannhetspoäng, fluencypoäng, fullständighetspoäng och Prosody-poäng längst ned.

Skärmbild av övergripande utvärderingspoäng efter inspelning.

Prissättning

Som baslinje kostar användningen av uttalsbedömning samma sak som tal till text för prissättning på betala per användning eller åtagandenivå. Om du köper en åtagandenivå för tal till text går utgiften för uttalsbedömningen till att uppfylla åtagandet.

Uttalsutvärderingsfunktionen erbjuder även andra poäng som inte ingår i baslinjetalet till textpriset: prosody, grammatik, ämne och vokabulär. Dessa poäng är tillgängliga som en tilläggsavgift över baslinjetalet till textpriset. Information om priser finns i priser för tal till text.

Här är en tabell med tillgängliga utvärderingspoäng för uttal, oavsett om den är tillgänglig i skriptade eller oskrivna utvärderingar och om den ingår i baslinjetalet till textpriset eller tilläggspriset.

Poäng Skript eller oskriven Ingår i baslinjetal till textpris?
Noggrannhet Skript och oskriven Ja
Flyt Skript och oskriven Ja
Fullständighet Skript Ja
Fel Skript och oskriven Ja
Prosodi Skript och oskriven Nej
Grammatik Endast oskriven Nej
Område Endast oskriven Nej
Ordförråd Endast oskriven Nej

Ansvarsfull AI

Ett AI-system innehåller inte bara tekniken, utan även de personer som använder den, de personer som påverkas av den och miljön där den distribueras. Läs transparensanteckningarna om du vill veta mer om ansvarsfull AI-användning och distribution i dina system.

Nästa steg