REST API för tal till text

Artikel
11/12/2024

REST API för tal till text används för batch-transkription och anpassat tal.

Viktigt!

Rest API-versionen 2024-11-15 för tal till text är den senaste versionen som är allmänt tillgänglig.

Rest API-versionen 2024-05-15-preview för tal till text dras tillbaka vid ett datum som ska tillkännages.
Tal till text REST API v3.0, v3.1, v3.2, 3.2-preview.1och 3.2-preview.2 kommer att dras tillbaka den 1 april 2026.

Mer information om uppgradering finns i rest-API :et för tal till text v3.0 till v3.1, v3.1 till v3.2 och v3.2 till 2024-11-15 .

Se referensdokumentationen för REST API 2024-11-15 för tal till text

Använd REST API för tal till text för att:

Snabb transkription: Transkribera ljudfiler med återkommande resultat synkront och mycket snabbare än realtidsljud. Använd API:et för snabb transkription (/speechtotext/transkriptioner:transkribera) i de scenarier där du behöver avskriften av en ljudinspelning så snabbt som möjligt med förutsägbar svarstid, till exempel snabb transkription av ljud eller video eller videoöversättning.
Anpassat tal: Ladda upp dina egna data, testa och träna en anpassad modell, jämför noggrannheten mellan modeller och distribuera en modell till en anpassad slutpunkt. Kopiera modeller till andra prenumerationer om du vill att kollegor ska ha åtkomst till en modell som du har skapat, eller om du vill distribuera en modell till mer än en region.
Batch-transkription: Transkribera ljudfiler som en batch från flera URL:er eller en Azure-container.

REST API för tal till text innehåller sådana funktioner som:

Hämta loggar för varje slutpunkt om loggar begärs för slutpunkten.
Begär manifestet för de modeller som du skapar för att konfigurera lokala containrar.
Ladda upp data från Azure Storage-konton med hjälp av en SAS-URI (signatur för delad åtkomst).
Ta med ditt eget lagringsutrymme. Använd dina egna lagringskonton för loggar, transkriptionsfiler och andra data.
Vissa åtgärder stöder webhook-meddelanden. Du kan registrera dina webhooks där meddelanden skickas.

Batch-transkription

Följande åtgärdsgrupper gäller för batch-transkription.

Åtgärdsgrupp	beskrivning
Modeller	Använd basmodeller eller anpassade modeller för att transkribera ljudfiler. Du kan använda modeller med anpassad tal - och batch-transkription. Du kan till exempel använda en modell som tränats med en specifik datauppsättning för att transkribera ljudfiler. Se Träna en modell och en anpassad talmodells livscykel för exempel på hur du tränar och hanterar anpassade talmodeller.
Transkriptioner	Använd transkriptioner för att transkribera en stor mängd ljud i lagringen. När du använder batch-transkription skickar du flera filer per begäran eller pekar på en Azure Blob Storage-container med ljudfilerna som ska transkriberas. Se Skapa en transkription för exempel på hur du skapar en transkription från flera ljudfiler.
Webbkrokar	Använd webbkrokar för att ta emot meddelanden om händelser för skapande, bearbetning, slutförande och borttagning. Du kan använda webbkrokar med anpassad tal - och batch-transkription. Webbkrokar gäller för datauppsättningar, slutpunkter, utvärderingar, modeller och transkriptioner.

Anpassat tal

Följande åtgärdsgrupper gäller för anpassat tal.

Åtgärdsgrupp	beskrivning
Datauppsättningar	Använd datauppsättningar för att träna och testa anpassade talmodeller. Du kan till exempel jämföra prestandan för ett anpassat tal som tränats med en specifik datauppsättning med prestanda för en basmodell eller en anpassad talmodell som tränats med en annan datauppsättning. Se Ladda upp tränings- och testdatauppsättningar för exempel på hur du laddar upp datauppsättningar.
Slutpunkter	Distribuera anpassade talmodeller till slutpunkter. Du måste distribuera en anpassad slutpunkt för att använda en anpassad talmodell . Se Distribuera en modell för exempel på hur du hanterar distributionsslutpunkter.
Recensioner	Använd utvärderingar för att jämföra prestanda för olika modeller. Du kan till exempel jämföra prestandan för en anpassad talmodell som tränats med en specifik datauppsättning med prestanda för en basmodell eller en anpassad modell som tränats med en annan datauppsättning. Se testigenkänningens kvalitet och testnoggrannhet för exempel på hur du testar och utvärderar anpassade talmodeller.
Modeller	Använd basmodeller eller anpassade modeller för att transkribera ljudfiler. Du kan använda modeller med anpassad tal - och batch-transkription. Du kan till exempel använda en modell som tränats med en specifik datauppsättning för att transkribera ljudfiler. Se Träna en modell och en anpassad talmodells livscykel för exempel på hur du tränar och hanterar anpassade talmodeller.
Projekt	Använd projekt för att hantera anpassade talmodeller, träna och testa datauppsättningar och distributionsslutpunkter. Anpassade talprojekt innehåller modeller, träning och testning av datauppsättningar och distributionsslutpunkter. Varje projekt är specifikt för ett språk. Du kan till exempel skapa ett projekt för engelska i USA. Se Skapa ett projekt för exempel på hur du skapar projekt.
Webbkrokar	Använd webbkrokar för att ta emot meddelanden om händelser för skapande, bearbetning, slutförande och borttagning. Du kan använda webbkrokar med anpassad tal - och batch-transkription. Webbkrokar gäller för datauppsättningar, slutpunkter, utvärderingar, modeller och transkriptioner.

Service Health:

Tjänststatus ger insikter om tjänstens övergripande hälsa och underkomponenter. Mer information finns i Service Health .

Dela via

REST API för tal till text

Batch-transkription

Anpassat tal

Service Health:

Nästa steg

Feedback

Ytterligare resurser