Batch-Transcription and Power Ultimate does not work for speaker diarization

Marisa Henn 0 Zuverlässigkeitspunkte

Hello, I am attempting to utilize batch transcription for my research. Following a YouTube tutorial, I used Power Automate to execute the batch transcription (you can find the tutorial here: YouTube Tutorial). Everything worked flawlessly until I attempted to implement speaker diarization. Upon integrating speaker diarization into the workflow, I receive the following JSON output (output in text does not include speaker diarization at all): "}],"recognizedPhrases":[{"recognitionStatus":"Success","channel":0,"speaker":1,"offset":"PT0.56S","duration":"PT2.88S","offsetInTicks":5600000.0,"durationInTicks":28800000.0,"nBest":[{"confidence":0.088088915,"lexical":"this episode of yap is sponsored by shopify","itn":"this episode of yap is sponsored by shopify","maskedITN":"","display":"This episode of Yap is sponsored by Shopify.","words":[{"word":"this","offset":"PT0.56S","duration":"PT0.32S","offsetInTicks":5600000.0,"durationInTicks":3200000.0, (...) I desire to receive an output similar to this: [Sprecher 1 00:00] This episode of Yap is sponsored by Shopify. Shopify simplifies selling online and in person so you can focus on successfully growing your business. Sign up for a $1.00 per month trial period at [Sprecher 2 00:16] Auto fence Here comes Ana Richte Stolen Narcisch. Then go to Gaussian Lieben van Fossettzenman Zuvi Baiden Audi Gabrock wagon plus Vagin Best some dresses in October Vatten by the Audi Gabrock Wagon Plus partner Fila Modeller. So top leasing condicion and of dish Allah otos Zenzo fart for fikbar to evaluate and auto solisen then fended in Audi that sudia past Ali in force of Audi de podcast auda direct by tiny Minden Audi Gabriel wagon plus partner. Are you aware of the steps I should take to achieve the intended result? Best regards Marisa

Azure SDKs
Azure SDKs
Eine Reihe von Visual Studio-Tools, Befehlszeilentools, Laufzeitbinärdateien und Clientbibliotheken, die Clients beim Entwickeln, Testen und Bereitstellen von Apps unterstützen, die in Azure ausgeführt werden.
119 Fragen
0 Kommentare Keine Kommentare
{count} Stimmen

1 Antwort

Sortieren nach: Am hilfreichsten
  1. Ivan Dragov (CONCENTRIX Corporation) 2,640 Zuverlässigkeitspunkte Externe Microsoft-Mitarbeiter

    Hallo Marisa,

    Da Du Dich im deutschsprachigen Q&A befindest, gehe ich mit der Kommunikation auf Deutsch fort. Diarisierung ist der Vorgang der Erkennung und Aufteilung von Sprechern in Monokanal-Audiodaten. Verwendest Du als Eingang Monokanal-Audiodaten? Weitere Informationen findest Du in diesem Artikel:

    Erfassungsclient mit Azure KI Services > Features des Erfassungsclients

    Der Dienst funktioniert am besten mit mindestens 7 Sekunden kontinuierlicher Audiowiedergabe von einem einzelnen Sprecher. Dann kann das System die Sprecher ordnungsgemäß unterscheiden. Andernfalls wird die Sprecher-ID als Unknown zurückgegeben, wie hier erläutert:

    Schnellstart: Echtzeit-Diarisierung (Vorschau) > Diarisierung aus Datei mit Unterhaltungstranskription

    Haben Deine Redner mindestens 7 Sekunden ungestörte Redezeit?


    Ivan Dragov

Ihre Antwort

Fragesteller*innen können Antworten als akzeptierte Antworten markiert werden, wodurch Benutzer*innen wissen, dass diese Antwort das Problem gelöst hat.