Speech Services で発音評価(Pronunciation Assessment)の詳細JSONが取得できない問題について

Penguin 0 評価のポイント
2025-02-22T12:56:26.0966667+00:00
  1. リソース情報
  • 開発環境: Xcode
  • 使用言語: Swift
  • 場所(リージョン): East US
  • 価格レベル: Standard (S0)

  1. 現象の詳細

使用している機能:

  • Speech to Text + Pronunciation Assessment (音声認識+発音評価)
    • SDK: MicrosoftCognitiveServicesSpeech-iOS (Objective-C/Swift)
      • 発音評価用に speechConfig.outputFormat = .detailedPronunciationAssessmentConfiguration.apply(to:) を使用中
      期待する動作:
      - 発音評価(Pronunciation Assessment)の詳細JSON (`PronunciationAssessment` オブジェクト) が `result.properties` (propertyId=5000) から取得できること
      
         - 具体的には `"AccuracyScore"` や `"Words"` / `"Phonemes"` が含まれるJSONが返るはず
      

実際の動作:

  • 同じリソースを使って音声認識(通常のSpeech to Text)は成功し、result.text には"Father."のような文字列が返る
    • ところが発音評価用の詳細JSON (rawJson) が常に空 ("") になっており、 "PronunciationAssessment" が返ってこない
    • 401等の認証エラーや失敗メトリックは発生せず、呼び出しは「成功(Successful Calls)」扱いになっている

  1. 再現手順
  2. iOSアプリで Record ボタンを押し、約1秒~2秒程度「father」と発音し、 Stop
  3. Azure Speech SDK (iOS)で recognizeOnceAsync を実行
    • speechConfig.speechRecognitionLanguage = "en-US"
      • speechConfig.outputFormat = .detailed
        • PronunciationAssessmentConfiguration("father", gradingSystem: .hundredMark, ...) .apply(to: recognizer)
        1. result.text"Father." と認識
        2. let rawJson = result.properties[.speechServiceResponse_JsonResult] が空文字になっている

  1. すでに試したこと
  2. プラン/リージョン確認: リソースは Standard (S0), 場所は East US なので問題ない認識
  3. メトリック:
    • Azure Portal で「Successful Calls」が増加しており、明確にエラー扱い(失敗コール)にはなっていない
    1. 言語: en-US であり、短い発話だけでなく数秒間の発話でも同様にrawJsonが空
    2. Speech SDKのロギング:
      • SpeechSDKLogLevel = 1(Info) や SpeechSDKPiiLoggingEnabled = true など試したが、明確な警告やエラー出力は得られず
        • SPXSpeechServiceResponse_JsonErrorDetails (5001) も空文字

  1. 要望・質問
  • なぜ発音評価(Pronunciation Assessment)の詳細JSONが返らないのか、Azure側の内部ログなどから原因を特定したい
    • リソースやリクエストに制限がかかっているのか、それとも機能的な問題や設定ミスがあるのか
  • 上記の設定・手順・SDKで、本来であれば "PronunciationAssessment" のJSONが返るはずだが、どのようにすれば発音評価の詳細結果を取得できるか

お手数ですが、ご確認のほどよろしくお願い致します。

監視対象外
監視対象外
タグは Microsoft によって監視されません。
214 件の質問
0 件のコメント コメントはありません
{count} 件の投票

お客様の回答

回答は、質問作成者が [承諾された回答] としてマークできます。これは、ユーザーが回答が作成者の問題を解決したことを知るのに役立ちます。