как задать точную продолжительность каждого предложения?

Question

у меня есть данные:

{
    "text": "some_text",
    "start_time": 0.24,
    "end_time": 7.4
},
{
    "text": "some_text",
    "start_time": 7.63,
    "end_time": 15.76
},
{
    "text": "some_text",
    "start_time": 23.27,
    "end_time": 38.569
},
{
    "text": "some_text",
    "start_time": 39.03,
    "end_time": 40.05
},

мне нужно сделать синтез речи из них и я формирую:

ssml документ для синтеза речи, но на выходе я получаю речь длительность в 44 секунды вместо 40.05

как мне сделать так чтобы предложения были с точность от и до секунды, текс я получаю из распознования речи, так что он соответствует временным меткам и длетельностей что в них прописанны,
вообще возмножно синтезировать речь точно с временными метками? если да, то как?

Answer

Здравствуйте,Возможно сам тип данных сокращает все значения до точки, судя по информации здесь: https://learn.microsoft.com/ru-ru/azure/ai-services/speech-service/speech-synthesis-markup-voice#adjust-the-audio-duration

Попробуйте как указано там, вносить значения в миллисекундах.

Поделиться через

как задать точную продолжительность каждого предложения?

1 ответ

Ваш ответ