Поделиться через


Использование собственного ресурса службы "Речь" хранилища (BYOS) для преобразования речи в текст

Перенос собственного хранилища (BYOS) можно использовать в следующих речевых сценариях:

  • Пакетное транскрибирование
  • Транскрибирование в режиме реального времени с включенным ведением журнала результатов аудио и транскрибирования
  • Настраиваемая речь

Для всех сценариев можно использовать одну пару ресурсов службы "Речь" и учетной записи хранения.

В этой статье подробно объясняется, как использовать ресурс службы "Речь с поддержкой BYOS" во всех сценариях преобразования речи в текст. В этой статье предполагается, что у вас есть полностью настроенный ресурс службы "Речь с поддержкой BYOS" и связанная учетная запись хранения.

Хранилище данных

При использовании BYOS служба "Речь" не сохраняет артефакты клиента после завершения обработки данных (транскрибирования, обучения моделей, тестирования моделей). Однако некоторые метаданные, не производные от содержимого пользователя, хранятся в локальной службе "Речь". Например, в пользовательском сценарии распознавания речи служба сохраняет определенные сведения о пользовательских конечных точках, таких как модели, которые они используют.

Учетная запись хранения, связанная с BYOS, хранит следующие данные:

Примечание.

Необязательный в этом разделе означает, что это возможно, но не требуется хранить определенные артефакты в связанной с BYOS учетной записи хранения. При необходимости их можно хранить в другом месте.

Пакетное транскрибирование

  • Исходный звук (необязательно)
  • Результаты пакетного транскрибирования

Транскрибирование в режиме реального времени с включенным ведением журнала результатов аудио и транскрибирования

  • Журналы результатов аудио и транскрибирования

Настраиваемая речь

  • Исходные файлы наборов данных для обучения и тестирования модели (необязательно)
  • Все данные и метаданные, связанные с пользовательскими моделями, размещенными ресурсом службы "Речь с поддержкой BYOS" (включая копии наборов данных для обучения и тестирования моделей)

Пакетное транскрибирование

Пакетное транскрибирование используется для транскрибирования большого объема звуковых данных в хранилище. Если вы не знакомы с транскрибированием пакетной службы, сначала ознакомьтесь с этой статьей .

Выполните следующие действия, чтобы выполнить пакетную транскрибирование с ресурсом службы "Речь с поддержкой BYOS":

  1. Запустите транскрибирование пакетной службы, как описано в этом руководстве.

    Внимание

    Не используйте destinationContainerUrl параметр в запросе транскрибирования. При использовании BYOS результаты транскрибирования хранятся в учетной записи хранения, связанной с BYOS, автоматически.

    Если вы используете destinationContainerUrl параметр, он будет работать, но обеспечивает значительно меньше безопасности для ваших данных из-за нерегламентированного использования SAS. Дополнительные сведения см. здесь.

  2. После завершения транскрибирования получите результаты транскрибирования в соответствии с этим руководством. Рассмотрите возможность использования sasValidityInSeconds параметра (см. следующий раздел).

Служба "Речь" использует customspeech-artifacts контейнер BLOB-объектов в учетной записи хранения, связанной с BYOS, для хранения промежуточных и окончательных результатов транскрибирования.

Внимание

Служба "Речь" использует предварительно определенные пути к контейнеру BLOB-объектов и имена файлов для модуля транскрибирования пакетной службы для правильной работы. Не перемещайте, не переименуйте или не изменяйте содержимое customspeech-artifacts контейнера.

Сбой этого, скорее всего, приведет к сложной отладке ошибок службы 4xx и 5xx.

Кроме того, не создавайте решения, которые напрямую используют файлы и папки customspeech-artifacts контейнера. Используйте стандартные средства для взаимодействия с транскрибированием пакетной службы. Дополнительные сведения см. в разделе "Транскрибирование пакетной службы".

Получение результатов транскрибирования пакетной службы с помощью REST API

Речь в текстовом REST API полностью поддерживает ресурсы службы "Речь" с поддержкой BYOS. Однако, так как данные теперь хранятся в учетной записи хранения с поддержкой BYOS, запросы, такие как Получение файлов транскрибирования, взаимодействуют с хранилищем BLOB-объектов учетной записи хранения, связанной с BYOS, вместо внутренних ресурсов службы "Речь". Он позволяет использовать один и тот же код на основе REST API как для обычных, так и для ресурсов службы "Речь с поддержкой BYOS".

Для обеспечения максимальной sasValidityInSeconds безопасности используется параметр со значением, заданным 0 в запросах, которые возвращают URL-адреса файлов данных, такие как запрос "Получить файлы транскрибирования ". Ниже приведен пример URL-адреса запроса:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0

Такой запрос возвращает прямые URL-адреса учетной записи хранения к файлам данных (без SAS или других добавлений). Например:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
      }

URL-адрес этого формата гарантирует, что только удостоверения Microsoft Entra (пользователи, субъекты-службы, управляемые удостоверения) с достаточными правами доступа (например , роль читателя данных BLOB-объектов хранилища) могут получить доступ к данным из URL-адреса.

Предупреждение

Если sasValidityInSeconds параметр опущен в запросе "Файлы транскрибирования " или аналогичных, то для каждого ВОЗВРАЩАемого URL-адреса файла данных будет создан SAS делегирования пользователей с сроком действия 5 дней. Этот SAS подписан управляемым удостоверением управляемого удостоверения, назначаемого системой ресурса службы "Речь с поддержкой BYOS". Из-за этого SAS разрешает доступ к данным, даже если доступ к ключу учетной записи хранения отключен. Дополнительные сведения см. здесь.

Транскрибирование в режиме реального времени с включенным ведением журнала результатов аудио и транскрибирования

Вы можете включить ведение журнала для ввода звука и распознанной речи при использовании речи для перевода текста или речи. Полный описание см. в этой статье.

Если вы используете BYOS, вы найдете журналы в контейнере BLOB-объектов в customspeech-audiologs учетной записи хранения, связанной с BYOS.

Предупреждение

Данные журнала хранятся в течение 5 дней. После этого периода журналы автоматически удаляются. Это допустимо для ресурсов службы "Речь с поддержкой BYOS". Если вы хотите сохранить журналы дольше, скопируйте соответствующие файлы и папки из customspeech-audiologs контейнера BLOB-объектов напрямую или используйте REST API.

Получение журналов транскрибирования в режиме реального времени с помощью REST API

Речь в текстовом REST API полностью поддерживает ресурсы службы "Речь" с поддержкой BYOS. Однако, так как данные теперь хранятся в учетной записи хранения с поддержкой BYOS, запросы, такие как получение журналов базовой модели, взаимодействуют с хранилищем BLOB-объектов учетной записи хранения, связанного с BYOS, а не внутренними ресурсами службы "Речь". Он позволяет использовать один и тот же код на основе REST API как для обычных, так и для ресурсов службы "Речь с поддержкой BYOS".

Для обеспечения максимальной sasValidityInSeconds безопасности используется параметр со значением, заданным 0 в запросах, которые возвращают URL-адреса файлов данных, такие как запрос "Получить журналы базовой модели". Ниже приведен пример URL-адреса запроса:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0

Такой запрос возвращает прямые URL-адреса учетной записи хранения к файлам данных (без SAS или других добавлений). Например:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
      }

URL-адрес этого формата гарантирует, что только удостоверения Microsoft Entra (пользователи, субъекты-службы, управляемые удостоверения) с достаточными правами доступа (например , роль читателя данных BLOB-объектов хранилища) могут получить доступ к данным из URL-адреса.

Предупреждение

Если sasValidityInSeconds параметр опущен в запросе на получение журналов базовой модели или аналогичных , то возвращается SAS делегирования пользователей с сроком действия 5 дней для каждого URL-адреса файла данных. Этот SAS подписан управляемым удостоверением управляемого удостоверения, назначаемого системой ресурса службы "Речь с поддержкой BYOS". Из-за этого SAS разрешает доступ к данным, даже если доступ к ключу учетной записи хранения отключен. Дополнительные сведения см. здесь.

Настраиваемая речь

С помощью пользовательской речи можно оценить и повысить точность распознавания речи для приложений и продуктов. Пользовательская модель речи может использоваться для преобразования речи в режиме реального времени в текст, перевод речи и пакетное транскрибирование. Дополнительные сведения см. в обзоре пользовательской речи.

Нет ничего конкретного о том, как вы используете пользовательскую речь с ресурсом службы "Речь с поддержкой BYOS". Единственное различие заключается в том, что хранятся все связанные с пользовательской моделью данные, которые служба "Речь" собирает и создает для вас. Данные хранятся в следующих контейнерах больших двоичных объектов учетной записи хранения, связанной с BYOS:

  • customspeech-models — расположение пользовательских моделей речи
  • customspeech-artifacts — расположение всех других пользовательских данных, связанных с речью

Структура контейнера BLOB-объектов предоставляется только для ваших сведений и подлежит изменению без уведомления.

Внимание

Служба "Речь" использует предварительно определенные пути к контейнеру BLOB-объектов и имена файлов для правильной работы пользовательского модуля речи. Не перемещайте, не переименуйте или не изменяйте содержимое контейнера и пользовательских customspeech-models папок customspeech-artifacts , связанных с речью контейнера.

Сбой, скорее всего, приведет к сложной отладке ошибок и может привести к необходимости переобучения пользовательской модели.

Кроме того, не создавайте решения, которые напрямую используют файлы и папки customspeech-artifacts контейнера. Используйте стандартные средства, такие как REST API и Speech Studio, для взаимодействия с пользовательскими данными, связанными с речью. Дополнительные сведения см. в разделе пользовательской речи.

Использование REST API с пользовательской речью

Речь в текстовом REST API полностью поддерживает ресурсы службы "Речь" с поддержкой BYOS. Однако, так как данные теперь хранятся в учетной записи хранения с поддержкой BYOS, запросы, такие как Datasets_ListFiles взаимодействуют с хранилищем BLOB-объектов учетной записи хранения, связанной с BYOS, вместо внутренних ресурсов службы "Речь". Он позволяет использовать один и тот же код на основе REST API как для обычных, так и для ресурсов службы "Речь с поддержкой BYOS".

Для обеспечения максимальной sasValidityInSeconds безопасности используется параметр со значением, заданным 0 в запросах, которые возвращают URL-адреса файлов данных, например запрос на получение файлов набора данных. Ниже приведен пример URL-адреса запроса:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0

Такой запрос возвращает прямые URL-адреса учетной записи хранения к файлам данных (без SAS или других добавлений). Например:

 "links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
      }

URL-адрес этого формата гарантирует, что только удостоверения Microsoft Entra (пользователи, субъекты-службы, управляемые удостоверения) с достаточными правами доступа (например , роль читателя данных BLOB-объектов хранилища) могут получить доступ к данным из URL-адреса.

Предупреждение

Если sasValidityInSeconds параметр опущен в запросе на получение файлов набора данных или аналогичных, то sas делегирования пользователей с сроком действия 5 дней будет создан для каждого URL-адреса файла данных, возвращенного. Этот SAS подписан управляемым удостоверением управляемого удостоверения, назначаемого системой ресурса службы "Речь с поддержкой BYOS". Из-за этого SAS разрешает доступ к данным, даже если доступ к ключу учетной записи хранения отключен. Дополнительные сведения см. здесь.

Следующие шаги