Поделиться через


Форматы данных, принимаемые распознаванием устной речи

Если данные передаются в понимание общения, он должен соответствовать определенному формату. Используйте эту статью, чтобы узнать больше о принятых форматах данных.

Импорт формата файла проекта

Если вы импортируете проект в разговорное распознавание речи, отправленный файл должен быть в следующем формате:

{
  "projectFileVersion": "2022-10-01-preview",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectKind": "Conversation",
    "projectName": "{PROJECT-NAME}",
    "multilingual": true,
    "description": "DESCRIPTION",
    "language": "{LANGUAGE-CODE}",
    "settings": {
            "confidenceThreshold": 0
        }
  },
  "assets": {
    "projectKind": "Conversation",
    "intents": [
      {
        "category": "intent1"
      }
    ],
    "entities": [
      {
        "category": "entity1",
        "compositionSetting": "{COMPOSITION-SETTING}",
        "list": {
          "sublists": [
            {
              "listKey": "list1",
              "synonyms": [
                {
                  "language": "{LANGUAGE-CODE}",
                  "values": [
                    "{VALUES-FOR-LIST}"
                  ]
                }
              ]
            }            
          ]
        },
        "prebuilts": [
          {
            "category": "{PREBUILT-COMPONENTS}"
          }
        ],
        "regex": {
          "expressions": [
              {
                  "regexKey": "regex1",
                  "language": "{LANGUAGE-CODE}",
                  "regexPattern": "{REGEX-PATTERN}"
              }
          ]
        },
        "requiredComponents": [
            "{REQUIRED-COMPONENTS}"
        ]
      }
    ],
    "utterances": [
      {
        "text": "utterance1",
        "intent": "intent1",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "entities": [
          {
            "category": "ENTITY1",
            "offset": 6,
            "length": 4
          }
        ]
      }
    ]
  }
}

Ключ Заполнитель Значение Пример
{API-VERSION} Версия вызываемого API. 2023-04-01
confidenceThreshold {CONFIDENCE-THRESHOLD} Это пороговая оценка, под которой намерение прогнозируется как намерение None. Значения находятся в диапазоне от 0 1. 0.7
projectName {PROJECT-NAME} Имя проекта. Это значение учитывает регистр. EmailApp
multilingual true Логическое значение, позволяющее иметь речевые фрагменты на нескольких языках в наборе данных. При развертывании модели можно запрашивать модель на любом поддерживаемом языке (не обязательно включаемом в обучающие документы). Дополнительные сведения о поддерживаемых языковых кодах см. в разделе "Поддержка языка". true
sublists [] Массив, содержащий вложенные списки. Каждый вложенный список является ключом и связанными с ней значениями. []
compositionSetting {COMPOSITION-SETTING} Правило, определяющее, как управлять несколькими компонентами в сущности. Параметры или combineComponents separateComponents. combineComponents
synonyms [] Массив, содержащий все синонимы. синоним
language {LANGUAGE-CODE} Строка, указывающая языковой код для речевых фрагментов, синонимов и регулярных выражений, используемых в проекте. Если проект является многоязычным проектом, выберите языковой код большинства речевых фрагментов. en-us
intents [] Массив, содержащий все намерения, которые есть в проекте. Эти намерения классифицируются из речевых фрагментов. []
entities [] Массив, содержащий все сущности в проекте. Эти сущности извлекаются из речевых фрагментов. Каждая сущность может иметь другие необязательные компоненты, определенные с ними: список, предварительно созданные или regex. []
dataset {DATASET} Тестовый набор, к которому переходит это высказывание, когда он разбивается перед обучением. Дополнительные сведения о разбиение данных см. в статье "Обучение модели распознавания беседы". Возможные значения для этого поля: Train и Test. Train
category Тип сущности, связанной с заданным фрагментом текста. Entity1
offset Позиция начального символа сущности (включая сам символ). 5
length Длина символа сущности. 5
listKey Нормализованное значение списка синонимов для сопоставления с прогнозом. Microsoft
values {VALUES-FOR-LIST} Список строк, разделенных запятыми, которые соответствуют точно для извлечения и сопоставления с ключом списка. "msft", "microsoft", "MS"
regexKey {REGEX-PATTERN} Нормализованное значение регулярного выражения для сопоставления с прогнозом. ProductPattern1
regexPattern {REGEX-PATTERN} регулярное выражение. ^pre
prebuilts {PREBUILT-COMPONENTS} Предварительно созданные компоненты, которые могут извлекать распространенные типы. Список предварительно созданных компонентов сущностей см. в разделе "Поддерживаемые предварительно созданные компоненты сущностей". Quantity.Number
requiredComponents {REQUIRED-COMPONENTS} Параметр, указывающий требование, которое должен присутствовать определенный компонент для возврата сущности. Дополнительные сведения см. в разделе "Компоненты сущности". Возможные значения: learned, regexlistили prebuilts. "learned", "prebuilt"

Формат файла речевых фрагментов

Распознавание речи беседы позволяет отправлять речевые фрагменты непосредственно в проект, а не вводить их в один раз. Этот параметр можно найти на странице маркировки данных для проекта.

[
    {
        "text": "{Utterance-Text}",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "intent": "{intent}",
        "entities": [
            {
                "category": "{entity}",
                "offset": 19,
                "length": 10
            }
        ]
    },
    {
        "text": "{Utterance-Text}",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "intent": "{intent}",
        "entities": [
            {
                "category": "{entity}",
                "offset": 20,
                "length": 10
            },
            {
                "category": "{entity}",
                "offset": 31,
                "length": 5
            }
        ]
    }
]

Ключ Заполнитель Значение Пример
text {Utterance-Text} Текст речевых фрагментов. Тестирование
language {LANGUAGE-CODE} Строка, указывающая языковой код для речевых фрагментов, используемых в проекте. Если проект является многоязычным проектом, выберите языковой код большинства речевых фрагментов. Дополнительные сведения о поддерживаемых языковых кодах см. в разделе "Поддержка языка". en-us
dataset {DATASET} Тестовый набор, к которому переходит это высказывание, когда он разбивается перед обучением. Дополнительные сведения о разбиение данных см. в статье "Обучение модели распознавания беседы". Возможные значения для этого поля: Train и Test. Train
intent {intent} Назначенное намерение. intent1
entity {entity} Извлекаемая сущность. entity1
category Тип сущности, связанной с заданным фрагментом текста. Entity1
offset Позиция символа начала текста (включая сам символ). 0
length Длина ограничивающего прямоугольника в символах UTF16. При обучении учитываются данные только в этом регионе. 500