Поделиться через


Skillsets - Create Or Update

Создает новый набор навыков в службе поиска или обновляет набор навыков, если он уже существует.

PUT {endpoint}/skillsets('{skillsetName}')?api-version=2024-11-01-preview
PUT {endpoint}/skillsets('{skillsetName}')?api-version=2024-11-01-preview&ignoreResetRequirements={ignoreResetRequirements}&disableCacheReprocessingChangeDetection={disableCacheReprocessingChangeDetection}

Параметры URI

Имя В Обязательно Тип Описание
endpoint
path True

string

URL-адрес конечной точки службы поиска.

skillsetName
path True

string

Имя набора навыков для создания или обновления.

api-version
query True

string

Версия клиентского API.

disableCacheReprocessingChangeDetection
query

boolean

Отключает обнаружение изменений повторной обработки кэша.

ignoreResetRequirements
query

boolean

Игнорирует требования к сбросу кэша.

Заголовок запроса

Имя Обязательно Тип Описание
x-ms-client-request-id

string

uuid

Идентификатор отслеживания, отправляемый запросом на отладку.

If-Match

string

Определяет условие If-Match. Операция будет выполнена только в том случае, если ETag на сервере соответствует этому значению.

If-None-Match

string

Определяет условие If-None-Match. Операция будет выполнена только в том случае, если ETag на сервере не соответствует этому значению.

Prefer True

string

Для HTTP-запросов PUT служба возвращает созданный или обновленный ресурс успешно.

Текст запроса

Имя Обязательно Тип Описание
name True

string

Имя набора навыков.

skills True SearchIndexerSkill[]:

Список навыков в наборе навыков.

@odata.etag

string

ETag набора навыков.

cognitiveServices CognitiveServicesAccount:

Сведения о службе ИИ Azure, которую следует использовать при выполнении навыков.

description

string

Описание набора навыков.

encryptionKey

SearchResourceEncryptionKey

Описание ключа шифрования, созданного в Azure Key Vault. Этот ключ используется для предоставления дополнительного уровня шифрования для определения набора навыков, если требуется полная уверенность, что никто, даже не Корпорация Майкрософт, не может расшифровать определение набора навыков. После шифрования определения набора навыков он всегда будет оставаться зашифрованным. Служба поиска игнорирует попытки задать для этого свойства значение NULL. Это свойство можно изменить по мере необходимости, если вы хотите повернуть ключ шифрования; Определение набора навыков не будет затронуто. Шифрование с помощью ключей, управляемых клиентом, недоступно для бесплатных служб поиска и доступно только для платных служб, созданных 1 января 2019 г.

indexProjections

SearchIndexerIndexProjections

Определение дополнительных проекций для вторичных индексов поиска.

knowledgeStore

SearchIndexerKnowledgeStore

Определение дополнительных проекций для больших двоичных объектов Azure, таблиц или файлов, обогащенных данных.

Ответы

Имя Тип Описание
200 OK

SearchIndexerSkillset

Набор навыков успешно обновлен.

201 Created

SearchIndexerSkillset

Набор навыков успешно создан.

Other Status Codes

ErrorResponse

Ответ на ошибку.

Примеры

SearchServiceCreateOrUpdateSkillset

Образец запроса

PUT https://previewexampleservice.search.windows.net/skillsets('tempskillset')?api-version=2024-11-01-preview&ignoreResetRequirements=&disableCacheReprocessingChangeDetection=





{
  "name": "tempskillset",
  "description": "Skillset for extracting entities and more",
  "skills": [
    {
      "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
      "name": "skill2",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "countryHint",
          "source": "/document/countryHint"
        }
      ],
      "outputs": [
        {
          "name": "languageCode",
          "targetName": "languageCode"
        }
      ]
    },
    {
      "textSplitMode": "pages",
      "maximumPageLength": 4000,
      "unit": "azureOpenAITokens",
      "azureOpenAITokenizerParameters": {
        "encoderModelName": "cl100k_base",
        "allowedSpecialTokens": [
          "[START]",
          "[END]"
        ]
      },
      "@odata.type": "#Microsoft.Skills.Text.SplitSkill",
      "name": "skill3",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode"
        }
      ],
      "outputs": [
        {
          "name": "textItems",
          "targetName": "pages"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
      "name": "skill4",
      "context": "/document/pages/*",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode"
        }
      ],
      "outputs": [
        {
          "name": "keyPhrases",
          "targetName": "keyPhrases"
        }
      ]
    },
    {
      "uri": "https://contoso.example.org/",
      "httpMethod": "POST",
      "timeout": "PT5S",
      "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
      "name": "skill5",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content"
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode"
        }
      ],
      "outputs": [
        {
          "name": "customresult",
          "targetName": "result"
        }
      ]
    },
    {
      "outputMode": "oneToMany",
      "markdownHeaderDepth": "h3",
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill",
      "context": "/document",
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content"
        }
      ],
      "outputs": [
        {
          "name": "markdown_document",
          "targetName": "markdown_document"
        }
      ]
    }
  ],
  "cognitiveServices": {
    "key": "myKey",
    "subdomainUrl": "https://mySubdomainName.cognitiveservices.azure.com",
    "@odata.type": "#Microsoft.Azure.Search.AIServicesByKey"
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  }
}

Пример ответа

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "tempskillset",
  "description": "Skillset for extracting entities and more",
  "skills": [
    {
      "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
      "name": "skill2",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "countryHint",
          "source": "/document/countryHint",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "languageCode",
          "targetName": "languageCode"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.SplitSkill",
      "name": "skill3",
      "textSplitMode": "pages",
      "maximumPageLength": 4000,
      "unit": "azureOpenAITokens",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "textItems",
          "targetName": "pages"
        }
      ],
      "azureOpenAITokenizerParameters": {
        "encoderModelName": "cl100k_base",
        "allowedSpecialTokens": [
          "[START]",
          "[END]"
        ]
      }
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
      "name": "skill4",
      "context": "/document/pages/*",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "keyPhrases",
          "targetName": "keyPhrases"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
      "name": "skill5",
      "uri": "https://contoso.example.org/",
      "httpMethod": "POST",
      "timeout": "PT5S",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "customresult",
          "targetName": "result"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany",
      "markdownHeaderDepth": "h3",
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "markdown_document",
          "targetName": "markdown_document"
        }
      ]
    }
  ],
  "cognitiveServices": {
    "@odata.type": "#Microsoft.Azure.Search.AIServicesByKey",
    "key": "myKey",
    "subdomainUrl": "https://mySubdomainName.cognitiveservices.azure.com"
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  }
}
{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "tempskillset",
  "description": "Skillset for extracting entities and more",
  "skills": [
    {
      "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
      "name": "skill2",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "countryHint",
          "source": "/document/countryHint",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "languageCode",
          "targetName": "languageCode"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.SplitSkill",
      "name": "skill3",
      "textSplitMode": "pages",
      "maximumPageLength": 4000,
      "unit": "azureOpenAITokens",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "textItems",
          "targetName": "pages"
        }
      ],
      "azureOpenAITokenizerParameters": {
        "encoderModelName": "cl100k_base",
        "allowedSpecialTokens": [
          "[START]",
          "[END]"
        ]
      }
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
      "name": "skill4",
      "context": "/document/pages/*",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "keyPhrases",
          "targetName": "keyPhrases"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
      "name": "skill5",
      "uri": "https://contoso.example.org/",
      "httpMethod": "POST",
      "timeout": "PT5S",
      "inputs": [
        {
          "name": "text",
          "source": "/document/content",
          "inputs": []
        },
        {
          "name": "languageCode",
          "source": "/document/languageCode",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "customresult",
          "targetName": "result"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill",
      "name": "docIntelligenceLayoutSkill",
      "context": "/document",
      "outputMode": "oneToMany",
      "markdownHeaderDepth": "h3",
      "inputs": [
        {
          "name": "file_data",
          "source": "/document/content",
          "inputs": []
        }
      ],
      "outputs": [
        {
          "name": "markdown_document",
          "targetName": "markdown_document"
        }
      ]
    }
  ],
  "cognitiveServices": {
    "@odata.type": "#Microsoft.Azure.Search.AIServicesByKey",
    "key": "myKey",
    "subdomainUrl": "https://mySubdomainName.cognitiveservices.azure.com"
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  }
}

Определения

Имя Описание
AIServicesAccountIdentity

Учетная запись нескольких регионов ресурса службы искусственного интеллекта Azure, подключенного к набору навыков.

AIServicesAccountKey

Ключ учетной записи ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков, который будет использоваться с поддоменом ресурса.

AmlSkill

Навык AML позволяет расширить обогащение ИИ с помощью пользовательской модели Машинного обучения Azure (AML). После обучения и развертывания модели AML навык AML интегрируется в обогащение ИИ.

AzureActiveDirectoryApplicationCredentials

Учетные данные зарегистрированного приложения, созданного для службы поиска, используемого для проверки подлинности доступа к ключам шифрования, хранящимся в Azure Key Vault.

AzureOpenAIEmbeddingSkill

Позволяет создать вектор внедрения для заданного текстового ввода с помощью ресурса Azure OpenAI.

AzureOpenAIModelName

Имя модели Azure Open AI, которое будет вызываться.

AzureOpenAITokenizerParameters
CognitiveServicesAccountKey

Ключ учетной записи с несколькими регионами ресурса службы искусственного интеллекта Azure, подключенного к набору навыков.

ConditionalSkill

Навык, позволяющий сценариям, которым требуется логическое действие для определения данных для назначения выходным данным.

CustomEntity

Объект, содержащий сведения о найденных совпадениях и связанных метаданных.

CustomEntityAlias

Сложный объект, который можно использовать для указания альтернативных орфографических или синонимов имени корневой сущности.

CustomEntityLookupSkill

Навык ищет текст из пользовательского пользовательского списка слов и фраз.

CustomEntityLookupSkillLanguage

Коды языка, поддерживаемые для входного текста CustomEntityLookupSkill.

DefaultCognitiveServicesAccount

Пустой объект, представляющий ресурс службы искусственного интеллекта Azure по умолчанию для набора навыков.

DocumentExtractionSkill

Навык, извлекающий содержимое из файла в конвейере обогащения.

DocumentIntelligenceLayoutSkill

Навык, который извлекает сведения о содержимом и макете (как markdown) через службы ИИ Azure из файлов в конвейере обогащения.

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

Глубина заголовков в выходных данных markdown. Значение по умолчанию — h6.

DocumentIntelligenceLayoutSkillOutputMode

Управляет кратностью выходных данных, созданных навыком. Значение по умолчанию — oneToMany

EntityCategory

Строка, указывающая, какие категории сущностей следует возвращать.

EntityLinkingSkill

Используя API анализа текста, извлекает связанные сущности из текста.

EntityRecognitionSkill

Этот навык не рекомендуется. Используйте версию 3. EntityRecognitionSkill вместо этого.

EntityRecognitionSkillLanguage

Устаревшие. Коды языка, поддерживаемые для ввода текста EntityRecognitionSkill.

EntityRecognitionSkillV3

С помощью API анализа текста извлекает сущности различных типов из текста.

ErrorAdditionalInfo

Дополнительные сведения об ошибке управления ресурсами.

ErrorDetail

Сведения об ошибке.

ErrorResponse

Ответ на ошибку

ImageAnalysisSkill

Навык, который анализирует файлы изображений. Он извлекает широкий набор визуальных функций на основе содержимого изображения.

ImageAnalysisSkillLanguage

Коды языка, поддерживаемые для ввода ImageAnalysisSkill.

ImageDetail

Строка, указывающая, какие сведения для конкретного домена следует возвращать.

IndexProjectionMode

Определяет поведение проекций индекса относительно остальной части индексатора.

InputFieldMappingEntry

Сопоставление полей ввода для навыка.

KeyPhraseExtractionSkill

Навык, использующий анализ текста для извлечения ключевых фраз.

KeyPhraseExtractionSkillLanguage

Коды языка, поддерживаемые для входного текста keyPhraseExtractionSkill.

LanguageDetectionSkill

Навык, который обнаруживает язык входного текста и сообщает один языковой код для каждого документа, отправленного по запросу. Языковой код связан с оценкой, указывающей достоверность анализа.

LineEnding

Определяет последовательность символов, используемых между строками текста, распознаваемыми навыком OCR. Значением по умолчанию является пробел.

MergeSkill

Навык объединения двух или более строк в одну единую строку с необязательным определяемым пользователем разделителем, разделяющим каждую часть компонента.

OcrSkill

Навык, извлекающий текст из файлов изображений.

OcrSkillLanguage

Коды языка, поддерживаемые для ввода OcrSkill.

OutputFieldMappingEntry

Сопоставление полей вывода для навыка.

PIIDetectionSkill

Используя API анализа текста, извлекает личную информацию из входного текста и предоставляет возможность маскирования.

PIIDetectionSkillMaskingMode

Строка, указывающая, какую маскировкуMode следует использовать для маскирования личных данных, обнаруженных в входном тексте.

SearchIndexerDataNoneIdentity

Очищает свойство удостоверения источника данных.

SearchIndexerDataUserAssignedIdentity

Указывает удостоверение для используемого источника данных.

SearchIndexerIndexProjections

Определение дополнительных проекций для вторичных индексов поиска.

SearchIndexerIndexProjectionSelector

Описание того, какие данные следует хранить в указанном индексе поиска.

SearchIndexerIndexProjectionsParameters

Словарь свойств конфигурации для проекции индекса. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивным типом.

SearchIndexerKnowledgeStore

Определение дополнительных проекций для больших двоичных объектов Azure, таблиц или файлов, обогащенных данных.

SearchIndexerKnowledgeStoreFileProjectionSelector

Определение проекции для хранения данных в файлах Azure.

SearchIndexerKnowledgeStoreObjectProjectionSelector

Определение проекции для хранения данных в BLOB-объекте Azure.

SearchIndexerKnowledgeStoreParameters

Словарь свойств конфигурации для конкретного хранилища знаний. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивным типом.

SearchIndexerKnowledgeStoreProjection

Объект контейнера для различных селекторов проекций.

SearchIndexerKnowledgeStoreTableProjectionSelector

Описание того, какие данные следует хранить в таблицах Azure.

SearchIndexerSkillset

Список навыков.

SearchResourceEncryptionKey

Ключ шифрования, управляемый клиентом, в Azure Key Vault. Ключи, которые создаются и управляются, можно использовать для шифрования или расшифровки неактивных данных, таких как индексы и карты синонимов.

SentimentSkill

Этот навык не рекомендуется. Используйте версию 3. Вместо этого тональность.

SentimentSkillLanguage

Устаревшие. Коды языка, поддерживаемые для входного текста с помощью SentimentSkill.

SentimentSkillV3

Используя API анализа текста, вычисляет неструктурированный текст и для каждой записи предоставляет метки тональности (например, "отрицательные", "нейтральные" и "положительные") на основе самой высокой оценки достоверности, найденной службой на уровне предложения и документа.

ShaperSkill

Навык изменения выходных данных. Он создает сложный тип для поддержки составных полей (также известных как многопартийные поля).

SplitSkill

Навык разделения строки на фрагменты текста.

SplitSkillEncoderModelName

Применяется только в том случае, если для единицы задано значение azureOpenAITokens. Параметры включают "R50k_base", "P50k_base", "P50k_edit" и "CL100k_base". Значение по умолчанию — "CL100k_base".

SplitSkillLanguage

Коды языка, поддерживаемые для входного текста splitSkill.

SplitSkillUnit

Значение, указывающее, какую единицу следует использовать.

TextSplitMode

Значение, указывающее, какой режим разделения для выполнения.

TextTranslationSkill

Навык перевода текста с одного языка на другой.

TextTranslationSkillLanguage

Коды языка, поддерживаемые для входного текста TextTranslationSkill.

VisionVectorizeSkill

Позволяет создать вектор внедрения для заданного изображения или текстового ввода с помощью API векторизации визуального распознавания Служб искусственного интеллекта Azure.

VisualFeature

Строки, указывающие, какие типы визуальных функций следует возвращать.

WebApiSkill

Навык, который может вызывать конечную точку веб-API, позволяя расширить набор навыков, вызывая пользовательский код.

AIServicesAccountIdentity

Учетная запись нескольких регионов ресурса службы искусственного интеллекта Azure, подключенного к набору навыков.

Имя Тип Описание
@odata.type string:

#Microsoft.Azure.Search.AIServicesByIdentity

Фрагмент URI, указывающий тип ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

description

string

Описание ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

identity SearchIndexerDataIdentity:

Назначаемое пользователем управляемое удостоверение, используемое для подключений к службе ИИ. Если это не указано, используется управляемое удостоверение, назначаемое системой. При обновлении набора навыков, если удостоверение не указано, значение остается неизменным. Если задано значение none, то значение этого свойства очищается.

subdomainUrl

string

URL-адрес поддомена для соответствующей службы ИИ.

AIServicesAccountKey

Ключ учетной записи ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков, который будет использоваться с поддоменом ресурса.

Имя Тип Описание
@odata.type string:

#Microsoft.Azure.Search.AIServicesByKey

Фрагмент URI, указывающий тип ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

description

string

Описание ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

key

string

Ключ, используемый для подготовки ресурса службы искусственного интеллекта Azure, подключенного к набору навыков.

subdomainUrl

string

URL-адрес поддомена для соответствующей службы ИИ.

AmlSkill

Навык AML позволяет расширить обогащение ИИ с помощью пользовательской модели Машинного обучения Azure (AML). После обучения и развертывания модели AML навык AML интегрируется в обогащение ИИ.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Custom.AmlSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

degreeOfParallelism

integer

(Необязательно) При указании указывает количество вызовов индексатора параллельно с предоставленной конечной точкой. Это значение можно уменьшить, если конечная точка завершается сбоем слишком высокой нагрузки запроса, или вызвать ее, если конечная точка может принимать больше запросов, и вы хотите увеличить производительность индексатора. Если значение не задано, используется значение по умолчанию 5. СтепеньOfParallelism может быть задана не более 10 и не менее 1.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

key

string

(Требуется для проверки подлинности ключа) Ключ службы AML.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

region

string

(Необязательно для проверки подлинности маркера). Регион, в который развертывается служба AML.

resourceId

string

(Требуется для проверки подлинности маркера). Идентификатор ресурса Azure Resource Manager службы AML. Он должен находиться в подписках формата/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/services/{service_name}.

timeout

string

(Необязательно) При указании указывает время ожидания для http-клиента, выполняющего вызов API.

uri

string

(Требуется для проверки подлинности или проверки подлинности ключа) URI оценки службы AML, в которую будут отправляться полезные данные JSON. Допускается только схема URI https.

AzureActiveDirectoryApplicationCredentials

Учетные данные зарегистрированного приложения, созданного для службы поиска, используемого для проверки подлинности доступа к ключам шифрования, хранящимся в Azure Key Vault.

Имя Тип Описание
applicationId

string

Идентификатор приложения AAD, которому было предоставлено необходимые разрешения на доступ к Azure Key Vault, который будет использоваться при шифровании неактивных данных. Идентификатор приложения не следует путать с идентификатором объекта для приложения AAD.

applicationSecret

string

Ключ проверки подлинности указанного приложения AAD.

AzureOpenAIEmbeddingSkill

Позволяет создать вектор внедрения для заданного текстового ввода с помощью ресурса Azure OpenAI.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill

Фрагмент URI, указывающий тип навыка.

apiKey

string

Ключ API указанного ресурса Azure OpenAI.

authIdentity SearchIndexerDataIdentity:

Назначаемое пользователем управляемое удостоверение, используемое для исходящих подключений.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

deploymentId

string

Идентификатор развертывания модели Azure OpenAI в указанном ресурсе.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

dimensions

integer

Число измерений, в которых должны быть внедренные выходные данные. Поддерживается только в моделях с внедрением текста-3 и более поздних версий.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

modelName

AzureOpenAIModelName

Имя модели внедрения, развернутой по указанному пути deploymentId.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

resourceUri

string

URI ресурса ресурса Azure OpenAI.

AzureOpenAIModelName

Имя модели Azure Open AI, которое будет вызываться.

Имя Тип Описание
text-embedding-3-large

string

text-embedding-3-small

string

text-embedding-ada-002

string

AzureOpenAITokenizerParameters

Имя Тип Описание
allowedSpecialTokens

string[]

(Необязательно) Применяется только в том случае, если для единицы задано значение azureOpenAITokens. Этот параметр определяет коллекцию специальных маркеров, разрешенных в процессе токенизации.

encoderModelName

SplitSkillEncoderModelName

Применяется только в том случае, если для единицы задано значение azureOpenAITokens. Параметры включают "R50k_base", "P50k_base", "P50k_edit" и "CL100k_base". Значение по умолчанию — "CL100k_base".

CognitiveServicesAccountKey

Ключ учетной записи с несколькими регионами ресурса службы искусственного интеллекта Azure, подключенного к набору навыков.

Имя Тип Описание
@odata.type string:

#Microsoft.Azure.Search.CognitiveServicesByKey

Фрагмент URI, указывающий тип ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

description

string

Описание ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

key

string

Ключ, используемый для подготовки ресурса службы искусственного интеллекта Azure, подключенного к набору навыков.

ConditionalSkill

Навык, позволяющий сценариям, которым требуется логическое действие для определения данных для назначения выходным данным.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Util.ConditionalSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

CustomEntity

Объект, содержащий сведения о найденных совпадениях и связанных метаданных.

Имя Тип Описание
accentSensitive

boolean

По умолчанию используется значение false. Логическое значение, указывающее, должны ли сравнения с именем сущности быть чувствительными к акценту.

aliases

CustomEntityAlias[]

Массив сложных объектов, которые можно использовать для указания альтернативных орфографических или синонимов имени корневой сущности.

caseSensitive

boolean

По умолчанию используется значение false. Логическое значение, указывающее, должны ли сравнения с именем сущности учитывать регистр символов. Пример нечувствительных совпадений регистра "Майкрософт" может быть: microsoft, microSoft, MICROSOFT.

defaultAccentSensitive

boolean

Изменяет значение конфиденциальности акцента по умолчанию для этой сущности. Он используется для изменения значения по умолчанию всех псевдонимов элементов, не зависящих от значений.

defaultCaseSensitive

boolean

Изменяет значение конфиденциальности регистра по умолчанию для этой сущности. Он используется для изменения значения по умолчанию всех псевдонимов caseSensitive.

defaultFuzzyEditDistance

integer

Изменяет значение нечеткого изменения расстояния по умолчанию для этой сущности. Его можно использовать для изменения значения по умолчанию всех псевдонимов нечетких значенийEditDistance.

description

string

Это поле можно использовать в качестве сквозного руководства для пользовательских метаданных о сопоставленных текстах. Значение этого поля будет отображаться при каждом совпадении сущности в выходных данных навыка.

fuzzyEditDistance

integer

Значение по умолчанию — 0. Максимальное значение 5. Обозначает допустимое число разных символов, которые по-прежнему будут соответствовать имени сущности. Возвращается наименьшая возможная нечеткость для любого заданного совпадения. Например, если для расстояния редактирования задано значение 3, "Windows10" по-прежнему соответствует "Windows", "Windows10" и "Windows 7". Если чувствительность регистра имеет значение false, различия регистров не учитываются в отношении нечеткости, но в противном случае делают это.

id

string

Это поле можно использовать в качестве сквозного руководства для пользовательских метаданных о сопоставленных текстах. Значение этого поля будет отображаться при каждом совпадении сущности в выходных данных навыка.

name

string

Дескриптор сущности верхнего уровня. Совпадения в выходных данных навыка будут сгруппированы по этому имени, и он должен представлять "нормализованную" форму найденного текста.

subtype

string

Это поле можно использовать в качестве сквозного руководства для пользовательских метаданных о сопоставленных текстах. Значение этого поля будет отображаться при каждом совпадении сущности в выходных данных навыка.

type

string

Это поле можно использовать в качестве сквозного руководства для пользовательских метаданных о сопоставленных текстах. Значение этого поля будет отображаться при каждом совпадении сущности в выходных данных навыка.

CustomEntityAlias

Сложный объект, который можно использовать для указания альтернативных орфографических или синонимов имени корневой сущности.

Имя Тип Описание
accentSensitive

boolean

Определите, учитывается ли псевдоним.

caseSensitive

boolean

Определите, учитывается ли псевдоним регистра.

fuzzyEditDistance

integer

Определите нечеткое расстояние изменения псевдонима.

text

string

Текст псевдонима.

CustomEntityLookupSkill

Навык ищет текст из пользовательского пользовательского списка слов и фраз.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.CustomEntityLookupSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

CustomEntityLookupSkillLanguage

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

entitiesDefinitionUri

string

Путь к JSON-файлу или CSV-файлу, который содержит весь целевой текст для сопоставления. Это определение сущности считывается в начале запуска индексатора. Все обновления этого файла во время запуска индексатора не будут входить в силу до последующих запусков. Эта конфигурация должна быть доступна по протоколу HTTPS.

globalDefaultAccentSensitive

boolean

Глобальный флаг для AccentSensitive. Если Параметр AccentSensitive не задан в CustomEntity, это значение будет значением по умолчанию.

globalDefaultCaseSensitive

boolean

Глобальный флаг для CaseSensitive. Если Параметр CaseSensitive не задан в CustomEntity, это значение будет значением по умолчанию.

globalDefaultFuzzyEditDistance

integer

Глобальный флаг для FuzzyEditDistance. Если не задано значение FuzzyEditDistance в CustomEntity, это значение будет значением по умолчанию.

inlineEntitiesDefinition

CustomEntity[]

Встроенное определение CustomEntity.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

CustomEntityLookupSkillLanguage

Коды языка, поддерживаемые для входного текста CustomEntityLookupSkill.

Имя Тип Описание
da

string

Датский

de

string

Немецкий

en

string

Английский

es

string

Испанский

fi

string

Финский

fr

string

Французский

it

string

Итальянский

ko

string

Корейский

pt

string

Португальский

DefaultCognitiveServicesAccount

Пустой объект, представляющий ресурс службы искусственного интеллекта Azure по умолчанию для набора навыков.

Имя Тип Описание
@odata.type string:

#Microsoft.Azure.Search.DefaultCognitiveServices

Фрагмент URI, указывающий тип ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

description

string

Описание ресурса службы искусственного интеллекта Azure, присоединенного к набору навыков.

DocumentExtractionSkill

Навык, извлекающий содержимое из файла в конвейере обогащения.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Util.DocumentExtractionSkill

Фрагмент URI, указывающий тип навыка.

configuration

object

Словарь конфигураций для навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

dataToExtract

string

Тип данных, которые необходимо извлечь для навыка. Если не определено значение contentAndMetadata, будет задано значение ContentAndMetadata.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

parsingMode

string

Синтаксический анализ для навыка. Если он не определен, для этого будет задано значение default.

DocumentIntelligenceLayoutSkill

Навык, который извлекает сведения о содержимом и макете (как markdown) через службы ИИ Azure из файлов в конвейере обогащения.

Имя Тип Default value Описание
@odata.type string:

#Microsoft.Skills.Util.DocumentIntelligenceLayoutSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

markdownHeaderDepth

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

h6

Глубина заголовков в выходных данных markdown. Значение по умолчанию — h6.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputMode

DocumentIntelligenceLayoutSkillOutputMode

oneToMany

Управляет кратностью выходных данных, созданных навыком. Значение по умолчанию — oneToMany.

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

DocumentIntelligenceLayoutSkillMarkdownHeaderDepth

Глубина заголовков в выходных данных markdown. Значение по умолчанию — h6.

Имя Тип Описание
h1

string

Уровень заголовка 1.

h2

string

Уровень заголовка 2.

h3

string

Уровень заголовка 3.

h4

string

Уровень заголовка 4.

h5

string

Уровень заголовка 5.

h6

string

Уровень заголовка 6.

DocumentIntelligenceLayoutSkillOutputMode

Управляет кратностью выходных данных, созданных навыком. Значение по умолчанию — oneToMany

Имя Тип Описание
oneToMany

string

Укажите самый глубокий раздел заголовка Markdown для анализа.

EntityCategory

Строка, указывающая, какие категории сущностей следует возвращать.

Имя Тип Описание
datetime

string

Сущности, описывающие дату и время.

email

string

Сущности, описывающие адрес электронной почты.

location

string

Сущности, описывающие физическое расположение.

organization

string

Сущности, описывающие организацию.

person

string

Сущности, описывающие человека.

quantity

string

Сущности, описывающие количество.

url

string

Сущности, описывающие URL-адрес.

EntityLinkingSkill

Используя API анализа текста, извлекает связанные сущности из текста.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.V3.EntityLinkingSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

string

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

minimumPrecision

number

Значение от 0 до 1, которое используется только для включения сущностей, оценка достоверности которых превышает указанное значение. Если не задано (по умолчанию) или если явно задано значение NULL, все сущности будут включены.

modelVersion

string

Версия модели, используемая при вызове службы анализа текста. Он по умолчанию будет доступен по умолчанию, если он не указан. Мы рекомендуем не указывать это значение, если это значение не требуется.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

EntityRecognitionSkill

Этот навык не рекомендуется. Используйте версию 3. EntityRecognitionSkill вместо этого.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.EntityRecognitionSkill

Фрагмент URI, указывающий тип навыка.

categories

EntityCategory[]

Список категорий сущностей, которые следует извлечь.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

EntityRecognitionSkillLanguage

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

includeTypelessEntities

boolean

Определяет, следует ли включать сущности, которые хорошо известны, но не соответствуют предварительно определенному типу. Если эта конфигурация не задана (по умолчанию), задайте значение NULL или имеет значение false, сущности, которые не соответствуют одному из предварительно определенных типов, не будут отображаться.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

minimumPrecision

number

Значение от 0 до 1, которое используется только для включения сущностей, оценка достоверности которых превышает указанное значение. Если не задано (по умолчанию) или если явно задано значение NULL, все сущности будут включены.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

EntityRecognitionSkillLanguage

Устаревшие. Коды языка, поддерживаемые для ввода текста EntityRecognitionSkill.

Имя Тип Описание
ar

string

Арабский

cs

string

Чешский

da

string

Датский

de

string

Немецкий

el

string

Греческий

en

string

Английский

es

string

Испанский

fi

string

Финский

fr

string

Французский

hu

string

Венгерский

it

string

Итальянский

ja

string

Японский

ko

string

Корейский

nl

string

Нидерландский

no

string

Норвежский (Bokmaal)

pl

string

Польский

pt-BR

string

Португальский (Бразилия)

pt-PT

string

Португальский (Португалия)

ru

string

Русский

sv

string

Шведский

tr

string

Турецкий

zh-Hans

string

Chinese-Simplified

zh-Hant

string

Chinese-Traditional

EntityRecognitionSkillV3

С помощью API анализа текста извлекает сущности различных типов из текста.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.V3.EntityRecognitionSkill

Фрагмент URI, указывающий тип навыка.

categories

string[]

Список категорий сущностей, которые следует извлечь.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

string

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

minimumPrecision

number

Значение от 0 до 1, которое используется только для включения сущностей, оценка достоверности которых превышает указанное значение. Если не задано (по умолчанию) или если явно задано значение NULL, все сущности будут включены.

modelVersion

string

Версия модели, используемая при вызове API анализа текста. Он по умолчанию будет доступен по умолчанию, если он не указан. Мы рекомендуем не указывать это значение, если это значение не требуется.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

ErrorAdditionalInfo

Дополнительные сведения об ошибке управления ресурсами.

Имя Тип Описание
info

object

Дополнительные сведения.

type

string

Дополнительный тип сведений.

ErrorDetail

Сведения об ошибке.

Имя Тип Описание
additionalInfo

ErrorAdditionalInfo[]

Дополнительные сведения об ошибке.

code

string

Код ошибки.

details

ErrorDetail[]

Сведения об ошибке.

message

string

Сообщение об ошибке.

target

string

Целевой объект ошибки.

ErrorResponse

Ответ на ошибку

Имя Тип Описание
error

ErrorDetail

Объект ошибки.

ImageAnalysisSkill

Навык, который анализирует файлы изображений. Он извлекает широкий набор визуальных функций на основе содержимого изображения.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Vision.ImageAnalysisSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

ImageAnalysisSkillLanguage

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

details

ImageDetail[]

Строка, указывающая, какие сведения для конкретного домена следует возвращать.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

visualFeatures

VisualFeature[]

Список визуальных функций.

ImageAnalysisSkillLanguage

Коды языка, поддерживаемые для ввода ImageAnalysisSkill.

Имя Тип Описание
ar

string

Арабский

az

string

Азербайджанский

bg

string

Болгарский

bs

string

Боснийская латиница

ca

string

Каталанский

cs

string

Чешский

cy

string

Валлийский

da

string

Датский

de

string

Немецкий

el

string

Греческий

en

string

Английский

es

string

Испанский

et

string

Эстонский

eu

string

Баскский

fi

string

Финский

fr

string

Французский

ga

string

Ирландский

gl

string

Галисийский

he

string

Иврит

hi

string

Хинди

hr

string

Хорватский

hu

string

Венгерский

id

string

Индонезийский

it

string

Итальянский

ja

string

Японский

kk

string

Казахский

ko

string

Корейский

lt

string

Литовский

lv

string

Латышский

mk

string

Македонец

ms

string

Малайский Малайзия

nb

string

Норвежский (Букмал)

nl

string

Нидерландский

pl

string

Польский

prs

string

Дари

pt

string

Portuguese-Portugal

pt-BR

string

Portuguese-Brazil

pt-PT

string

Portuguese-Portugal

ro

string

Румынский

ru

string

Русский

sk

string

Словацкий

sl

string

Словенский

sr-Cyrl

string

Сербский - Кириллический RS

sr-Latn

string

Сербский - Латинская RS

sv

string

Шведский

th

string

Тайский

tr

string

Турецкий

uk

string

Украинский

vi

string

Вьетнамский

zh

string

Китайский упрощённый

zh-Hans

string

Китайский упрощённый

zh-Hant

string

Китайский традиционный

ImageDetail

Строка, указывающая, какие сведения для конкретного домена следует возвращать.

Имя Тип Описание
celebrities

string

Подробности, признанные знаменитостями.

landmarks

string

Подробности, распознанные как ориентиры.

IndexProjectionMode

Определяет поведение проекций индекса относительно остальной части индексатора.

Имя Тип Описание
includeIndexingParentDocuments

string

Исходный документ будет записан в целевой индекс индексатора. Это шаблон по умолчанию.

skipIndexingParentDocuments

string

Исходный документ будет пропущен из записи в целевой индекс индексатора.

InputFieldMappingEntry

Сопоставление полей ввода для навыка.

Имя Тип Описание
inputs

InputFieldMappingEntry[]

Рекурсивные входные данные, используемые при создании сложного типа.

name

string

Имя входных данных.

source

string

Источник входных данных.

sourceContext

string

Исходный контекст, используемый для выбора рекурсивных входных данных.

KeyPhraseExtractionSkill

Навык, использующий анализ текста для извлечения ключевых фраз.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.KeyPhraseExtractionSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

KeyPhraseExtractionSkillLanguage

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

maxKeyPhraseCount

integer

Число, указывающее, сколько ключевых фраз нужно возвращать. При отсутствии будут возвращены все определенные ключевые фразы.

modelVersion

string

Версия модели, используемая при вызове службы анализа текста. Он по умолчанию будет доступен по умолчанию, если он не указан. Мы рекомендуем не указывать это значение, если это значение не требуется.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

KeyPhraseExtractionSkillLanguage

Коды языка, поддерживаемые для входного текста keyPhraseExtractionSkill.

Имя Тип Описание
da

string

Датский

de

string

Немецкий

en

string

Английский

es

string

Испанский

fi

string

Финский

fr

string

Французский

it

string

Итальянский

ja

string

Японский

ko

string

Корейский

nl

string

Нидерландский

no

string

Норвежский (Bokmaal)

pl

string

Польский

pt-BR

string

Португальский (Бразилия)

pt-PT

string

Португальский (Португалия)

ru

string

Русский

sv

string

Шведский

LanguageDetectionSkill

Навык, который обнаруживает язык входного текста и сообщает один языковой код для каждого документа, отправленного по запросу. Языковой код связан с оценкой, указывающей достоверность анализа.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.LanguageDetectionSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultCountryHint

string

Код страны, используемый в качестве указания модели обнаружения языка, если он не может отсодействовать от языка.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

modelVersion

string

Версия модели, используемая при вызове службы анализа текста. Он по умолчанию будет доступен по умолчанию, если он не указан. Мы рекомендуем не указывать это значение, если это значение не требуется.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

LineEnding

Определяет последовательность символов, используемых между строками текста, распознаваемыми навыком OCR. Значением по умолчанию является пробел.

Имя Тип Описание
carriageReturn

string

Линии разделяются символом возврата каретки ("\r').

carriageReturnLineFeed

string

Линии разделены возвратом каретки и символом строки ("\r\n').

lineFeed

string

Строки разделены одним каналом строк ("\n') символом.

space

string

Линии разделяются одним символом пробела.

MergeSkill

Навык объединения двух или более строк в одну единую строку с необязательным определяемым пользователем разделителем, разделяющим каждую часть компонента.

Имя Тип Default value Описание
@odata.type string:

#Microsoft.Skills.Text.MergeSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

insertPostTag

string

Тег указывает конец объединенного текста. По умолчанию тег является пустым пространством.

insertPreTag

string

Тег указывает начало объединенного текста. По умолчанию тег является пустым пространством.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

OcrSkill

Навык, извлекающий текст из файлов изображений.

Имя Тип Default value Описание
@odata.type string:

#Microsoft.Skills.Vision.OcrSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

OcrSkillLanguage

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

detectOrientation

boolean

False

Значение, указывающее на включение или отсутствие обнаружения ориентации. Значение по умолчанию — false.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

lineEnding

LineEnding

Определяет последовательность символов, используемых между строками текста, распознаваемыми навыком OCR. Значением по умолчанию является пробел.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

OcrSkillLanguage

Коды языка, поддерживаемые для ввода OcrSkill.

Имя Тип Описание
Jns

string

Jaunsari (Devanagiri)

af

string

Африкаанс

anp

string

Angika (Devanagiri)

ar

string

Арабский

ast

string

Астурийский

awa

string

Awadhi-Hindi (Devanagiri)

az

string

Азербайджанская (латиница)

be

string

Белорусский (кириллица и латиница)

be-cyrl

string

Белорусский (кириллица)

be-latn

string

Белорусский (латиница)

bfy

string

Багели

bfz

string

Махасу Пахари (Деванагири)

bg

string

Болгарский

bgc

string

Харьянви

bho

string

Bhojpuri-Hindi (Devanagiri)

bi

string

Бислама

bns

string

Бундели

br

string

Бретонский

bra

string

Брайбха

brx

string

Бодо (Devanagiri)

bs

string

Боснийская латиница

bua

string

Бурят (кириллица)

ca

string

Каталанский

ceb

string

Себуано

ch

string

Чаморро

cnr-cyrl

string

Монтенегрин (Кириллица)

cnr-latn

string

Монтенегрин (латиница)

co

string

Корсиканский

crh

string

Крымская татарская (латиница)

cs

string

Чешский

csb

string

Кашубский

cy

string

Валлийский

da

string

Датский

de

string

Немецкий

dhi

string

Dhimal (Devanagiri)

doi

string

Dogri (Devanagiri)

dsb

string

Нижнелужицкий

el

string

Греческий

en

string

Английский

es

string

Испанский

et

string

Эстонский

eu

string

Баскский

fa

string

Персидский

fi

string

Финский

fil

string

Филиппинский

fj

string

Фиджи

fo

string

Фарерский

fr

string

Французский

fur

string

Frulian

fy

string

Западный Фризиан

ga

string

Ирландский

gag

string

Гагауз (латиница)

gd

string

Шотландский

gil

string

Гильбертский

gl

string

Галисийский

gon

string

Gondi (Devanagiri)

gv

string

Мэнский

gvr

string

Gurung (Devanagiri)

haw

string

Гавайский

hi

string

Хинди

hlb

string

Halbi (Devanagiri)

hne

string

Chhattisgarhi (Devanagiri)

hni

string

Хани

hoc

string

Хо (Devanagiri)

hr

string

Хорватский

hsb

string

Верхнелужицкий

ht

string

Гаитянский

hu

string

Венгерский

ia

string

Интерлингва

id

string

Индонезийский

is

string

Исландский

it

string

Итальянский

iu

string

Inuktitut (латиница)

ja

string

Японский

jv

string

Яванский

kaa

string

Kara-Kalpak (латиница)

kaa-cyrl

string

Kara-Kalpak (кириллица)

kac

string

Качин (латиница)

kea

string

Kabuverdianu

kfq

string

Корку

kha

string

Кхаси

kk-cyrl

string

Казах (кириллица)

kk-latn

string

Казах (латиница)

kl

string

Гренландский

klr

string

Халинг

kmj

string

Malto (Devanagiri)

ko

string

Корейский

kos

string

Косраеан

kpy

string

Корякский

krc

string

Karachay-Balkar

kru

string

Курух (Деванагири)

ksh

string

Рипуарианец

ku-arab

string

Курдский (арабский)

ku-latn

string

Курдский (латиница)

kum

string

Кумык (кириллица)

kw

string

Корнуоллский

ky

string

Киргиз (кириллица)

la

string

Латинский

lb

string

Люксембургский

lkt

string

Лакота

lt

string

Литовский

mi

string

Маори

mn

string

Монгольский (кириллица)

mr

string

Маратхи

ms

string

Малайский (латиница)

mt

string

Мальтийский

mww

string

Hmong Daw (латиница)

myv

string

Эрзиа (кириллица)

nap

string

Неаполитанский

nb

string

Норвежский

ne

string

Непальский

niu

string

Ниуэан

nl

string

Нидерландский

no

string

Норвежский

nog

string

Nogay

oc

string

Окситанский

os

string

Ossetic

pa

string

Пенджаби (арабский)

pl

string

Польский

prs

string

Дари

ps

string

Пушту

pt

string

Португальский

quc

string

K'iche'

rab

string

Chamling

rm

string

Ретороманский

ro

string

Румынский

ru

string

Русский

sa

string

Санскрит (Devanagiri)

sat

string

Сантали (Деванагири)

sck

string

Садри (Devanagiri)

sco

string

Шотландский

sk

string

Словацкий

sl

string

Словенский

sm

string

Самоан (латиница)

sma

string

Южный Сами

sme

string

Северный Сами (латиница)

smj

string

Лул Сами

smn

string

Инари Сами

sms

string

Skolt Sami

so

string

Сомалийский (арабский)

sq

string

Албанский

sr

string

Сербский (латиница)

sr-Cyrl

string

Сербский (кириллица)

sr-Latn

string

Сербский (латиница)

srx

string

Сэрмаури (Devanagiri)

sv

string

Шведский

sw

string

Суахили (латиница)

tet

string

Тетум

tg

string

Таджикский (кириллица)

thf

string

Тангми

tk

string

Туркменистан (латиница)

to

string

Тонганский

tr

string

Турецкий

tt

string

Татарский (латиница)

tyv

string

Туван

ug

string

Уйгур (арабский)

unk

string

Неизвестно (все)

ur

string

Урду

uz

string

Узбекистан (латиница)

uz-arab

string

Узбекистан (арабский)

uz-cyrl

string

Узбекский (кириллица)

vo

string

Волапюк

wae

string

Уолзер

xnr

string

Кангри (Devanagiri)

xsr

string

Шерпа (Devanagiri)

yua

string

Yucatec Майя

za

string

Чжуан

zh-Hans

string

Китайский упрощённый

zh-Hant

string

Китайский традиционный

zu

string

Зулусский

OutputFieldMappingEntry

Сопоставление полей вывода для навыка.

Имя Тип Описание
name

string

Имя выходных данных, определенных навыком.

targetName

string

Целевое имя выходных данных. Это необязательно и по умолчанию имя.

PIIDetectionSkill

Используя API анализа текста, извлекает личную информацию из входного текста и предоставляет возможность маскирования.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.PIIDetectionSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

string

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

domain

string

Если задано, присвойте домену PII только подмножество категорий сущностей. Возможные значения включают: "phi", "none". Значение по умолчанию — none.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

maskingCharacter

string

Символ, используемый для маскирования текста, если параметр maskingMode задается для замены. Значение по умолчанию — "*".

maskingMode

PIIDetectionSkillMaskingMode

Параметр, предоставляющий различные способы маскирования личных данных, обнаруженных в входном тексте. Значение по умолчанию — none.

minimumPrecision

number

Значение от 0 до 1, которое используется только для включения сущностей, оценка достоверности которых превышает указанное значение. Если не задано (по умолчанию) или если явно задано значение NULL, все сущности будут включены.

modelVersion

string

Версия модели, используемая при вызове службы анализа текста. Он по умолчанию будет доступен по умолчанию, если он не указан. Мы рекомендуем не указывать это значение, если это значение не требуется.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

piiCategories

string[]

Список категорий сущностей PII, которые следует извлечь и маскировать.

PIIDetectionSkillMaskingMode

Строка, указывающая, какую маскировкуMode следует использовать для маскирования личных данных, обнаруженных в входном тексте.

Имя Тип Описание
none

string

Маскирование не происходит, и выходные данные maskedText не будут возвращены.

replace

string

Заменяет обнаруженные сущности символом, заданным в параметре maskingCharacter. Символ будет повторяться в длину обнаруженной сущности, чтобы смещения соответствовали как входному тексту, так и выходному маскированного текста.

SearchIndexerDataNoneIdentity

Очищает свойство удостоверения источника данных.

Имя Тип Описание
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

Фрагмент URI, указывающий тип удостоверения.

SearchIndexerDataUserAssignedIdentity

Указывает удостоверение для используемого источника данных.

Имя Тип Описание
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

Фрагмент URI, указывающий тип удостоверения.

userAssignedIdentity

string

Полный идентификатор ресурса Azure назначаемого пользователем управляемого удостоверения обычно в форме "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId", который должен быть назначен службе поиска.

SearchIndexerIndexProjections

Определение дополнительных проекций для вторичных индексов поиска.

Имя Тип Описание
parameters

SearchIndexerIndexProjectionsParameters

Словарь свойств конфигурации для проекции индекса. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивным типом.

selectors

SearchIndexerIndexProjectionSelector[]

Список проекций, выполняемых для вторичных индексов поиска.

SearchIndexerIndexProjectionSelector

Описание того, какие данные следует хранить в указанном индексе поиска.

Имя Тип Описание
mappings

InputFieldMappingEntry[]

Сопоставления проекции или источник должен быть сопоставлен с полем в целевом индексе.

parentKeyFieldName

string

Имя поля в индексе поиска для сопоставления значения ключа родительского документа. Должно быть строковым полем, которое можно фильтровать, а не ключевое поле.

sourceContext

string

Исходный контекст для проекций. Представляет кратность, при которой документ будет разделен на несколько вложенных документов.

targetIndexName

string

Имя индекса поиска для проекта. Должен иметь ключевое поле с набором анализатора "ключевое слово".

SearchIndexerIndexProjectionsParameters

Словарь свойств конфигурации для проекции индекса. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивным типом.

Имя Тип Описание
projectionMode

IndexProjectionMode

Определяет поведение проекций индекса относительно остальной части индексатора.

SearchIndexerKnowledgeStore

Определение дополнительных проекций для больших двоичных объектов Azure, таблиц или файлов, обогащенных данных.

Имя Тип Описание
identity SearchIndexerDataIdentity:

Назначаемое пользователем управляемое удостоверение, используемое для подключений к службе хранилища Azure при написании проекций хранилища знаний. Если строка подключения указывает удостоверение (ResourceId) и не указано, используется управляемое удостоверение, назначаемое системой. При обновлении индексатора, если удостоверение не указано, значение остается неизменным. Если задано значение none, то значение этого свойства очищается.

parameters

SearchIndexerKnowledgeStoreParameters

Словарь свойств конфигурации для конкретного хранилища знаний. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивным типом.

projections

SearchIndexerKnowledgeStoreProjection[]

Список дополнительных проекций для выполнения во время индексирования.

storageConnectionString

string

Строка подключения к проекциям учетной записи хранения будет сохранена.

SearchIndexerKnowledgeStoreFileProjectionSelector

Определение проекции для хранения данных в файлах Azure.

Имя Тип Описание
generatedKeyName

string

Имя созданного ключа для хранения проекции.

inputs

InputFieldMappingEntry[]

Вложенные входные данные для сложных проекций.

referenceKeyName

string

Имя ссылочного ключа для другой проекции.

source

string

Исходные данные для проекта.

sourceContext

string

Исходный контекст для сложных проекций.

storageContainer

string

Контейнер BLOB-объектов для хранения проекций в.

SearchIndexerKnowledgeStoreObjectProjectionSelector

Определение проекции для хранения данных в BLOB-объекте Azure.

Имя Тип Описание
generatedKeyName

string

Имя созданного ключа для хранения проекции.

inputs

InputFieldMappingEntry[]

Вложенные входные данные для сложных проекций.

referenceKeyName

string

Имя ссылочного ключа для другой проекции.

source

string

Исходные данные для проекта.

sourceContext

string

Исходный контекст для сложных проекций.

storageContainer

string

Контейнер BLOB-объектов для хранения проекций в.

SearchIndexerKnowledgeStoreParameters

Словарь свойств конфигурации для конкретного хранилища знаний. Каждое имя — это имя определенного свойства. Каждое значение должно быть примитивным типом.

Имя Тип Default value Описание
synthesizeGeneratedKeyName

boolean

False

Следует ли синтезировать созданные имена ключей, если они еще не присутствуют.

SearchIndexerKnowledgeStoreProjection

Объект контейнера для различных селекторов проекций.

Имя Тип Описание
files

SearchIndexerKnowledgeStoreFileProjectionSelector[]

Проекции в хранилище файлов Azure.

objects

SearchIndexerKnowledgeStoreObjectProjectionSelector[]

Проекции в хранилище BLOB-объектов Azure.

tables

SearchIndexerKnowledgeStoreTableProjectionSelector[]

Проекции в хранилище таблиц Azure.

SearchIndexerKnowledgeStoreTableProjectionSelector

Описание того, какие данные следует хранить в таблицах Azure.

Имя Тип Описание
generatedKeyName

string

Имя созданного ключа для хранения проекции.

inputs

InputFieldMappingEntry[]

Вложенные входные данные для сложных проекций.

referenceKeyName

string

Имя ссылочного ключа для другой проекции.

source

string

Исходные данные для проекта.

sourceContext

string

Исходный контекст для сложных проекций.

tableName

string

Имя таблицы Azure для хранения проецируемых данных.

SearchIndexerSkillset

Список навыков.

Имя Тип Описание
@odata.etag

string

ETag набора навыков.

cognitiveServices CognitiveServicesAccount:

Сведения о службе ИИ Azure, которую следует использовать при выполнении навыков.

description

string

Описание набора навыков.

encryptionKey

SearchResourceEncryptionKey

Описание ключа шифрования, созданного в Azure Key Vault. Этот ключ используется для предоставления дополнительного уровня шифрования для определения набора навыков, если требуется полная уверенность, что никто, даже не Корпорация Майкрософт, не может расшифровать определение набора навыков. После шифрования определения набора навыков он всегда будет оставаться зашифрованным. Служба поиска игнорирует попытки задать для этого свойства значение NULL. Это свойство можно изменить по мере необходимости, если вы хотите повернуть ключ шифрования; Определение набора навыков не будет затронуто. Шифрование с помощью ключей, управляемых клиентом, недоступно для бесплатных служб поиска и доступно только для платных служб, созданных 1 января 2019 г.

indexProjections

SearchIndexerIndexProjections

Определение дополнительных проекций для вторичных индексов поиска.

knowledgeStore

SearchIndexerKnowledgeStore

Определение дополнительных проекций для больших двоичных объектов Azure, таблиц или файлов, обогащенных данных.

name

string

Имя набора навыков.

skills SearchIndexerSkill[]:

Список навыков в наборе навыков.

SearchResourceEncryptionKey

Ключ шифрования, управляемый клиентом, в Azure Key Vault. Ключи, которые создаются и управляются, можно использовать для шифрования или расшифровки неактивных данных, таких как индексы и карты синонимов.

Имя Тип Описание
accessCredentials

AzureActiveDirectoryApplicationCredentials

Необязательные учетные данные Azure Active Directory, используемые для доступа к Azure Key Vault. Не требуется, если вместо этого используется управляемое удостоверение.

identity SearchIndexerDataIdentity:

Явное управляемое удостоверение, используемое для этого ключа шифрования. Если не указано, а свойство учетных данных доступа равно NULL, используется управляемое удостоверение, назначаемое системой. При обновлении ресурса, если явное удостоверение не указано, оно остается неизменным. Если задано значение none, то значение этого свойства очищается.

keyVaultKeyName

string

Имя ключа Azure Key Vault, используемого для шифрования неактивных данных.

keyVaultKeyVersion

string

Версия ключа Azure Key Vault, используемая для шифрования неактивных данных.

keyVaultUri

string

Универсальный код ресурса (URI) Хранилища ключей Azure, который также называется DNS-именем, который содержит ключ, используемый для шифрования неактивных данных. Пример URI может быть https://my-keyvault-name.vault.azure.net.

SentimentSkill

Этот навык не рекомендуется. Используйте версию 3. Вместо этого тональность.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.SentimentSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

SentimentSkillLanguage

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

SentimentSkillLanguage

Устаревшие. Коды языка, поддерживаемые для входного текста с помощью SentimentSkill.

Имя Тип Описание
da

string

Датский

de

string

Немецкий

el

string

Греческий

en

string

Английский

es

string

Испанский

fi

string

Финский

fr

string

Французский

it

string

Итальянский

nl

string

Нидерландский

no

string

Норвежский (Bokmaal)

pl

string

Польский

pt-PT

string

Португальский (Португалия)

ru

string

Русский

sv

string

Шведский

tr

string

Турецкий

SentimentSkillV3

Используя API анализа текста, вычисляет неструктурированный текст и для каждой записи предоставляет метки тональности (например, "отрицательные", "нейтральные" и "положительные") на основе самой высокой оценки достоверности, найденной службой на уровне предложения и документа.

Имя Тип Default value Описание
@odata.type string:

#Microsoft.Skills.Text.V3.SentimentSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

string

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

includeOpinionMining

boolean

False

Если задано значение true, выходные данные навыка будут содержать сведения из анализа текста для интеллектуального анализа мнений, а именно целевые объекты (существительные или глаголы) и связанные с ними оценки (прилагательные) в тексте. Значение по умолчанию — false.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

modelVersion

string

Версия модели, используемая при вызове службы анализа текста. Он по умолчанию будет доступен по умолчанию, если он не указан. Мы рекомендуем не указывать это значение, если это значение не требуется.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

ShaperSkill

Навык изменения выходных данных. Он создает сложный тип для поддержки составных полей (также известных как многопартийные поля).

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Util.ShaperSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

SplitSkill

Навык разделения строки на фрагменты текста.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.SplitSkill

Фрагмент URI, указывающий тип навыка.

azureOpenAITokenizerParameters

AzureOpenAITokenizerParameters

Применяется только в том случае, если для единицы задано значение azureOpenAITokens. При указании splitSkill будет использовать эти параметры при выполнении маркеризации. Параметры являются допустимым свойством encoderModelName и необязательным свойством "allowedSpecialTokens".

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultLanguageCode

SplitSkillLanguage

Значение, указывающее, какой языковой код следует использовать. По умолчанию используется en.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

maximumPageLength

integer

Требуемая максимальная длина страницы. Значение по умолчанию — 10000.

maximumPagesToTake

integer

Применимо только в том случае, если для textSplitMode задано значение pages. Если задано, SplitSkill прекратит разделение после обработки первых страниц "maximumPagesToTake", чтобы повысить производительность, если требуется только несколько начальных страниц из каждого документа.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

pageOverlapLength

integer

Применимо только в том случае, если для textSplitMode задано значение pages. Если задано, n+1-й блок начнется с этого числа символов или токенов из конца nth chunk.

textSplitMode

TextSplitMode

Значение, указывающее, какой режим разделения для выполнения.

unit

SplitSkillUnit

Применяется только в том случае, если для textSplitMode задано значение pages. Существует два возможных значения. Выбор значений определяет длину измерения (maximumPageLength и pageOverlapLength). Значение по умолчанию — "символы", что означает, что длина будет измеряться символами.

SplitSkillEncoderModelName

Применяется только в том случае, если для единицы задано значение azureOpenAITokens. Параметры включают "R50k_base", "P50k_base", "P50k_edit" и "CL100k_base". Значение по умолчанию — "CL100k_base".

Имя Тип Описание
cl100k_base

string

Базовая модель с словарем маркеров 100 000.

p50k_base

string

Базовая модель с словарем маркеров 50 000, оптимизированная для задач на основе запросов.

p50k_edit

string

Аналогично p50k_base, но точно настроен для редактирования или перефразирования задач с 50 000 словарем маркеров.

r50k_base

string

Относится к базовой модели, обученной с 50 000 словарем маркеров, часто используемым в общих задачах обработки естественного языка.

SplitSkillLanguage

Коды языка, поддерживаемые для входного текста splitSkill.

Имя Тип Описание
am

string

Амхарский

bs

string

Боснийский

cs

string

Чешский

da

string

Датский

de

string

Немецкий

en

string

Английский

es

string

Испанский

et

string

Эстонский

fi

string

Финский

fr

string

Французский

he

string

Иврит

hi

string

Хинди

hr

string

Хорватский

hu

string

Венгерский

id

string

Индонезийский

is

string

Исландский

it

string

Итальянский

ja

string

Японский

ko

string

Корейский

lv

string

Латышский

nb

string

Норвежский

nl

string

Нидерландский

pl

string

Польский

pt

string

Португальский (Португалия)

pt-br

string

Португальский (Бразилия)

ru

string

Русский

sk

string

Словацкий

sl

string

Словенский

sr

string

Сербский

sv

string

Шведский

tr

string

Турецкий

ur

string

Урду

zh

string

Китайский (упрощенное письмо)

SplitSkillUnit

Значение, указывающее, какую единицу следует использовать.

Имя Тип Описание
azureOpenAITokens

string

Длина будет измеряться токенизатором AzureOpenAI из библиотеки tiktoken.

characters

string

Длина будет измеряться символом.

TextSplitMode

Значение, указывающее, какой режим разделения для выполнения.

Имя Тип Описание
pages

string

Разделить текст на отдельные страницы.

sentences

string

Разделить текст на отдельные предложения.

TextTranslationSkill

Навык перевода текста с одного языка на другой.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Text.TranslationSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

defaultFromLanguageCode

TextTranslationSkillLanguage

Код языка для перевода документов из документов, которые не указывают язык явным образом.

defaultToLanguageCode

TextTranslationSkillLanguage

Код языка для перевода документов в документы, которые не указывают язык явным образом.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

suggestedFrom

TextTranslationSkillLanguage

Код языка для перевода документов из случаев, когда не указан параметр defaultFromLanguageCode, и автоматическое обнаружение языка не выполнено. По умолчанию используется en.

TextTranslationSkillLanguage

Коды языка, поддерживаемые для входного текста TextTranslationSkill.

Имя Тип Описание
af

string

Африкаанс

ar

string

Арабский

bg

string

Болгарский

bn

string

Бангла

bs

string

Боснийский (латиница)

ca

string

Каталанский

cs

string

Чешский

cy

string

Валлийский

da

string

Датский

de

string

Немецкий

el

string

Греческий

en

string

Английский

es

string

Испанский

et

string

Эстонский

fa

string

Персидский

fi

string

Финский

fil

string

Филиппинский

fj

string

Фиджи

fr

string

Французский

ga

string

Ирландский

he

string

Иврит

hi

string

Хинди

hr

string

Хорватский

ht

string

Гаитянский

hu

string

Венгерский

id

string

Индонезийский

is

string

Исландский

it

string

Итальянский

ja

string

Японский

kn

string

Каннада

ko

string

Корейский

lt

string

Литовский

lv

string

Латышский

mg

string

Малагасийский

mi

string

Маори

ml

string

Малаялам

ms

string

Малайский

mt

string

Мальтийский

mww

string

Hmong Daw

nb

string

Норвежский

nl

string

Нидерландский

otq

string

Керето Отоми

pa

string

Панджаби

pl

string

Польский

pt

string

Португальский

pt-PT

string

Португальский (Португалия)

pt-br

string

Португальский (Бразилия)

ro

string

Румынский

ru

string

Русский

sk

string

Словацкий

sl

string

Словенский

sm

string

Самоанский

sr-Cyrl

string

Сербский (кириллица)

sr-Latn

string

Сербский (латиница)

sv

string

Шведский

sw

string

Суахили

ta

string

Тамильский

te

string

Телугу

th

string

Тайский

tlh

string

Клингон

tlh-Latn

string

Klingon (латинский скрипт)

tlh-Piqd

string

Клингон (скрипт Клингон)

to

string

Тонганский

tr

string

Турецкий

ty

string

Таитянский

uk

string

Украинский

ur

string

Урду

vi

string

Вьетнамский

yua

string

Yucatec Майя

yue

string

Кантонский (традиционный)

zh-Hans

string

Китайский упрощённый

zh-Hant

string

Китайский традиционный

VisionVectorizeSkill

Позволяет создать вектор внедрения для заданного изображения или текстового ввода с помощью API векторизации визуального распознавания Служб искусственного интеллекта Azure.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Vision.VectorizeSkill

Фрагмент URI, указывающий тип навыка.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

modelVersion

string

Версия модели, используемая при вызове службы визуального распознавания служб ИИ. Он по умолчанию будет доступен по умолчанию, если он не указан.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

VisualFeature

Строки, указывающие, какие типы визуальных функций следует возвращать.

Имя Тип Описание
adult

string

Визуальные функции, распознанные как взрослые люди.

brands

string

Визуальные функции, признанные коммерческими брендами.

categories

string

Категории.

description

string

Описание.

faces

string

Визуальные функции, распознанные как лица людей.

objects

string

Визуальные функции, распознанные как объекты.

tags

string

Теги.

WebApiSkill

Навык, который может вызывать конечную точку веб-API, позволяя расширить набор навыков, вызывая пользовательский код.

Имя Тип Описание
@odata.type string:

#Microsoft.Skills.Custom.WebApiSkill

Фрагмент URI, указывающий тип навыка.

authIdentity SearchIndexerDataIdentity:

Назначаемое пользователем управляемое удостоверение, используемое для исходящих подключений. Если указан идентификатор authResourceId и он не указан, используется управляемое удостоверение, назначаемое системой. При обновлении индексатора, если удостоверение не указано, значение остается неизменным. Если задано значение none, то значение этого свойства очищается.

authResourceId

string

Применяется к пользовательским навыкам, которые подключаются к внешнему коду в функции Azure или другом приложении, которое предоставляет преобразования. Это значение должно быть идентификатором приложения, созданным для функции или приложения при регистрации в Azure Active Directory. При указании пользовательский навык подключается к функции или приложению с помощью управляемого идентификатора (назначаемого системой или пользователем) службы поиска и маркера доступа функции или приложения, используя это значение в качестве идентификатора ресурса для создания области маркера доступа.

batchSize

integer

Требуемый размер пакета, указывающий количество документов.

context

string

Представляет уровень, на котором выполняются операции, такие как корневой каталог документа или содержимое документа (например, /document или /document/content). Значение по умолчанию — /document.

degreeOfParallelism

integer

Если задано, количество параллельных вызовов, которые можно выполнить в веб-API.

description

string

Описание навыка, описывающего входные данные, выходные данные и использование навыка.

httpHeaders

object

Заголовки, необходимые для выполнения http-запроса.

httpMethod

string

Метод http-запроса.

inputs

InputFieldMappingEntry[]

Входные данные навыков могут быть столбцом в исходном наборе данных или выходными данными вышестоящего навыка.

name

string

Имя навыка, который однозначно идентифицирует его в наборе навыков. Навык без определенного имени будет указан по умолчанию для его 1-го индекса в массиве навыков, префиксированного символом "#".

outputs

OutputFieldMappingEntry[]

Выходные данные навыка — это поле в индексе поиска или значение, которое можно использовать в качестве входных данных другим навыком.

timeout

string

Требуемое время ожидания запроса. Значение по умолчанию — 30 секунд.

uri

string

URL-адрес веб-API.