API-интерфейс обходчика соединителей соединителей и модели соединителей для соединителей microsoft Graph для контрактов
ВО время обхода контента вызывается API-интерфейс и модели соединителя соединителя соединителей Microsoft Graph connectors SDK.
API-интерфейс обходчика соединителя
Метод | Параметры | Возвращаемый тип | Описание |
---|---|---|---|
GetCrawlStream | GetCrawlStreamRequest | CrawlStreamBit в виде потока | Считывает данные из источника данных. Этот метод будет вызываться во время полного и периодического полного обхода, когда все элементы должны считываться из источника данных и возвращаться на платформу. |
GetIncrementalCrawlStream | GetIncrementalCrawlStreamRequest | IncrementalCrawlStreamBit в виде потока | Считывает данные из источника данных. Этот метод является необязательным и будет вызываться во время добавочного обхода контента и возвращает только добавочные изменения в элементах с момента последнего добавочного обхода. |
Модели обходчика соединителей
Ниже приведены модели обходчика соединителей.
GetCrawlStreamRequest
Модель запроса для получения элементов во время обхода контента.
Свойство | Тип | Описание |
---|---|---|
customConfiguration | CustomConfiguration | Предоставляет данные конфигурации для соединителя. |
authenticationData | AuthenticationData | Содержит URL-адрес доступа к источнику данных и учетные данные для доступа к нему. |
crawlProgressMarker | CrawlCheckpoint | Содержит данные для идентификации элементов, обработанных во время последнего обхода контента. Соединитель возвращает сведения об элементе и использует их при сбое платформы во время обхода. |
Схема | DataSourceSchema | Показывает схему подключения. Это свойство также можно использовать для задания значения. |
CrawlStreamBit
Модель ответа, содержащая состояние элемента, указывающее на успех или сбой, а также индикатор или контрольную точку для элемента, обход которого выполняется во время полного или периодического обхода.
Свойство | Тип | Описание |
---|---|---|
status | OperationStatus | Показывает состояние операции и сведения об ошибке. |
crawlItem | CrawlItem | Показывает один элемент, обход из источника данных. |
crawlProgressMarker | CrawlCheckpoint | Определяет элемент, обход из источника данных. |
GetIncrementalCrawlStreamRequest
Модель запроса для получения элементов во время добавочного обхода контента.
Свойство | Тип | Описание |
---|---|---|
customConfiguration | CustomConfiguration | Предоставляет данные конфигурации для соединителя. |
authenticationData | AuthenticationData | Содержит URL-адрес доступа к источнику данных и учетные данные для доступа к нему. |
crawlProgressMarker | CrawlCheckpoint | Содержит данные для идентификации элементов, обработанных во время последнего обхода контента. Соединитель возвращает сведения об элементе и использует их при сбое платформы во время обхода. |
Схемы | DataSourceSchema | Показывает схему подключения. Это свойство также можно использовать для задания значения. |
previousCrawlStartTimeInUtc | Timestamp | Показывает предыдущее время начала обхода контента в формате UTC. Это значение можно использовать при первом добавочном обходе, но последующие вызовы должны использовать значение контрольной точки. |
IncrementalCrawlStreamBit
Модель ответа, содержащая элемент, состояние, указывающее на успешное или неудачное завершение, если таковые есть, и индикатор или контрольную точку для элемента, обход которого выполняется во время добавочного обхода.
Свойство | Тип | Описание |
---|---|---|
status | OperationStatus | Показывает состояние операции и сведения об ошибке. |
crawlItem | IncrementalCrawlItem | Показывает один элемент, обход из источника данных во время и добавочного обхода. |
crawlProgressMarker | CrawlCheckpoint | Определяет последний элемент, обход из источника данных во время последнего добавочного обхода. |
Элементы перечисления ItemType для CrawlItem
Поля перечисления для элементов обхода контента.
Элемент | Значение | Описание |
---|---|---|
ContentItem | 0 | Элементы данных с содержимым для приема. Например: содержимое веб-сайта. |
LinkItem | 1 | Ссылка на элемент контента, который будет использоваться при последующих обходах контента. Например: Ссылки на веб-сайт или папку. |
CrawlItem
Представляет сущность в источнике данных. Максимальный допустимый размер — 4 МБ. Например: файл, папка или запись в таблице.
Свойство | Тип | Описание |
---|---|---|
Itemid | string | Показывает уникальный идентификатор, представляющий элемент в источнике данных. |
contentItem | ContentItem | Показывает элемент данных с содержимым для приема. Например: содержимое веб-сайта. |
linkItem | LinkItem | Ссылка на элемент контента, который будет использоваться при последующих обходах контента. Например: ссылка на веб-сайт или папку. |
Itemtype | ItemType | Показывает тип отправляемого элемента. Эта модель должна иметь набор contentItem или linkItem , и это поле перечисления должно соответствовать этому элементу. |
Примечание.
- Свойства linkItem и contentItem являются взаимоисключающими.
Элементы перечисления ItemType для IncrementalCrawlItem
Поля перечисления для элементов добавочного обхода контента.
Элемент | Значение | Описание |
---|---|---|
ContentItem | 0 | Элементы данных с содержимым для приема. Например: содержимое веб-сайта. |
LinkItem | 1 | Ссылка на элемент контента, который будет использоваться при последующих обходах контента. Например: ссылка на веб-сайт или папку. |
DeletedItem | 2 | Элемент, который был удален из источника данных и должен быть удален из индекса. |
IncrementalCrawlItem
Представляет сущность в источнике данных. Например: файл, папка или запись в таблице.
Свойство | Тип | Описание |
---|---|---|
Itemid | string | Показывает уникальный идентификатор, представляющий элемент в источнике данных. |
contentItem | ContentItem | Показывает элемент данных с содержимым для приема. Например: содержимое веб-сайта. |
linkItem | LinkItem | Ссылка на элемент контента, который будет использоваться при последующих обходах контента. Например: ссылка на веб-сайт или папку. |
deletedItem | DeletedItem | Элемент, который удаляется из источника данных и должен быть удален из индекса. Если параметр deletedItem задан, невозможно задать contentItem или linkItem . |
Itemtype | ItemType | Показывает тип отправляемого элемента. Эта модель должна иметь набор contentItem или linkItem , и это поле перечисления должно соответствовать этому элементу. |
Примечание.
- Свойства linkItem, contentItem и deletedItem являются взаимоисключающими.
ContentItem
Элемент, содержащий содержимое сущности источника данных для приема. Например: содержимое веб-сайта.
Свойство | Тип | Описание |
---|---|---|
propertyValues | SourcePropertyValueMap | Содержит ключ и значения каждого свойства в элементе. |
accessList | Acl | Ограничивает доступ к элементу определенным пользователям или группам. |
содержимое | Контент | Показывает свойство содержимого элемента, которое можно использовать при отображении результатов поиска. |
LinkItem
Элемент, который выступает в качестве ссылки на другой элемент. Эти элементы ссылки будут снова отправлены в соединитель для повторного раскроя; Например, в содержимом папки файлы будут элементами содержимого, а вложенные папки — элементами ссылки.
Свойство | Тип | Описание |
---|---|---|
Метаданных | строка сопоставления<, GenericType> | Содержит метаданные, необходимые соединителю для повторного раскраски элемента. |
DeletedItem
Представляет элемент, который был удален из источника данных и должен быть удален из индекса.
Acl
Ограничивает пользователей, которые могут просматривать результаты поиска.
Свойство | Тип | Описание |
---|---|---|
Entries | повторение AccessControlEntry | Показывает массив или коллекцию записей списка управления доступом. |
Члены перечисления AclAccessType
Элементы перечисления типа списка управления доступом.
Элемент | Значение | Описание |
---|---|---|
Нет | 0 | Указывает значение по умолчанию: deny. |
Предоставить | 1 | Запись предназначена для пользователей или групп с доступом к элементу. |
Запретить | 2 | Запись предназначена для пользователей или групп без доступа к элементу, а переопределения предоставляются для любого пользователя или группы. |
AccessControlEntry
Содержит отдельные записи управления доступом.
Свойство | Тип | Описание |
---|---|---|
accessType | AclAccessType | Показывает тип доступа сущности, предоставляемой или запрещенной. |
Основной | Principal | Представляет группу или пользователя с определенным доступом. |
Элементы перечисления PrincipalType
Элементы перечисления типа субъекта.
Элемент | Значение | Описание |
---|---|---|
PT_None | 0 | Указывает значение по умолчанию: user. |
Пользователь | 1 | Тип пользователя. |
Группа | 2 | Тип группы. |
Все пользователи | 3 | Специальная группа для предоставления доступа всем пользователям. |
ВсеExceptGuests | 4 | Специальная группа для предоставления доступа всем, кроме гостей. |
Элементы перечисления IdentitySource
Элементы перечисления источника удостоверений.
Элемент | Значение | Описание |
---|---|---|
IS_None | 0 | Указывает значение по умолчанию: Microsoft Entra ID. |
AzureActiveDirectory | 1 | Источником удостоверения является Microsoft Entra ID. |
Элементы перечисления IdentityType
Элементы перечисления типа удостоверения.
Элемент | Значение | Описание |
---|---|---|
IT_None | 0 | Указывает значение по умолчанию: (Azure ADId). |
ActiveDirectorySId | 1 | SID (локальный идентификатор безопасности), предоставляемый Active Directory (AD). |
UserPrincipalName | 2 | Имя участника-пользователя (UPN). |
AadId | 3 | Azure ADId. |
Principal
Структура для хранения атрибутов субъекта (пользователя или группы).
Свойство | Тип | Описание |
---|---|---|
type | PrincipalType | Тип субъекта. |
значение | string | Основное значение: значение идентификатора безопасности, имени участника-пользователя, Azure ADId и т. д. |
identitySource | IdentitySource | Источник удостоверения. |
IdentityType | IdentityType | Тип представления удостоверения. |
identitySourceProperties | строка сопоставления<, строка> | Метаданные об источнике удостоверений. |
SourcePropertyValueMap
Сопоставление ключа свойства источника и его значения в источнике данных. В нем хранится значение свойства каждого элемента.
Свойство | Тип | Описание |
---|---|---|
values | строка сопоставления<, GenericType> | Содержит ключ и значения свойств элемента. Ключ — это имя свойства, а значение — значение свойства. Например, содержимое файла имеет такие свойства, как title, modifiedDate и т. д. Ключами свойств будут сами свойства, а их значениями будут название файла и дата изменения файла соответственно. |
Элементы перечисления ContentType
Элементы перечисления типа контента.
Элемент | Значение | Описание |
---|---|---|
Нет | 0 | Значение по умолчанию. |
Текст | 1 | Текстовый тип контента. |
HTML | 2 | Тип контента HTML. |
Содержимое
Значение свойства содержимого элемента, используемого для отображения результатов поиска.
Свойство | Тип | Описание |
---|---|---|
contentType | ContentType | Тип содержимого. |
contentValue | string | Значение свойства содержимого. |
CrawlCheckpoint
Определяет элемент, который был обходен последним. Она будет сохранена платформой, а контрольная точка из последнего успешного пакета элементов будет использоваться для возобновления обхода в случае сбоя или сбоя. Платформа отправит контрольную точку в API GetCrawlStream .
Свойство | Тип | Описание |
---|---|---|
pagenumber | Uint32 | Показывает номер страницы для обозначения хода обхода контента. |
Batchsize | Uint32 | Содержит количество элементов, возвращаемых в каждом пакете. Он имеет постоянное значение 1, так как каждый элемент передается по отдельности. |
customMarkerData | string | Пользовательские данные, необходимые для идентификации последнего элемента, обхода из источника данных. |
GenericType
Модель для хранения поддерживаемых платформой типов значений в определенных полях, таких как значения исходных свойств. Необходимо задать только одно из следующих полей.
Свойство | Тип | Описание |
---|---|---|
stringValue | string | Представляет строковое значение. |
intValue | int64 | Представляет значение int64 (long). |
doubleValue | double | Представляет двойное значение. |
dateTimeValue | google.protobuf.Timestamp | Представляет значение dateTime. |
boolValue | логический | Представляет логическое значение. |
stingCollectionValue | StringCollectionType | Представляет коллекцию строк. |
intCollectionValue | IntCollectionType | Представляет коллекцию int64 (long). |
doubleCollectionValue | DoubleCollectionType | Представляет коллекцию double. |
dateTimeCollectionValue | TimestampCollectionType | Представляет коллекцию dateTime. |
StringCollectionType
Коллекция строк.
Свойство | Тип | Описание |
---|---|---|
values | повторяющаяся строка | Коллекция или массив строк. |
IntCollectionType
Коллекция целочисленных значений.
Свойство | Тип | Описание |
---|---|---|
values | повторяющееся int64 | Коллекция или массив значений int64 (long). |
DoubleCollectionType
Коллекция двойных значений.
Свойство | Тип | Описание |
---|---|---|
values | повторяющееся двойное | Коллекция или массив двойных значений. |
TimestampCollectionType
Коллекция значений DateTime .
Свойство | Тип | Описание |
---|---|---|
values | повторная google.protobuf.Timestamp | Коллекция или массив значений dateTime . |