Microsoft Graph Connectors SDK Vertrags Connector Crawler-API und -Modelle
Die Microsoft Graph Connectors SDK Contracts Connector Crawler-API und -Modelle werden während einer Durchforstung aufgerufen.
Connectorcrawler-API
Methode | Parameter | Rückgabetyp | Beschreibung |
---|---|---|---|
GetCrawlStream | GetCrawlStreamRequest | CrawlStreamBit als Stream | Liest Daten aus der Datenquelle. Diese Methode wird während vollständiger und regelmäßiger vollständiger Durchforstungen aufgerufen, bei denen alle Elemente aus der Datenquelle gelesen und an die Plattform zurückgegeben werden sollen. |
GetIncrementalCrawlStream | GetIncrementalCrawlStreamRequest | IncrementalCrawlStreamBit als Stream | Liest Daten aus der Datenquelle. Diese Methode ist optional und wird während inkrementeller Durchforstungen aufgerufen und gibt nur die inkrementellen Änderungen an Elementen seit der letzten inkrementellen Durchforstung zurück. |
Connector-Crawlermodelle
Im Folgenden sind die Connector-Crawlermodelle aufgeführt.
GetCrawlStreamRequest
Anforderungsmodell zum Abrufen von Elementen während der Durchforstung.
Eigenschaft | Typ | Beschreibung |
---|---|---|
customConfiguration | CustomConfiguration | Stellt Konfigurationsdaten für den Connector bereit. |
authenticationData | AuthenticationData | Enthält die Zugriffs-URL für die Datenquelle und die Anmeldeinformationen für den Zugriff darauf. |
crawlProgressMarker | CrawlCheckpoint | Enthält Daten, um Elemente zu identifizieren, die bei der letzten Durchforstung verarbeitet wurden. Der Connector gibt die Informationen des Elements zurück und verwendet sie, wenn die Plattform während der Durchforstung abstürzt. |
Schema | DataSourceSchema | Zeigt das Schema der Verbindung an. Diese Eigenschaft kann auch verwendet werden, um den Wert festzulegen. |
CrawlStreamBit
Antwortmodell, das das Element status enthält, das den Erfolg oder Fehler angibt, sowie den Indikator/Prüfpunkt für das Element, das während der vollständigen oder regelmäßigen Durchforstung durchforstet wird.
Eigenschaft | Typ | Beschreibung |
---|---|---|
status | OperationStatus | Zeigt die status des Vorgangs und Fehlerdetails an. |
crawlItem | CrawlItem | Zeigt ein einzelnes Element an, das aus der Datenquelle durchforstet wurde. |
crawlProgressMarker | CrawlCheckpoint | Identifiziert das Element, das aus der Datenquelle durchforstet wurde. |
GetIncrementalCrawlStreamRequest
Anforderungsmodell zum Abrufen von Elementen während einer inkrementellen Durchforstung.
Eigenschaft | Typ | Beschreibung |
---|---|---|
customConfiguration | CustomConfiguration | Stellt Konfigurationsdaten für den Connector bereit. |
authenticationData | AuthenticationData | Enthält die Zugriffs-URL für die Datenquelle und die Anmeldeinformationen für den Zugriff darauf. |
crawlProgressMarker | CrawlCheckpoint | Enthält Daten, um Elemente zu identifizieren, die bei der letzten Durchforstung verarbeitet wurden. Der Connector gibt die Informationen des Elements zurück und verwendet sie, wenn die Plattform während der Durchforstung abstürzt. |
Schema | DataSourceSchema | Zeigt das Schema der Verbindung an. Diese Eigenschaft kann auch verwendet werden, um den Wert festzulegen. |
previousCrawlStartTimeInUtc | Zeitstempel | Zeigt die vorherige Durchforstungsstartzeit in UTC an. Dieser Wert kann bei der ersten inkrementellen Durchforstung verwendet werden, aber nachfolgende Aufrufe sollten den Prüfpunktwert verwenden. |
IncrementalCrawlStreamBit
Antwortmodell, das das Element enthält, status, das ggf. Erfolg/Fehler sowie den Indikator/Prüfpunkt für das Element angibt, das während der inkrementellen Durchforstung durchforstet wird.
Eigenschaft | Typ | Beschreibung |
---|---|---|
status | OperationStatus | Zeigt die status des Vorgangs und Fehlerdetails an. |
crawlItem | IncrementalCrawlItem | Zeigt ein einzelnes Element an, das während und der inkrementellen Durchforstung aus der Datenquelle durchforstet wurde. |
crawlProgressMarker | CrawlCheckpoint | Identifiziert das letzte Element, das während der letzten inkrementellen Durchforstung aus der Datenquelle durchforstet wurde. |
ItemType-Enumerationselemente für CrawlItem
Enumerationsfelder für Durchforstungselemente.
Element | Wert | Beschreibung |
---|---|---|
ContentItem | 0 | Datenelemente mit zu erfassendem Inhalt. Beispiel: Websiteinhalte. |
LinkItem | 1 | Link zu einem Inhaltselement, das in nachfolgenden Durchforstungen verwendet wird. Beispiel: Links zu einer Website oder einem Ordner. |
CrawlItem
Stellt eine Entität in der Datenquelle dar. Die maximal zulässige Größe beträgt 4 MB. Beispiel: eine Datei, ein Ordner oder ein Datensatz in einer Tabelle.
Eigenschaft | Typ | Beschreibung |
---|---|---|
Itemid | string | Zeigt die eindeutige ID an, die das Element in der Datenquelle darstellt. |
contentItem | ContentItem | Zeigt ein Datenelement mit zu erfassendem Inhalt an. Beispiel: der Inhalt einer Website. |
linkItem | LinkItem | Link zu einem Inhaltselement, das in nachfolgenden Durchforstungen verwendet wird. Beispiel: ein Link zu einer Website oder einem Ordner. |
Itemtype | ItemType | Zeigt den Typ des gesendeten Elements an. Dieses Modell sollte über ein contentItem- oder linkItem-Element verfügen, und dieses Enumerationsfeld sollte diesem Element entsprechen. |
Hinweis
- Die Eigenschaften linkItem und contentItem schließen sich gegenseitig aus.
ItemType-Enumerationselemente für IncrementalCrawlItem
Enumerationsfelder für Elemente der inkrementellen Durchforstung.
Element | Wert | Beschreibung |
---|---|---|
ContentItem | 0 | Datenelemente mit zu erfassendem Inhalt. Beispiel: der Inhalt einer Website. |
LinkItem | 1 | Link zu einem Inhaltselement, das in nachfolgenden Durchforstungen verwendet wird. Beispiel: ein Link zu einer Website oder einem Ordner. |
DeletedItem | 2 | Element, das aus der Datenquelle gelöscht wurde und aus dem Index gelöscht werden sollte. |
IncrementalCrawlItem
Stellt eine Entität in der Datenquelle dar. Beispiel: eine Datei, ein Ordner oder ein Datensatz in einer Tabelle.
Eigenschaft | Typ | Beschreibung |
---|---|---|
Itemid | string | Zeigt die eindeutige ID an, die das Element in der Datenquelle darstellt. |
contentItem | ContentItem | Zeigt ein Datenelement mit zu erfassendem Inhalt an. Beispiel: der Inhalt einer Website. |
linkItem | LinkItem | Link zu einem Inhaltselement, das in nachfolgenden Durchforstungen verwendet wird. Beispiel: ein Link zu einer Website oder einem Ordner. |
deletedItem | DeletedItem | Element, das aus der Datenquelle gelöscht wird und aus dem Index entfernt werden soll. Wenn deletedItem festgelegt ist, kann contentItem oder linkItem nicht festgelegt werden. |
Itemtype | ItemType | Zeigt den Typ des gesendeten Elements an. Dieses Modell sollte über ein contentItem- oder linkItem-Element verfügen, und dieses Enumerationsfeld sollte diesem Element entsprechen. |
Hinweis
- Die Eigenschaften linkItem, contentItem und deletedItem schließen sich gegenseitig aus.
ContentItem
Element, das den Inhalt der zu erfassenden Datenquellenentität enthält. Beispiel: der Inhalt einer Website.
Eigenschaft | Typ | Beschreibung |
---|---|---|
Propertyvalues | SourcePropertyValueMap | Enthält den Schlüssel und die Werte jeder Eigenschaft im Element. |
accessList | Accesscontrollist | Schränkt den Zugriff auf das Element auf bestimmte Benutzer oder Gruppen ein. |
content | Inhalt | Zeigt die Inhaltseigenschaft des Elements an, das beim Anzeigen von Suchergebnissen verwendet werden kann. |
LinkItem
Element, das als Link zu einem anderen Element fungiert. Diese Linkelemente werden zum erneuten Durchforsen an den Connector gesendet. In einem Ordnerinhalt sind z. B. Dateien Inhaltselemente, und Unterordner sind Linkelemente.
Eigenschaft | Typ | Beschreibung |
---|---|---|
Metadaten | map<string, GenericType> | Enthält die Metadaten, die der Connector zum erneuten Durchforsen des Elements benötigt. |
DeletedItem
Stellt ein Element dar, das aus der Datenquelle gelöscht wurde und aus dem Index entfernt werden muss.
Accesscontrollist
Schränkt die Benutzer ein, die die Suchergebnisse sehen können.
Eigenschaft | Typ | Beschreibung |
---|---|---|
Entries | Wiederholtes AccessControlEntry | Zeigt das Array oder die Auflistung von Zugriffssteuerungslisteneinträgen an. |
Elemente der AclAccessType-Enumeration
Enumerationsmember des Zugriffssteuerungslistentyps.
Element | Wert | Beschreibung |
---|---|---|
Keine | 0 | Gibt den Standardwert an: deny. |
Gewähren | 1 | Der Eintrag ist für Benutzer/Gruppen mit Zugriff auf das Element. |
Deny | 2 | Der Eintrag ist für Benutzer/Gruppen ohne Zugriff auf das Element und überschreibt die Gewährung für beliebige Benutzer/Gruppen. |
Accesscontrolentry
Enthält einzelne Zugriffssteuerungseinträge.
Eigenschaft | Typ | Beschreibung |
---|---|---|
accessType | AclAccessType | Zeigt den Zugriffstyp der Entität entweder gewähren oder verweigern an. |
Prinzipal | Principal | Stellt eine Gruppe oder einen Benutzer mit definiertem Zugriff dar. |
Elemente der PrincipalType-Enumeration
Enumerationsmember des Prinzipaltyps.
Element | Wert | Beschreibung |
---|---|---|
PT_None | 0 | Gibt den Standardwert an: user. |
Benutzer | 1 | Typ des Benutzers. |
Gruppe | 2 | Typ der Gruppe. |
Jeder | 3 | Spezielle Gruppe, um allen Zugriff zu gewähren. |
EveryoneExceptGuests | 4 | Spezielle Gruppe, um allen Personen außer Gästen Zugriff zu gewähren. |
Member der IdentitySource-Enumeration
Enumerationsmember der Identitätsquelle.
Element | Wert | Beschreibung |
---|---|---|
IS_None | 0 | Gibt den Standardwert an: Microsoft Entra ID. |
AzureActiveDirectory | 1 | Die Identitätsquelle ist Microsoft Entra ID. |
Member der IdentityType-Enumeration
Enumerationsmember des Identitätstyps.
Element | Wert | Beschreibung |
---|---|---|
IT_None | 0 | Gibt den Standardwert an: (Azure ADId). |
ActiveDirectorySId | 1 | SID (Lokale Sicherheits-ID), die von Active Directory (AD) bereitgestellt wird. |
UserPrincipalName | 2 | Benutzerprinzipalname (UPN). |
AadId | 3 | Azure ADId. |
Principal
Struktur zum Speichern von Attributen des Prinzipals (Benutzer/Gruppe).
Eigenschaft | Typ | Beschreibung |
---|---|---|
type | PrincipalType | Typ des Prinzipals. |
Wert | string | Prinzipalwert: Der Wert von SID, UPN, Azure ADId usw. |
identitySource | IdentitySource | Die Identitätsquelle. |
Identitytype | IdentityType | Identitätsdarstellungstyp. |
identitySourceProperties | Zuordnungszeichenfolge<, Zeichenfolge> | Metadaten zur Identitätsquelle. |
SourcePropertyValueMap
Zuordnung des Quelleigenschaftsschlüssels und seines Werts in der Datenquelle. Es speichert den Eigenschaftswert jedes Elements.
Eigenschaft | Typ | Beschreibung |
---|---|---|
values | map<string, GenericType> | Enthält den Schlüssel und die Werte der Eigenschaften des Elements. Der Schlüssel ist der Eigenschaftsname, und der Wert ist der Eigenschaftswert. Dateiinhalte verfügen beispielsweise über Eigenschaften wie title, modifiedDate usw. Die Eigenschaftenschlüssel sind die Eigenschaften selbst, und ihre Werte sind der Titel der Datei bzw. des Änderungsdatums der Datei. |
Elemente der ContentType-Enumeration
Enumerationsmember des Inhaltstyps.
Element | Wert | Beschreibung |
---|---|---|
Keine | 0 | Standardwert. |
Text | 1 | Textinhaltstyp. |
HTML | 2 | HTML-Inhaltstyp. |
Inhalt
Der Wert der Inhaltseigenschaft des Elements, der zum Rendern von Suchergebnissen verwendet wird.
Eigenschaft | Typ | Beschreibung |
---|---|---|
contentType | ContentType | Typ des Inhalts. |
contentValue | string | Wert der Inhaltseigenschaft. |
CrawlCheckpoint
Identifiziert das Element, das zuletzt durchforstet wurde. Es wird von der Plattform gespeichert, und der Prüfpunkt aus dem letzten erfolgreichen Elementbatch wird für die Fortsetzung der Durchforstung verwendet, wenn es zu einem Fehler oder Absturz kommt. Die Plattform sendet den Prüfpunkt in der GetCrawlStream-API .
Eigenschaft | Typ | Beschreibung |
---|---|---|
Pagenumber | uint32 | Zeigt die Seitenzahl zum Markieren des Durchforstungsfortschritts an. |
Batchsize | uint32 | Enthält die Anzahl der elemente, die in jedem Batch zurückgegeben werden. Er hat einen konstanten Wert von 1, da jedes Element einzeln gestreamt wird. |
customMarkerData | Zeichenfolge | Benutzerdefinierte Daten, die erforderlich sind, um das letzte element zu identifizieren, das aus der Datenquelle durchforstet wurde. |
GenericType
Modell, das die von der Plattform unterstützten Wertetypen in bestimmten Feldern wie Quelleigenschaftswerten enthält. Es muss nur eines der folgenden Felder festgelegt werden.
Eigenschaft | Typ | Beschreibung |
---|---|---|
Stringvalue | string | Stellt einen Zeichenfolgenwert dar. |
intValue | int64 | Stellt einen int64 -Wert (long) dar. |
doubleValue | double | Stellt einen double-Wert dar. |
dateTimeValue | google.protobuf.Timestamp | Stellt einen dateTime-Wert dar. |
boolValue | bool | Stellt einen booleschen Wert dar. |
stingCollectionValue | StringCollectionType | Stellt eine Auflistung von Zeichenfolgen dar. |
intCollectionValue | IntCollectionType | Stellt eine Auflistung von int64 (long) dar. |
doubleCollectionValue | DoubleCollectionType | Stellt eine Auflistung von double dar. |
dateTimeCollectionValue | TimestampCollectionType | Stellt eine Auflistung von dateTime dar. |
StringCollectionType
Auflistung von Zeichenfolgen.
Eigenschaft | Typ | Beschreibung |
---|---|---|
values | Wiederholte Zeichenfolge | Auflistung oder Array von Zeichenfolgen. |
IntCollectionType
Auflistung ganzzahliger Werte.
Eigenschaft | Typ | Beschreibung |
---|---|---|
values | wiederholt int64 | Auflistung oder Array von int64-Werten (long). |
DoubleCollectionType
Auflistung von Double-Werten.
Eigenschaft | Typ | Beschreibung |
---|---|---|
values | Wiederholtes Double | Auflistung oder Array von Double-Werten. |
TimestampCollectionType
Auflistung von DateTime-Werten .
Eigenschaft | Typ | Beschreibung |
---|---|---|
values | wiederholt google.protobuf.Timestamp | Auflistung oder Array von dateTime-Werten . |