Freigeben über


PostgreSQL Microsoft Graph-Connectors (Vorschau)

Mit dem PostgreSQL Microsoft Graph-Connector können Ihre organization Datensätze aus einer PostgreSQL-Datenbank indizieren. Nachdem Sie den Connector konfiguriert haben, können Endbenutzer nach diesen Datensätzen in PostgreSQL in Microsoft Copilot und über einen beliebigen Microsoft Search-Client suchen.

Dieser Artikel richtet sich an Microsoft 365-Administratoren oder alle Personen, die einen PostgreSQL Graph-Connector konfigurieren, ausführen und überwachen.

Hinweis

Der PostgreSQL-Connector befindet sich in der Vorschauphase. Wenn Sie Zugriff erhalten möchten, um es auszuprobieren, müssen Sie den Targeted Release Ring für Ihr Admin-Konto aktivieren.

Funktionen

  • Indizieren Sie Datensätze aus Ihrer PostgreSQL-Datenbank mithilfe einer SQL-Abfrage.
  • Geben Sie Zugriffsberechtigungen für jeden Datensatz mit einer Liste von Benutzern oder Gruppen an, die in der SQL-Abfrage hinzugefügt wurden.
  • Ermöglichen Sie es Ihren Endbenutzern, Fragen im Zusammenhang mit indizierten Datensätzen in Copilot zu stellen.
  • Verwenden Sie die semantische Suche in Copilot , um Es Benutzern zu ermöglichen, relevante Inhalte basierend auf Schlüsselwörtern, persönlichen Vorlieben und sozialen Verbindungen zu finden.

Begrenzungen

  • Unterstützte PostgreSQL-Versionen: Der Connector unterstützt PostgreSQL Version 14 oder höher.
  • Um eine hohe Durchforstungsgeschwindigkeit und eine bessere Leistung zu unterstützen, ist der Connector so konzipiert, dass nur OLTP-Workloads (OnlineTransaktionsverarbeitung) unterstützt werden. OLAP-Workloads (Online Analytical Processing), die die bereitgestellte SQL-Abfrage nicht in einem Timeout von 40 Sekunden ausführen und nicht unterstützt werden.
  • ACLs werden nur mithilfe eines Benutzerprinzipalnamens (User Principal Name, UPN), Microsoft Entra ID oder Active Directory-Sicherheit unterstützt.
  • Das Indizieren von umfangreichen Inhalten in Datenbankspalten wird nicht unterstützt. Beispiele für solche Inhalte sind HTML, JSON, XML, Blobs und Dokumentanalysen, die als Links in den Datenbankspalten vorhanden sind.

Voraussetzungen

  • Sie müssen der Suchadministrator für den Microsoft 365-Mandanten Ihres organization sein.
  • Installieren des Microsoft Graph-Connector-Agents: Für den Zugriff auf Ihren PostgreSQL-Server müssen Sie den Connector-Agent installieren und konfigurieren. Weitere Informationen finden Sie unter Installieren des Microsoft Graph-Connector-Agents .
  • PostgreSQL-Serveradresse: Um eine Verbindung mit Ihren PostgreSQL-Daten herzustellen, benötigen Sie die PostgreSQL-Serveradresse Ihres organization.
  • Dienstkonto: Um eine Verbindung mit dem PostgreSQL-Server herzustellen und microsoft Graph Connector das regelmäßige Aktualisieren von Datensätzen zu ermöglichen, benötigen Sie ein Dienstkonto mit Leseberechtigungen für das Dienstkonto.

Erste Schritte mit Setup

1. Anzeigename

Ein Anzeigename wird verwendet, um jedes Zitat in Copilot zu identifizieren, sodass Benutzer die zugeordnete Datei oder das zugehörige Element leicht erkennen können. Anzeigename steht auch für vertrauenswürdigen Inhalt. Der Anzeigename wird auch als Inhaltsquellenfilter verwendet. Für dieses Feld ist ein Standardwert vorhanden, aber Sie können es an einen Namen anpassen, den Benutzer in Ihrem organization erkennen.

2. PostgreSQL-Server

Um eine Verbindung mit Ihren PostgreSQL-Daten herzustellen, benötigen Sie die Adresse, den Port und den Datenbanknamen Ihres PostgreSQL-Servers.

3. Authentifizierungstyp

Der PostgreSQL-Connector unterstützt nur die kennwortbasierte Authentifizierung, um eine Verbindung mit der Datenbank herzustellen.

4. Rollout für eine begrenzte Zielgruppe

Stellen Sie diese Verbindung für eine eingeschränkte Benutzerbasis bereit, wenn Sie sie in Copilot und anderen Suchoberflächen überprüfen möchten, bevor Sie den Rollout für eine breitere Zielgruppe erweitern. Weitere Informationen zum eingeschränkten Rollout finden Sie hier.

Inhalt

Zum Durchsuchen des Datenbankinhalts müssen Sie sql-Abfragen angeben, wenn Sie den Connector konfigurieren. Diese SQL-Abfragen müssen alle Datenbankspalten benennen, die Sie indizieren möchten (Quelleigenschaften). Dies schließt alle SQL-Joins ein, die ausgeführt werden müssen, um alle Spalten abzurufen. Um den Zugriff auf Suchergebnisse einzuschränken, müssen Sie beim Konfigurieren des Connectors Access Control Listen (ACLs) in SQL-Abfragen angeben.

1. Vollständige Durchforstung (erforderlich)

a. Auswählen von Datenspalten (erforderlich) und ACL-Spalten (optional)

[Klicken Sie, um zu erweitern] Auswählen von Datenspalten für eine vollständige Durchforstungsabfrage.

In diesem Schritt konfigurieren Sie die SQL-Abfrage, die eine vollständige Durchforstung der Datenbank ausführt. Bei der vollständigen Durchforstung werden alle Spalten oder Eigenschaften ausgewählt, die in Microsoft Copilot oder Suche angezeigt werden müssen. Sie können auch ACL-Spalten angeben, um den Zugriff auf Suchergebnisse auf bestimmte Benutzer oder Gruppen einzuschränken.

Tipp

Um alle benötigten Spalten abzurufen, können Sie mehrere Tabellen verknüpfen.

Das Beispiel zeigt eine Auswahl von fünf Datenspalten, die die Daten für die Suche enthalten: OrderId, OrderTitle, OrderDesc, CreatedDateTime und IsDeleted. Zum Festlegen von Ansichtsberechtigungen für jede Datenzeile können Sie optional die folgenden ACL-Spalten auswählen: AllowedUsers, AllowedGroups, DeniedUsers und DeniedGroups. Alle diese Datenspalten verfügen auch über die Optionen Abfragen, Suchen, Abrufen oder Verfeinern.

Wählen Sie Datenspalten aus, wie in dieser Beispielabfrage gezeigt: SELECT OrderId, OrderTitle, OrderDesc, AllowedUsers, AllowedGroups, DeniedUsers, DeniedGroups, CreatedDateTime, IsDeleted

Die SQL-Connectors lassen keine Spaltennamen mit nicht alphanumerischen Zeichen in der SELECT-Klausel zu. Entfernen Sie alle nicht alphanumerischen Zeichen aus Spaltennamen mithilfe eines Alias. Beispiel: SELECT column_name AS columnName

Um den Zugriff auf die Suchergebnisse zu verwalten, können Sie eine oder mehrere ACL-Spalten in der Abfrage angeben. Mit dem SQL-Connector können Sie den Zugriff auf Datensatzebene steuern. Sie können die gleiche Zugriffssteuerung für alle Datensätze in einer Tabelle verwenden. Wenn die ACL-Informationen in einer separaten Tabelle gespeichert sind, müssen Sie möglicherweise eine Verknüpfung mit diesen Tabellen in Ihrer Abfrage durchführen.

Die Verwendung der einzelnen ACL-Spalten in der obigen Abfrage wird unten beschrieben. In der folgenden Liste werden die vier Zugriffssteuerungsmechanismen erläutert.

  • AllowedUsers: Diese Spalte gibt die Liste der Benutzer-IDs an, die auf die Suchergebnisse zugreifen können.
  • AllowedGroups: Diese Spalte gibt die Gruppe von Benutzern an, die auf die Suchergebnisse zugreifen können.
  • DeniedUsers: Diese Spalte gibt die Liste der Benutzer an, die keinen Zugriff auf die Suchergebnisse haben.
  • DeniedGroups: Diese Spalte gibt die Gruppe von Benutzern an, die keinen Zugriff auf die Suchergebnisse haben.

b. Unterstützte Datentypen

[Klicken Sie, um zu erweitern] Liste der unterstützten Datentypen.

In der Tabelle sind die SQL-Datentypen zusammengefasst, die im PostgreSQL-Connector unterstützt werden. Die Tabelle fasst auch den Indizierungsdatentyp für den unterstützten SQL-Datentyp zusammen. Weitere Informationen zu von Microsoft Graph-Connectors unterstützten Datentypen für die Indizierung finden Sie in der Dokumentation zu Eigenschaftenressourcentypen.

Kategorie Quelldatentyp Indizierungsdatentyp
Numeric smallint
ganze Zahl
bigint
smallserial
seriell
bigserial
int64
Numeric dezimal
numerisch
real
doppelte Genauigkeit
double
Zeichen character varying(n)
varchar(n)
character(n)
char(n)
bpchar(n)
bpchar
text
string
Geld Geld int64
Binär bytea string
Datum oder Uhrzeit Zeitstempel [(p)] ohne Zeitzone
Zeitstempel [(p)] mit Zeitzone
date
Time [(p)] ohne Zeitzone
Time [(p)] mit Zeitzone
Datum/Uhrzeit
Datum oder Uhrzeit interval [Felder] [(p)] string
Boolescher Wert Boolescher Wert Boolescher Wert
Aufgezählt enum string

Für jeden anderen Datentyp, der derzeit nicht direkt unterstützt wird, muss die Spalte explizit in einen unterstützten Datentyp umgewandelt werden.


c. Wasserzeichen (erforderlich)

[Klicken Sie, um zu erweitern] Angeben der Wasserzeichenspalte in einer vollständigen Durchforstungsabfrage

Um eine Überlastung der Datenbank zu verhindern, setzt der Connector Vollständige Durchforstungsabfragen in Batches mit einer Vollständigen Durchforstungswasserzeichenspalte fort. Mithilfe des Werts der Wasserzeichenspalte wird jeder nachfolgende Batch abgerufen, und die Abfrage wird ab dem letzten Prüfpunkt fortgesetzt. Im Wesentlichen steuert dieser Mechanismus die Datenaktualisierung für vollständige Durchforstungen.

Erstellen Sie Abfrageausschnitte für Wasserzeichen, wie in diesen Beispielen gezeigt:

  • WHERE (CreatedDateTime > @watermark). Zitieren Sie den Namen der Wasserzeichenspalte mit dem reservierten Schlüsselwort (keyword) @watermark. Wenn die Sortierreihenfolge der Wasserzeichenspalte aufsteigend ist, verwenden Sie >; andernfalls verwenden Sie <.
  • ORDER BY CreatedDateTime ASC. Sortieren Sie die Wasserzeichenspalte in aufsteigender oder absteigender Reihenfolge.

Um den ersten Batch von Zeilen abzurufen, geben Sie den Datentyp der Wasserzeichenspalte an.

Die erste Abfrage ruft die erste N Zeilenanzahl mit ab: "CreatedDateTime > 1. January 1753 00:00:00" (Mindestwert des DateTime-Datentyps). Nachdem der erste Batch abgerufen wurde, wird der höchste im Batch zurückgegebene Wert CreatedDateTime als Prüfpunkt gespeichert, wenn die Zeilen in aufsteigender Reihenfolge sortiert werden. Ein Beispiel ist der 1. März 2019 um 03:00:00 Uhr. Anschließend wird der nächste Batch von N Zeilen mithilfe von "CreatedDateTime > 1. März 2019 03:00:00" in der Abfrage abgerufen.


2. Anweisungen zum vorläufigen Löschen (optional)

Um vorläufig gelöschte Zeilen in Ihrer Datenbank von der Indizierungen auszuschließen, geben Sie den Spaltennamen und den Wert für vorläufiges Löschen an, der angibt, dass die Zeile gelöscht wurde.

Benutzer

1. Zuordnungsspalten mit Informationen zu Zugriffsberechtigungen

Wählen Sie Spalten zuordnen aus, um die verschiedenen Zugriffssteuerungsspalten (ACL) auszuwählen, die den Zugriffssteuerungsmechanismus angeben. Wählen Sie den Spaltennamen aus, den Sie in der vollständigen SQL-Durchforstungsabfrage angegeben haben.

Es wird erwartet, dass jede der ACL-Spalten eine mehrwertige Spalte ist. Trennzeichen wie Semikolon (;), Komma (,) usw. können diese mehrfachen ID-Werte trennen. Sie müssen dieses Trennzeichen im Werttrennzeichenfeld angeben.

Die folgenden ID-Typen werden für die Verwendung als ACLs unterstützt:

  • Benutzerprinzipalname (UPN): Ein Benutzerprinzipalname (USER Principal Name, UPN) ist der Name eines Systembenutzers im E-Mail-Adressformat. Ein UPN (z. B. john.doe@domain.com) besteht aus dem Benutzernamen (Anmeldename), dem Trennzeichen (dem @-Symbol) und dem Domänennamen (UPN-Suffix).
  • Microsoft Entra ID: In Microsoft Entra ID verfügt jeder Benutzer oder jede Gruppe über eine Objekt-ID wie "e0d3ad3d-0000-1111-2222-3c5f5c52ab9b".
  • Active Directory-Sicherheits-ID (AD): In einem lokalen AD-Setup verfügt jeder Benutzer und jede Gruppe über eine unveränderliche, eindeutige Sicherheits-ID, die in etwa wie "S-1-5-21-3878594291-2115959936-132693609-65242" aussieht.

2. Zugriffsberechtigungen

Sie können die im vorherigen Schritt angegebenen ACLs verwenden oder sie überschreiben, um Ihre Inhalte für alle sichtbar zu machen.

Synchronisieren

Das Aktualisierungsintervall bestimmt, wie oft Ihre Daten zwischen der Datenquelle und dem Graph-Connectorindex synchronisiert werden.

Sie können vollständige und inkrementelle Durchforstungen basierend auf den hier aufgeführten Planungsoptionen konfigurieren. Standardmäßig ist die inkrementelle Durchforstung (sofern konfiguriert) für alle 15 Minuten und die vollständige Durchforstung für jeden Tag festgelegt. Bei Bedarf können Sie diese Zeitpläne an Ihre Datenaktualisierungsanforderungen anpassen.

An diesem Punkt können Sie die Verbindung für PostgreSQL erstellen. Sie können auf die Schaltfläche "Erstellen" klicken, um Ihre Verbindung zu veröffentlichen und Daten aus Ihrer Datenbank zu indizieren.

Problembehandlung

Nachdem Sie Ihre Verbindung veröffentlicht haben, können Sie die status auf der Registerkarte Datenquellen im Admin Center überprüfen. Informationen zum Durchführen von Updates und Löschungen finden Sie unter Verwalten ihres Connectors.

Wenn Sie Probleme haben oder Feedback geben möchten, wenden Sie sich an Microsoft Graph | Unterstützung.