Conectores de Microsoft Graph de PostgreSQL (versión preliminar)
El conector de Microsoft Graph de PostgreSQL permite a su organización indexar registros de una base de datos postgreSQL. Después de configurar el conector, los usuarios finales pueden buscar estos registros desde PostgreSQL en Microsoft Copilot y desde cualquier cliente de Microsoft Search.
Este artículo está destinado a administradores de Microsoft 365 o a cualquier persona que configure, ejecute y supervise un conector de PostgreSQL Graph.
Nota:
El conector de PostgreSQL está en versión preliminar. Si desea obtener acceso para probarlo, debe habilitar el anillo de versión dirigida para su cuenta de Administración.
Capacidades
- Indexe los registros de la base de datos de PostgreSQL mediante una consulta SQL.
- Especifique permisos de acceso para cada registro con la lista de usuarios o grupos agregados en la consulta SQL.
- Permitir que los usuarios finales hagan preguntas relacionadas con los registros indexados en Copilot.
- Use la búsqueda semántica en Copilot para permitir a los usuarios encontrar contenido relevante basado en palabras clave, preferencias personales y conexiones sociales.
Limitaciones
- Versiones admitidas de PostgreSQL: el conector admite postgreSQL versión 14 o posterior.
- Para admitir una velocidad de rastreo alta y un mejor rendimiento, el conector se ha creado para admitir solo cargas de trabajo OLTP (procesamiento de transacciones en línea). Cargas de trabajo OLAP (procesamiento analítico en línea) que no ejecutan la consulta SQL proporcionada en un tiempo de espera de 40 segundos y no se admiten.
- Las ACL solo se admiten mediante un nombre principal de usuario (UPN), Microsoft Entra ID o seguridad de Active Directory.
- No se admite la indexación de contenido enriquecido dentro de columnas de base de datos. Algunos ejemplos de este contenido son HTML, JSON, XML, blobs y análisis de documentos que existen como vínculos dentro de las columnas de base de datos.
Requisitos previos
- Debe ser el administrador de búsqueda del inquilino de Microsoft 365 de su organización.
- Instalación del agente del conector de Microsoft Graph: para acceder al servidor de PostgreSQL, debe instalar y configurar el agente del conector. Consulte Instalación del agente del conector de Microsoft Graph para obtener más información.
- Dirección del servidor de PostgreSQL: para conectarse a los datos de PostgreSQL, necesita la dirección del servidor postgreSQL de su organización.
- Cuenta de servicio: para conectarse al servidor postgreSQL y permitir que Microsoft Graph Connector actualice registros con regularidad, necesita una cuenta de servicio con permisos de lectura concedidos a la cuenta de servicio.
Introducción al programa de instalación
1. Nombre para mostrar
Se usa un nombre para mostrar para identificar cada cita en Copilot, lo que ayuda a los usuarios a reconocer fácilmente el archivo o elemento asociado. El nombre para mostrar también significa contenido de confianza. El nombre para mostrar también se usa como filtro de origen de contenido. Hay un valor predeterminado para este campo, pero puede personalizarlo para un nombre que los usuarios de su organización reconozcan.
2. Servidor postgreSQL
Para conectarse a los datos de PostgreSQL, necesita la dirección del servidor de PostgreSQL, el puerto y el nombre de la base de datos.
3. Tipo de autenticación
El conector de PostgreSQL solo admite la autenticación basada en contraseñas para conectarse a la base de datos.
4. Lanzamiento a audiencia limitada
Implemente esta conexión en una base de usuarios limitada si desea validarla en Copilot y en otras superficies de búsqueda antes de expandir el lanzamiento a un público más amplio. Para más información sobre el lanzamiento limitado, haga clic aquí.
Contenido
Para buscar en el contenido de la base de datos, debe especificar consultas SQL al configurar el conector. Estas consultas SQL deben asignar un nombre a todas las columnas de base de datos que desea indexar (propiedades de origen). Esto incluye las combinaciones de SQL que se deben realizar para obtener todas las columnas. Para restringir el acceso a los resultados de búsqueda, debe especificar Access Control Listas (ACL) dentro de las consultas SQL al configurar el conector.
1. Rastreo completo (obligatorio)
a.
Seleccionar columnas de datos (obligatorio) y acl (opcional)
[Haga clic para expandir] Selección de columnas de datos para la consulta de rastreo completa.
En este paso, configurará la consulta SQL que ejecuta un rastreo completo de la base de datos. El rastreo completo selecciona todas las columnas o propiedades que deben presentarse en Microsoft Copilot o buscar. También puede especificar columnas de ACL para restringir el acceso de los resultados de búsqueda a usuarios o grupos específicos.
Sugerencia
Para obtener todas las columnas que necesita, puede combinar varias tablas.
En el ejemplo se muestra una selección de cinco columnas de datos que contienen los datos de la búsqueda: OrderId, OrderTitle, OrderDesc, CreatedDateTime e IsDeleted. Para establecer permisos de vista para cada fila de datos, opcionalmente puede seleccionar estas columnas de ACL: AllowedUsers, AllowedGroups, DeniedUsers y DeniedGroups. Todas estas columnas de datos también tienen las opciones Consulta, Búsqueda, Recuperar o Refinar.
Seleccione columnas de datos como se muestra en esta consulta de ejemplo: SELECT OrderId, OrderTitle, OrderDesc, AllowedUsers, AllowedGroups, DeniedUsers, DeniedGroups, CreatedDateTime, IsDeleted
Los conectores SQL no permiten nombres de columna con caracteres no alfanuméricos en la cláusula SELECT. Quite los caracteres no alfanuméricos de los nombres de columna mediante un alias. Ejemplo: SELECT column_name AS columnName
Para administrar el acceso a los resultados de búsqueda, puede especificar una o varias columnas de ACL en la consulta. El conector SQL permite controlar el acceso en cada nivel de registro. Puede elegir tener el mismo control de acceso para todos los registros de una tabla. Si la información de ACL se almacena en una tabla independiente, es posible que tenga que realizar una combinación con esas tablas en la consulta.
A continuación se describe el uso de cada una de las columnas de ACL de la consulta anterior. En la lista siguiente se explican los cuatro mecanismos de control de acceso.
- AllowedUsers: esta columna especifica la lista de identificadores de usuario que pueden acceder a los resultados de la búsqueda.
- AllowedGroups: esta columna especifica el grupo de usuarios que pueden acceder a los resultados de la búsqueda.
- DeniedUsers: esta columna especifica la lista de usuarios que no tienen acceso a los resultados de la búsqueda.
- DeniedGroups: esta columna especifica el grupo de usuarios que no tienen acceso a los resultados de la búsqueda.
b.
Tipos de datos admitidos
[Haga clic para expandir] Lista de tipos de datos admitidos.
En la tabla se resumen los tipos de datos SQL que se admiten en el conector de PostgreSQL. La tabla también resume el tipo de datos de indexación para el tipo de datos SQL admitido. Para más información sobre los tipos de datos admitidos por los conectores de Microsoft Graph para la indexación, consulte la documentación sobre los tipos de recursos de propiedad.
Categoría | Tipo de datos de origen | Tipo de datos de indexación |
---|---|---|
Numérico | smallint integer bigint smallserial serial bigserial |
int64 |
Numérico | decimal numérico real precisión doble |
double |
Carácter | character varying(n) varchar(n) character(n) char(n) bpchar(n) bpchar text |
string |
Monetario | dinero | int64 |
Binario | bytea | string |
Fecha u hora | timestamp [(p)] sin zona horaria timestamp [(p)] con zona horaria date time [(p)] sin zona horaria time [(p)] con zona horaria |
datetime |
Fecha u hora | interval [fields] [(p)] | string |
Booleano | booleano | booleano |
Enumerados | enumeración | string |
Para cualquier otro tipo de datos que no se admita directamente, la columna debe convertirse explícitamente a un tipo de datos admitido.
c.
Marca de agua (obligatorio)
[Haga clic para expandir] Especificación de la columna de marca de agua en la consulta de rastreo completa
Para evitar sobrecargar la base de datos, el conector procesa por lotes y reanuda las consultas de rastreo completo con una columna de marca de agua de rastreo completo. Mediante el uso del valor de la columna de marca de agua, se captura cada lote posterior y se reanuda la consulta desde el último punto de comprobación. Básicamente, este mecanismo controla la actualización de datos para rastreos completos.
Cree fragmentos de código de consulta para marcas de agua como se muestra en estos ejemplos:
-
WHERE (CreatedDateTime > @watermark)
. Cite el nombre de la columna de marca de agua con la palabra clave@watermark
reservada . Si el criterio de ordenación de la columna de marca de agua es ascendente, use>
; en caso contrario, use<
. -
ORDER BY CreatedDateTime ASC
. Ordene la columna de marca de agua en orden ascendente o descendente.
Para capturar el primer lote de filas, especifique el tipo de datos de la columna de marca de agua.
La primera consulta captura el primer número N de filas mediante: "CreatedDateTime > 1 de enero de 1753 00:00:00" (valor mínimo del tipo de datos DateTime). Después de capturar el primer lote, el valor más alto de CreatedDateTime
devuelto en el lote se guarda como punto de control si las filas se ordenan en orden ascendente. Un ejemplo es el 1 de marzo de 2019 03:00:00. A continuación, el siguiente lote de N filas se captura mediante "CreatedDateTime > 1 de marzo de 2019 03:00:00" en la consulta.
2. Instrucciones de eliminación temporal (opcional)
Para excluir que las filas eliminadas temporalmente en la base de datos no se indexe, especifique el nombre y el valor de la columna de eliminación temporal que indica que se ha eliminado la fila.
Usuarios
1. Asignar columnas que contengan información de permisos de acceso
Seleccione Asignar columnas para elegir las distintas columnas de control de acceso (ACL) que especifican el mecanismo de control de acceso. Seleccione el nombre de columna que especificó en la consulta SQL de rastreo completo.
Se espera que cada una de las columnas de ACL sea una columna con varios valores. Los separadores, como punto y coma (;), coma (,), etc., pueden separar estos valores de varios identificadores. Debe especificar este separador en el campo separador de valores .
Los siguientes tipos de identificador se admiten para usar como ACL:
-
Nombre principal de usuario (UPN): un nombre principal de usuario (UPN) es el nombre de un usuario del sistema en formato de dirección de correo electrónico. Un UPN (por ejemplo:
john.doe@domain.com
) consta del nombre de usuario (nombre de inicio de sesión), separador (símbolo @) y nombre de dominio (sufijo UPN). - Microsoft Entra ID: en Microsoft Entra ID, cada usuario o grupo tiene un identificador de objeto que tiene un aspecto similar a "e0d3ad3d-0000-1111-2222-3c5f5c52ab9b".
- Identificador de seguridad de Active Directory (AD): en una configuración de AD local, todos los usuarios y grupos tienen un identificador de seguridad único e inmutable que tiene un aspecto similar al de "S-1-5-21-3878594291-2115959936-132693609-65242".
2. Permisos de acceso
Puede optar por usar las ACL especificadas en el paso anterior o puede invalidarlas para que el contenido sea visible para todos.
Sincronizar
El intervalo de actualización determina la frecuencia con la que se sincronizan los datos entre el origen de datos y el índice del conector de Graph.
Puede configurar rastreos completos e incrementales en función de las opciones de programación presentes aquí. De forma predeterminada, el rastreo incremental (si está configurado) se establece para cada 15 minutos y el rastreo completo se establece para cada día. Si es necesario, puede ajustar estas programaciones para que se ajusten a sus necesidades de actualización de datos.
En este momento, está listo para crear la conexión para PostgreSQL. Puede hacer clic en el botón "Crear" para publicar los datos de conexión e índice de la base de datos.
Solución de problemas
Después de publicar la conexión, puede revisar el estado en la pestaña Orígenes de datos del centro de administración. Para obtener información sobre cómo realizar actualizaciones y eliminaciones, consulte Administración del conector.
Si tiene problemas o quiere proporcionar comentarios, póngase en contacto con Microsoft Graph | Soporte técnico.