Introducción al orquestador de Microsoft 365 Copilot
Microsoft 365 Copilot es su asistente personal para trabajar. Ayuda con varias tareas generales, como escribir, resumir, investigar y mucho más. Copilot tiene diferentes aptitudes que se corresponden con estos diferentes tipos de tareas. Por ejemplo, Copilot puede resumir los elementos de acción de una reunión, sugerir modificaciones en un archivo o realizar un seguimiento de los recursos y expertos en un tema determinado dentro de su organización. Cada aptitud tiene sus propios parámetros y salidas que se adaptan a la tarea específica.
Al igual que cualquier copiloto, Microsoft 365 Copilot se entrena con datos en un momento dado. Para recuperar y procesar información nueva y en tiempo real, especialmente datos específicos de su organización y flujos de trabajo, los agentes requieren complementos. Los complementos dentro de un agente amplían las habilidades y la utilidad de Microsoft 365 Copilot para los usuarios finales, lo que le permite elegir la aptitud adecuada de su repertorio completo.
Pero, ¿cómo sabe el agente qué aptitud usar al pedir ayuda? ¿Cómo interpreta la solicitud y la compara con la mejor aptitud disponible? Ese es el trabajo del orquestador de Microsoft 365 Copilot.
En este artículo se explica la lógica detrás del proceso de selección de aptitudes de Copilot y cómo puede asegurarse de que Copilot usa el complemento adecuado de su agente en cada oportunidad para beneficiar a los usuarios.
Importante
- Actualmente, los complementos de API solo se admiten como acciones dentro de agentes declarativos. No se habilitan en Microsoft 365 Copilot. Para obtener un ejemplo que muestra cómo agregar un complemento de API a un agente declarativo, consulte Agregar un complemento.
- La funcionalidad está habilitada de forma predeterminada en todos los inquilinos con licencia de Microsoft 365 Copilot. Los administradores pueden deshabilitar esta funcionalidad en función del usuario y del grupo y controlar cómo se aprueban los complementos individuales para su uso y qué complementos están habilitados. Para obtener más información, consulte Administración de agentes en aplicaciones integradas.
Orquestador de Copilot
Entre la entrada de lenguaje natural del usuario y la salida del lenguaje natural de Copilot, el orquestador de Copilot funciona en segundo plano para seleccionar y ejecutar las aptitudes adecuadas desde los complementos adecuados para la tarea del usuario.
La capa de orquestación representa la interfaz entre los modelos de lenguaje grande (LLM) básicos y las muchas maneras de ampliar, enriquecer y personalizar Copilot para la forma en que funcionan los clientes.
En el diagrama siguiente se muestra cómo el orquestador de Microsoft 365 Copilot selecciona el complemento adecuado, con la aptitud adecuada, en el momento adecuado, incluso cuando hay varias opciones entre las que elegir.
Entrada de lenguaje natural: el usuario envía una consulta al agente, como "¿Qué vales se me asignan en este momento?"
Comprobaciones preliminares: Copilot realiza varias comprobaciones en la consulta, incluidas las comprobaciones de IA responsables y las medidas de seguridad para asegurarse de que no supone ningún riesgo. Si la consulta produce un error en cualquiera de estas comprobaciones, Copilot finaliza la interacción.
Razonamiento: el orquestador de Copilot formula un plan compuesto por varias acciones que realiza en un intento de responder al aviso del usuario.
Selección de contexto y herramientas: el orquestador recupera el contexto de conversación del usuario del almacén de contexto e integra datos de Microsoft Graph para refinar el contexto. A continuación, ajusta la consulta inicial en función de este contexto actualizado y la reenvía al LLM (modelo de lenguaje grande) para guiar los pasos siguientes.
El LLM podría continuar generando una respuesta mediante las capacidades integradas de Copilot, o podría determinar que son necesarios datos adicionales.
Si se necesita más información, el orquestador realiza una búsqueda de los complementos (herramientas) con la aptitud adecuada para la tarea desde los complementos habilitados del agente en función de las descripciones de los complementos y sus funciones.
Coincidencia de funciones y determinación de parámetros: el orquestador formula una nueva solicitud que incorpora la consulta inicial del usuario, el contexto actualizado y los complementos seleccionados, y lo presenta al LLM. LlM evalúa la entrada y especifica el complemento y la función óptimos dentro de ese complemento para abordar la tarea. A continuación, proporciona al orquestador los detalles de la función y los parámetros necesarios para recopilar la información necesaria.
Inicio de la herramienta: el orquestador usa la respuesta del LLM para construir una solicitud de API y enviar la solicitud al iniciador de la herramienta, que recupera de forma segura la información solicitada situada fuera de la infraestructura de Copilot. Ejecuta la solicitud y envía los resultados al orquestador para su posterior procesamiento.
Análisis de resultados y formulación de respuesta: el orquestador integra la respuesta de la API en el contexto en curso y consulta el LLM en un bucle de razonamiento continuo hasta que el LLM lo considere adecuado para generar una respuesta final.
Responder: el orquestador compila toda la información recopilada durante el proceso de razonamiento y la envía al LLM para crear una respuesta final. Después de asegurarse de que la respuesta cumple con las directrices de IA responsable, envía la respuesta al orquestador, que la registra en el almacén de contexto y la entrega al usuario a través de la interfaz de usuario de Copilot.
Salida del lenguaje natural: por último, el orquestador entrega la respuesta al usuario y actualiza el estado de la conversación. Copilot está listo para su siguiente aviso.
Cómo el orquestador de Copilot coincide con los complementos con las consultas de usuario
Cuando un usuario envía una consulta al agente, el orquestador busca el catálogo completo de aptitudes (funciones) del agente desde los complementos instalados para identificar hasta cinco aptitudes que coincidan mejor con la consulta. El orquestador primero intenta buscar coincidencias en palabras exactas (coincidencia léxica) y expande su ámbito de búsqueda según sea necesario para incluir coincidencias en significados descriptivos (coincidencia semántica), trabajando desde nombres de función específicos hasta descripciones generales del complemento, hasta que se rellenan las cinco ranuras candidatas a funciones. En concreto, en la lista siguiente se muestra la jerarquía de mecanismos de coincidencia para la selección de funciones del complemento Copilot:
- Coincidencia léxica en el nombre de la función.
- Coincidencia semántica en la descripción de la función.
- Coincidencia léxica en el nombre del complemento (agrega todas las funciones del complemento a la lista de candidatos).
- Coincidencia semántica en el nombre del complemento (agrega todas las funciones del complemento a la lista de candidatos).
El orquestador funciona a través de esta lista hasta que se rellenan las cinco ranuras candidatas a funciones.
Consulte Directrices de validación para los agentes para obtener más información sobre cómo escribir buenas descripciones para asegurarse de que Copilot elige la aptitud adecuada para cada consulta de usuario al agente.