Partager via


Vue d’ensemble de l’architecture de l’agent (expérimental)

Avertissement

L’infrastructure de l’agent de noyau sémantique est expérimentale, toujours en cours de développement et est susceptible de changer.

Cet article aborde les concepts clés de l’architecture de l’Infrastructure de l’agent, notamment les principes fondamentaux, les objectifs de conception et les objectifs stratégiques.

Objectifs

Le Framework de l’agent a été développé avec les priorités clés suivantes à l’esprit :

  • L’infrastructure de noyau sémantique sert de base pour l’implémentation des fonctionnalités de l’agent.
  • Plusieurs agents peuvent collaborer au sein d’une conversation unique, tout en intégrant des entrées humaines.
  • Un agent peut participer et gérer plusieurs conversations simultanées simultanément.
  • Différents types d’agents peuvent participer à la même conversation, chacun contribuant à ses fonctionnalités uniques.

Agent

La classe Agent abstraite sert d’abstraction principale pour tous les types d’agents, fournissant une structure fondamentale qui peut être étendue pour créer des agents plus spécialisés. Une sous-classe clé est l’Agent de noyau, qui établit une association directe avec un objet Kernel. Cette relation constitue la base d’implémentations d’agents plus spécifiques, telles que l’agent d’achèvement de conversation et l’agent d’assistant Open AI, qui tirent parti des fonctionnalités du noyau pour exécuter leurs fonctions respectives.

Les agents sont actuellement indisponibles en Java.

Les agents peuvent être appelés directement pour effectuer des tâches ou orchestrer dans une conversation d’agent, où plusieurs agents peuvent collaborer ou interagir dynamiquement avec les entrées utilisateur. Cette structure flexible permet aux agents de s’adapter à différents scénarios conversationnels ou pilotés par des tâches, fournissant aux développeurs des outils robustes pour créer des systèmes intelligents et multi-agents.

Deep Dive:

Conversation de l’agent

La classe Agent Chat sert de composant fondamental qui permet aux agents de n’importe quel type d’engager une conversation spécifique. Cette classe fournit les fonctionnalités essentielles de gestion des interactions entre agents dans un environnement de conversation. Pour ce faire, la classe Conversation de groupe d’agents étend ces fonctionnalités en offrant un conteneur basé sur des états, ce qui permet à plusieurs agents de collaborer entre de nombreuses interactions au sein de la même conversation.

Cette structure facilite les scénarios plus complexes et multi-agents où différents agents peuvent travailler ensemble, partager des informations et répondre dynamiquement aux conversations en constante évolution, ce qui en fait une solution idéale pour les cas d’usage avancés tels que le support client, la gestion des tâches à plusieurs facettes ou les environnements de résolution de problèmes collaboratifs.

Deep Dive:

Canal de l’agent

La classe Agent Channel permet aux agents de différents types de participer à une conversation d’agent. Cette fonctionnalité est complètement masquée des utilisateurs de l’Infrastructure de l’agent et doit uniquement être prise en compte par les développeurs qui créent un agent personnalisé.

Les agents sont actuellement indisponibles en Java.

Alignement de l’agent avec les fonctionnalités du noyau sémantique

Agent Framework repose sur les concepts fondamentaux et les fonctionnalités que de nombreux développeurs ont appris dans l’écosystème de noyau sémantique. Ces principes fondamentaux servent de blocs de construction pour la conception de l’Infrastructure de l’agent. En tirant parti de la structure et des fonctionnalités familières du noyau sémantique, Agent Framework étend ses fonctionnalités pour permettre des comportements d’agent plus avancés et autonomes, tout en conservant la cohérence avec l’architecture de noyau sémantique plus large. Cela garantit une transition fluide pour les développeurs, ce qui leur permet d’appliquer leurs connaissances existantes pour créer des agents intelligents et adaptables au sein de l’infrastructure.

Noyau

Au cœur de l’écosystème de noyau sémantique est le noyau, qui sert d’objet principal qui pilote les opérations et les interactions de l’IA. Pour créer un agent dans ce framework, une instance de noyau est requise, car elle fournit le contexte fondamental et les fonctionnalités de l’agent. Le noyau agit comme moteur pour le traitement des instructions, la gestion de l’état et l’appel des services IA nécessaires qui alimentent le comportement de l’agent.

Les articles de l’agent d’achèvement de conversation et de l’agent d’assistant Open AI fournissent des détails spécifiques sur la création de chaque type d’agent. Ces ressources offrent des instructions pas à pas et mettent en évidence les configurations clés nécessaires pour adapter les agents à différentes applications conversationnelles ou basées sur des tâches, montrant comment le noyau active des comportements d’agent dynamiques et intelligents dans différents cas d’usage.

Les agents sont actuellement indisponibles en Java.

Plug-ins et appel de fonction

Les plug-ins constituent un aspect fondamental du noyau sémantique, ce qui permet aux développeurs d’intégrer des fonctionnalités personnalisées et d’étendre les fonctionnalités d’une application IA. Ces plug-ins offrent un moyen flexible d’incorporer des fonctionnalités spécialisées ou une logique propre à l’entreprise dans les flux de travail IA de base. En outre, les fonctionnalités d’agent au sein de l’infrastructure peuvent être considérablement améliorées en utilisant les plug-ins et en tirant parti de l’appel de fonction. Cela permet aux agents d’interagir dynamiquement avec des services externes ou d’exécuter des tâches complexes, en développant davantage l’étendue et la polyvalence du système IA au sein de diverses applications.

Exemple :

Les agents sont actuellement indisponibles en Java.

Messages de l’agent

La messagerie de l’agent, y compris les entrées et les réponses, repose sur les principaux types de contenu du noyau sémantique, fournissant une structure unifiée pour la communication. Ce choix de conception simplifie le processus de transition des modèles d’achèvement de conversation traditionnels aux modèles pilotés par les agents plus avancés dans le développement de votre application. En tirant parti des types de contenu de noyau sémantique familiers, les développeurs peuvent intégrer en toute transparence les fonctionnalités de l’agent dans leurs applications sans avoir à réviser les systèmes existants. Cette rationalisation garantit que, à mesure que vous évoluez de l’IA conversationnelle de base vers des agents plus autonomes et orientés tâches, le framework sous-jacent reste cohérent, ce qui rend le développement plus rapide et plus efficace.

Remarque : l’agent De l’Assistant Open AI'_ a introduit des types de contenu spécifiques à son utilisation pour les références de fichiers et l’annotation de contenu :

Les agents sont actuellement indisponibles en Java.

Templating

Le rôle d’un agent est principalement mis en forme par les instructions qu’il reçoit, ce qui détermine son comportement et ses actions. À l’instar de l’appel d’une invite de noyau, les instructions d’un agent peuvent inclure des paramètres modèles( à la fois des valeurs et des fonctions) qui sont substitués dynamiquement pendant l’exécution. Cela permet des réponses flexibles et contextuelles, ce qui permet à l’agent d’ajuster sa sortie en fonction de l’entrée en temps réel.

En outre, un agent peut être configuré directement à l’aide d’une configuration de modèle d’invite, fournissant aux développeurs un moyen structuré et réutilisable de définir son comportement. Cette approche offre un outil puissant pour la normalisation et la personnalisation des instructions de l’agent, garantissant ainsi la cohérence entre différents cas d’usage tout en conservant l’adaptabilité dynamique.

Exemple :

Les agents sont actuellement indisponibles en Java.

Complétion de conversation

L’agent d’achèvement de conversation est conçu autour de n’importe quel service IA de noyau sémantique, offrant une encapsulation de persona flexible et pratique qui peut être intégrée en toute transparence à un large éventail d’applications. Cet agent permet aux développeurs d’apporter facilement des fonctionnalités d’IA conversationnelle dans leurs systèmes sans avoir à gérer les détails d’implémentation complexes. Il met en miroir les fonctionnalités et les modèles trouvés dans le service IA sous-jacent, ce qui garantit que toutes les fonctionnalités( telles que le traitement du langage naturel, la gestion des dialogues et la compréhension contextuelle) sont entièrement prises en charge dans l’Agent de saisie semi-automatique de conversation, ce qui en fait un outil puissant pour la création d’interfaces conversationnelles.

Les agents sont actuellement indisponibles en Java.