Comprendre le cycle de vie du développement d’une application de grand modèle de langage (LLM)

Effectué

Avant de comprendre comment utiliser le flux d’invite, examinons le cycle de vie de développement d’une application de modèle de langage volumineux (LLM).

Le cycle de vie se compose des phases suivantes :

Diagram of the four stages of the development lifecycle.

  1. Initialisation : Définissez le cas d’usage et concevez la solution.
  2. Expérimentation : Développez un flux et testez-le avec un petit jeu de données.
  3. Évaluation et affinement : Évaluez le flux avec un jeu de données plus volumineux.
  4. Production : Déployez et surveillez le flux et l’application.

Pendant l’évaluation et l’affinement, ainsi que pendant la production, vous pourriez constater que votre solution doit être améliorée. Vous pouvez revenir à l’expérimentation pendant laquelle vous développez votre flux en continu, jusqu’à ce que vous soyez satisfait des résultats.

Examinons chacune de ces phases plus en détail.

Initialisation

Imaginez que vous souhaitiez concevoir et développer une application LLM pour classifier des articles d’actualité. Avant de commencer à créer quoi que ce soit, vous devez définir les catégories que vous souhaitez comme sortie. Vous devez comprendre à quoi ressemble un article d’actualité classique, comment vous présentez l’article en tant qu’entrée dans votre application et comment l’application génère la sortie souhaitée.

En d’autres termes, lors de l’initialisation, vous :

Diagram of the four steps during initialization.

  1. Définissez l’objectif
  2. Collectez un exemple de jeu de données
  3. Générez une invite de base
  4. Concevez le flux

Pour concevoir, développer et tester une application LLM, vous avez besoin d’un exemple de jeu de données qui sert d’entrée. Un exemple de jeu de données est un petit sous-ensemble représentatif des données que vous prévoyez d’analyser en tant qu’entrée de votre application LLM.

Lors de la collecte ou de la création de l’exemple de jeu de données, vous devez garantir la diversité des données pour couvrir différents scénarios et cas de périphérie. Vous devez également supprimer toutes les informations sensibles à la confidentialité du jeu de données afin d’éviter toute vulnérabilité.

Expérimentation

Vous avez collecté un exemple de jeu de données d’articles d’actualité et choisi les catégories dans lesquelles vous souhaitez classer les articles. Vous avez conçu un flux qui prend un article d’actualité en tant qu’entrée et utilise un LLM pour classifier l’article. Pour tester si votre flux génère la sortie attendue, vous l’exécutez sur votre exemple de jeu de données.

Diagram of the four steps during experimentation.

La phase d’expérimentation est un processus itératif pendant lequel vous (1) exécutez le flux sur un exemple de jeu de données. Vous évaluez ensuite (2) les niveaux de performance de l’invite. Si vous êtes (3) satisfait du résultat, vous pouvez passer à l’évaluation et à l’affinement. Si vous pensez qu’il existe une possibilité d’amélioration, vous pouvez (4) modifier le flux en modifiant l’invite ou le flux lui-même.

Évaluation et affinement

Lorsque vous êtes satisfait de la sortie du flux qui classifie les articles d’actualité, en fonction de l’exemple de jeu de données, vous pouvez évaluer les performances du flux sur un jeu de données plus volumineux.

En testant le flux sur un jeu de données plus volumineux, vous pouvez évaluer le niveau de généralisation de l’application LLM sur de nouvelles données. Pendant l’évaluation, vous pouvez identifier les goulots d’étranglement potentiels ou les zones d’optimisation ou d’affinement.

Lorsque vous modifiez votre flux, vous devez d’abord l’exécuter sur un jeu de données plus petit avant de l’exécuter à nouveau sur un jeu de données plus volumineux. Tester votre flux avec un jeu de données plus petit vous permet de réagir plus rapidement en cas de problème.

Une fois que votre application LLM semble être robuste et fiable dans la gestion de différents scénarios, vous pouvez décider de mettre l’application LLM en production.

Production

Enfin, votre application de classification d’articles d’actualité est prête pour la production.

Diagram of the three steps during production.

Pendant la production, vous :

  1. Optimisez le flux qui classifie les articles entrants pour l’efficacité et l’efficacité.
  2. Déployez votre flux sur un point de terminaison. Lorsque vous appelez le point de terminaison, l’exécution du flux est déclenchée et la sortie souhaitée est générée.
  3. Surveillez les performances de votre solution en collectant les données d’utilisation et les commentaires des utilisateurs finaux. En comprenant comment l’application fonctionne, vous pouvez améliorer le flux chaque fois que nécessaire.

Explorez le cycle de vie complet du développement

Maintenant que vous comprenez chaque étape du cycle de vie de développement d’une application LLM, vous pouvez explorer la vue d’ensemble complète :

Diagram of all stages including their steps of the development lifecycle.