Partage via


Saisies semi-automatiques stockées et distillation dans Azure OpenAI (préversion)

Les saisies semi-automatiques stockées vous permettent de capturer l’historique des conversations à partir des sessions de saisie semi-automatique de conversations pour les utiliser comme jeux de données pour les évaluations et l’ajustement.

Prise en charge des saisies semi-automatiques stockées

Prise en charge des API

Prise en charge ajoutée pour la première fois dans 2024-10-01-preview

Type de déploiement

Seuls les déploiements de modèle Standard prennent actuellement en charge les completions stockées.

Modèle et disponibilité dans les régions

Région o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-08-06 gpt-4o, 2024-05-13 gpt-4o-mini, 2024-07-18
Suède Centre
Centre-Nord des États-Unis - - - -
USA Est 2 - - - -

Configurer les saisies semi-automatiques stockées

Pour activer les saisies semi-automatiques stockées pour votre déploiement Azure OpenAI, définissez le paramètre store sur True. Utilisez le paramètre metadata pour enrichir votre jeu de données de saisie semi-automatique stockée avec des informations supplémentaires.

import os
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-10-01-preview"
)

completion = client.chat.completions.create(
    
    model="gpt-4o", # replace with model deployment name
    store= True,
    metadata =  {
    "user": "admin",
    "category": "docs-test",
  },
    messages=[
    {"role": "system", "content": "Provide a clear and concise summary of the technical content, highlighting key concepts and their relationships. Focus on the main ideas and practical implications."},
    {"role": "user", "content": "Ensemble methods combine multiple machine learning models to create a more robust and accurate predictor. Common techniques include bagging (training models on random subsets of data), boosting (sequentially training models to correct previous errors), and stacking (using a meta-model to combine base model predictions). Random Forests, a popular bagging method, create multiple decision trees using random feature subsets. Gradient Boosting builds trees sequentially, with each tree focusing on correcting the errors of previous trees. These methods often achieve better performance than single models by reducing overfitting and variance while capturing different aspects of the data."}
    ]   
)

print(completion.choices[0].message)


Une fois les saisies semi-automatiques stockées activées pour un déploiement Azure OpenAI, elles commencent à apparaître dans le portail Azure AI Foundry dans le volet Saisies semi-automatiques stockées.

Capture d’écran de l’expérience utilisateur de saisies semi-automatiques stockées.

Distillation

La distillation vous permet de transformer vos saisies semi-automatiques stockées en un jeu de données précis. Un cas d’usage courant consiste à utiliser des saisies semi-automatiques stockées avec un modèle plus puissant pour une tâche particulière, puis à utiliser les saisies semi-automatiques stockées pour former un modèle plus petit sur des exemples d’interactions de modèle de haute qualité.

La distillation nécessite un minimum de 10 saisies semi-automatiques stockées, mais il est recommandé de fournir des centaines à des milliers de saisies semi-automatiques stockées pour obtenir de meilleurs résultats.

  1. Dans le volet Saisies semi-automatiques stockées dans le portail Azure AI Foundry utilisez les options de filtre pour sélectionner les saisies semi-automatiques avec lesquelles vous souhaitez former votre modèle.

  2. Pour commencer la distillation, sélectionnez Distiller

    Capture d’écran de l’expérience utilisateur de saisie semi-automatique stockée avec Distiller mis en surbrillance.

  3. Choisissez le modèle que vous souhaitez affiner avec votre jeu de données de saisies semi-automatiques stockées.

    Capture d’écran de la sélection du modèle de distillation de saisies semi-automatiques stockées.

  4. Vérifiez la version du modèle que vous souhaitez affiner :

    Capture d’écran de la version de distillation de saisies semi-automatiques stockées.

  5. Un fichier .jsonl avec un nom généré de manière aléatoire sera créé en tant que jeu de données de formation à partir de vos saisies semi-automatiques stockées. Sélectionnez le fichier >Suivant.

    Remarque

    Il est impossible d’accéder directement aux fichiers de formation de la distillation de saisies semi-automatiques stockées et ces fichiers ne peuvent pas être exportés en externe ou téléchargés.

    Capture d’écran du fichier jsonl du jeu de données d’apprentissage de saisie semi-automatique stockée.

Le reste des étapes correspond aux étapes standard d’optimisation d’Azure OpenAI. Pour en savoir plus, consultez notre guide de prise en main de l’optimisation.

Évaluation

L’évaluation des grands modèles de langage est une étape essentielle pour mesurer leurs performances sur différentes tâches et dimensions. Cela est particulièrement important pour les modèles affinés, où l’évaluation des gains de performance (ou pertes) de l’entraînement est cruciale. Des évaluations approfondies peuvent vous aider à comprendre comment différentes versions du modèle peuvent avoir un impact sur votre application ou votre scénario.

Les saisies semi-automatiques stockées peuvent être utilisées comme jeu de données pour l’exécution d’évaluations.

  1. Dans le volet Saisies semi-automatiques stockées dans le portail Azure AI Foundry utilisez les options de filtre pour sélectionner les saisies semi-automatiques que vous souhaitez intégrer à votre jeu de données.

  2. Pour configurer l’évaluation, sélectionnez Évaluer

    Capture d’écran du volet Saisies semi-automatiques stockées avec Évaluer sélectionné.

  3. Cette opération lance le volet Évaluations avec un fichier .jsonl prérempli avec un nom généré de manière aléatoire qui est créé en tant que jeu de données d’évaluation à partir de vos saisies semi-automatiques stockées.

    Remarque

    Il est impossible d’accéder directement aux fichiers de données d’évaluation de saisies semi-automatiques stockées et ces fichiers ne peuvent pas être exportés en externe ou téléchargés.

    Capture d’écran du volet Évaluations.

Pour en savoir plus sur l’évaluation, consultez Bien démarrer avec les évaluations

Dépannage

Ai-je besoin d’autorisations spéciales pour utiliser les saisies semi-automatiques stockées ?

L’accès aux saisies semi-automatiques stockées est contrôlé via deux actions DataActions :

  • Microsoft.CognitiveServices/accounts/OpenAI/stored-completions/read
  • Microsoft.CognitiveServices/accounts/OpenAI/stored-completions/action

Par défaut, Cognitive Services OpenAI Contributor a accès à ces deux autorisations :

Capture d’écran des autorisations de saisie semi-automatique stockée.

Comment supprimer des données stockées ?

Les données peuvent être supprimées en supprimant la ressource Azure OpenAI associée. Si vous souhaitez supprimer uniquement les données de saisie semi-automatique stockée, vous devez ouvrir un ticket auprès du support client.

Combien de données de puis-je stocker ?

Vous pouvez stocker un maximum de 10 Go de données.

Puis-je empêcher l’activation de la saisie semi-automatique stockée sur un abonnement ?

Vous devez ouvrir un ticket auprès du support client pour désactiver les saisies semi-automatiques stockées au niveau de l’abonnement.

TypeError : Completions.create() a obtenu un argument inattendu « store » (stocker)

Cette erreur se produit lorsque vous exécutez une version antérieure de la bibliothèque cliente OpenAI qui précède la fonctionnalité de saisie semi-automatique stockée en cours de publication. Exécutez pip install openai --upgrade.