Uzupełnianie przechowywane w usłudze Azure OpenAI i destylowanie (wersja zapoznawcza)

Artykuł
01/22/2025

Zapisane uzupełnienia umożliwiają przechwytywanie historii konwersacji z sesji ukończenia czatu do użycia jako zestawy danych na potrzeby ocen i dostrajania.

Obsługa przechowywanych uzupełnień

Obsługa interfejsu API

2024-10-01-preview

Obsługa modelu

gpt-4o-2024-08-06

Dostępność w regionach

Szwecja Środkowa
Północno-środkowe stany USA
Wschodnie stany USA 2

Konfigurowanie przechowywanych uzupełnień

Aby włączyć przechowywane uzupełnienia dla wdrożenia usługi Azure OpenAI, ustaw store parametr na Truewartość . Użyj parametru metadata , aby wzbogacić przechowywany zestaw danych uzupełniania o dodatkowe informacje.

Python (Microsoft Entra ID)
Python (klucz interfejsu API)

import os
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-10-01-preview"
)

completion = client.chat.completions.create(
    
    model="gpt-4o", # replace with model deployment name
    store= True,
    metadata =  {
    "user": "admin",
    "category": "docs-test",
  },
    messages=[
    {"role": "system", "content": "Provide a clear and concise summary of the technical content, highlighting key concepts and their relationships. Focus on the main ideas and practical implications."},
    {"role": "user", "content": "Ensemble methods combine multiple machine learning models to create a more robust and accurate predictor. Common techniques include bagging (training models on random subsets of data), boosting (sequentially training models to correct previous errors), and stacking (using a meta-model to combine base model predictions). Random Forests, a popular bagging method, create multiple decision trees using random feature subsets. Gradient Boosting builds trees sequentially, with each tree focusing on correcting the errors of previous trees. These methods often achieve better performance than single models by reducing overfitting and variance while capturing different aspects of the data."}
    ]   
)

print(completion.choices[0].message)

Ważne

Jeśli używasz klucza interfejsu API, zapisz go bezpiecznie w innym miejscu, na przykład w usłudze Azure Key Vault. Nie dołączaj klucza interfejsu API bezpośrednio do kodu i nigdy nie publikuj go publicznie.

Aby uzyskać więcej informacji na temat zabezpieczeń usług sztucznej inteligencji, zobacz Uwierzytelnianie żądań w usługach Azure AI.

import os
from openai import AzureOpenAI
    
client = AzureOpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
    api_version="2024-10-01-preview",
    azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
    )

ompletion = client.chat.completions.create(
    
    model="gpt-4o", # replace with model deployment name
    store= True,
    metadata =  {
    "user": "admin",
    "category": "docs-test",
  },
    messages=[
    {"role": "system", "content": "Provide a clear and concise summary of the technical content, highlighting key concepts and their relationships. Focus on the main ideas and practical implications."},
    {"role": "user", "content": "Ensemble methods combine multiple machine learning models to create a more robust and accurate predictor. Common techniques include bagging (training models on random subsets of data), boosting (sequentially training models to correct previous errors), and stacking (using a meta-model to combine base model predictions). Random Forests, a popular bagging method, create multiple decision trees using random feature subsets. Gradient Boosting builds trees sequentially, with each tree focusing on correcting the errors of previous trees. These methods often achieve better performance than single models by reducing overfitting and variance while capturing different aspects of the data."}
    ]   
)

print(completion.choices[0].message)

Po włączeniu przechowywanych uzupełnień dla wdrożenia usługi Azure OpenAI rozpocznie się on w portalu usługi Azure AI Foundry w okienku Przechowywane uzupełnienia .

Destylacja

Destylacja umożliwia przekształcenie przechowywanych uzupełnień w zestaw danych dostrajania. Typowym przypadkiem użycia jest użycie przechowywanych uzupełnień z większym bardziej zaawansowanym modelem dla określonego zadania, a następnie użycie przechowywanych uzupełnień w celu wytrenowania mniejszego modelu na przykładach wysokiej jakości interakcji modelu.

Destylacja wymaga co najmniej 10 przechowywanych uzupełnień, chociaż zaleca się zapewnienie setek do tysięcy przechowywanych uzupełnień w celu uzyskania najlepszych wyników.

W okienku Przechowywane uzupełnienia w portalu usługi Azure AI Foundry użyj opcji Filtr , aby wybrać uzupełnienia, za pomocą których chcesz wytrenować model.
Aby rozpocząć destylację, wybierz pozycję Destyluj
Wybierz model, który chcesz dostosować do przechowywanego zestawu danych uzupełniania.
Sprawdź, która wersja modelu ma zostać dostrojona:
Plik .jsonl o losowo wygenerowanej nazwie zostanie utworzony jako zestaw danych szkoleniowych z przechowywanych uzupełnień. Wybierz plik >Dalej.

Uwaga

Nie można uzyskać bezpośredniego dostępu do przechowywanych plików trenowania destylowania uzupełniania i nie można ich wyeksportować zewnętrznie/pobrać.

Pozostałe kroki odpowiadają typowym krokom dostrajania interfejsu Azure OpenAI. Aby dowiedzieć się więcej, zobacz nasz przewodnik wprowadzający dostrajania.

Ocena

Ocena dużych modeli językowych jest krytycznym krokiem w mierzeniu ich wydajności w różnych zadaniach i wymiarach. Jest to szczególnie ważne w przypadku dostosowanych modeli, w których ocena zysków wydajności (lub strat) z trenowania ma kluczowe znaczenie. Dokładne oceny mogą pomóc w zrozumieniu, w jaki sposób różne wersje modelu mogą mieć wpływ na aplikację lub scenariusz.

Przechowywane uzupełnienia mogą służyć jako zestaw danych do uruchamiania ocen.

W okienku Przechowywane uzupełnienia w portalu usługi Azure AI Foundry użyj opcji Filtr , aby wybrać uzupełnienia, które mają być częścią zestawu danych oceny.
Aby skonfigurować ocenę, wybierz pozycję Oceń
Spowoduje to uruchomienie okienka Oceny ze wstępnie wypełnionym .jsonl plikiem z losowo wygenerowaną nazwą utworzoną jako zestaw danych oceny na podstawie przechowywanych uzupełnień.

Uwaga

Nie można uzyskać bezpośredniego dostępu do przechowywanych plików danych oceny ukończenia i nie można ich wyeksportować zewnętrznie/pobrać.

Aby dowiedzieć się więcej na temat oceny, zobacz Wprowadzenie do ocen

Rozwiązywanie problemów

Czy potrzebuję specjalnych uprawnień do korzystania z przechowywanych uzupełnień?

Dostęp do przechowywanych uzupełnień jest kontrolowany za pośrednictwem dwóch funkcji DataActions:

Microsoft.CognitiveServices/accounts/OpenAI/stored-completions/read
Microsoft.CognitiveServices/accounts/OpenAI/stored-completions/action

Domyślnie Cognitive Services OpenAI Contributor ma dostęp do obu tych uprawnień:

Jak mogę usunąć przechowywane dane?

Dane można usunąć, usuwając skojarzony zasób usługi Azure OpenAI. Jeśli chcesz usunąć tylko przechowywane dane ukończenia, musisz otworzyć sprawę z pomocą techniczną klienta.

Ile przechowywanych danych ukończenia można przechowywać?

Możesz przechowywać maksymalnie 10 GB danych.

Czy mogę zapobiec włączeniu przechowywanych uzupełnień w ramach subskrypcji?

Należy otworzyć zgłoszenie z pomocą techniczną klienta, aby wyłączyć przechowywane uzupełnienia na poziomie subskrypcji.

TypeError: Completions.create() otrzymał nieoczekiwany argument "store"

Ten błąd występuje, gdy korzystasz ze starszej wersji biblioteki klienta openAI, która poprzedza wydanie funkcji uzupełniania przechowywanych. Uruchom program pip install openai --upgrade.

Udostępnij za pośrednictwem