Uložené dokončování a destilování Azure OpenAI (Preview)

Článek
02/25/2025

Uložené dokončování umožňuje zachytit historii konverzací z relací dokončení chatu, aby se používaly jako datové sady pro vyhodnocení a vyladění.

Podpora uložených dokončování

Podpora rozhraní API

Podpora byla poprvé přidána do 2024-10-01-preview

Typ nasazení

Aktuálně podporují pouze Standard nasazení modelů uložené dokončování.

Dostupnost modelů a oblastí

Oblast	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-08-06	gpt-4o, 2024-05-13	gpt-4o-mini, 2024-07-18
Švédsko – střed	✅	✅	✅	✅	✅
Severní střed USA	-	-	✅	-	-
USA – východ 2	-	-	✅	-	-

Konfigurace uložených dokončení

Pokud chcete povolit uložené dokončování pro nasazení Azure OpenAI, store nastavte parametr na True. Pomocí parametru metadata můžete rozšířit uloženou datovou sadu dokončení o další informace.

Python (Microsoft Entra ID)
Python (klíč rozhraní API)

import os
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-10-01-preview"
)

completion = client.chat.completions.create(
    
    model="gpt-4o", # replace with model deployment name
    store= True,
    metadata =  {
    "user": "admin",
    "category": "docs-test",
  },
    messages=[
    {"role": "system", "content": "Provide a clear and concise summary of the technical content, highlighting key concepts and their relationships. Focus on the main ideas and practical implications."},
    {"role": "user", "content": "Ensemble methods combine multiple machine learning models to create a more robust and accurate predictor. Common techniques include bagging (training models on random subsets of data), boosting (sequentially training models to correct previous errors), and stacking (using a meta-model to combine base model predictions). Random Forests, a popular bagging method, create multiple decision trees using random feature subsets. Gradient Boosting builds trees sequentially, with each tree focusing on correcting the errors of previous trees. These methods often achieve better performance than single models by reducing overfitting and variance while capturing different aspects of the data."}
    ]   
)

print(completion.choices[0].message)

Důležité

Používejte klíče rozhraní API s opatrností. Nezahrnujte klíč rozhraní API přímo do kódu a nikdy ho nevštěvujte veřejně. Pokud používáte klíč rozhraní API, bezpečně ho uložte ve službě Azure Key Vault. Další informace o bezpečném používání klíčů ROZHRANÍ API ve vašich aplikacích najdete v tématu Klíče rozhraní API se službou Azure Key Vault.

Další informace o zabezpečení služeb AI najdete v tématu Ověřování požadavků na služby Azure AI.

import os
from openai import AzureOpenAI
    
client = AzureOpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
    api_version="2024-10-01-preview",
    azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
    )

ompletion = client.chat.completions.create(
    
    model="gpt-4o", # replace with model deployment name
    store= True,
    metadata =  {
    "user": "admin",
    "category": "docs-test",
  },
    messages=[
    {"role": "system", "content": "Provide a clear and concise summary of the technical content, highlighting key concepts and their relationships. Focus on the main ideas and practical implications."},
    {"role": "user", "content": "Ensemble methods combine multiple machine learning models to create a more robust and accurate predictor. Common techniques include bagging (training models on random subsets of data), boosting (sequentially training models to correct previous errors), and stacking (using a meta-model to combine base model predictions). Random Forests, a popular bagging method, create multiple decision trees using random feature subsets. Gradient Boosting builds trees sequentially, with each tree focusing on correcting the errors of previous trees. These methods often achieve better performance than single models by reducing overfitting and variance while capturing different aspects of the data."}
    ]   
)

print(completion.choices[0].message)

Po povolení uložených dokončování pro nasazení Azure OpenAI se začnou zobrazovat na portálu Azure AI Foundry v podokně Uložené dokončování.

Destilace

Destilace umožňuje převést vaše uložené doplňování na jemně vyladěnou datovou sadu. Běžným případem použití je použití uložených dokončení s větším výkonnějším modelem pro konkrétní úlohu a následné použití uložených dokončení k trénování menšího modelu na vysoce kvalitních příkladech interakcí modelu.

Při destilování se vyžaduje minimálně 10 uložených dokončení, ale doporučuje se poskytnout stovky až tisíce uložených dokončení, aby bylo možné dosáhnout nejlepších výsledků.

V podokně Uložené dokončování na portálu Azure AI Foundry pomocí možností Filtru vyberte dokončení, se kterými chcete model trénovat.
Chcete-li začít destilovat, vyberte Destil
Vyberte model, který chcete doladit s datovou sadou dokončení uloženého dokončení.
Ověřte, jakou verzi modelu chcete vyladit:
Soubor .jsonl s náhodně vygenerovaným názvem se vytvoří jako trénovací datová sada z uložených dokončení. Vyberte soubor >Další.

Poznámka:

Uložené soubory pro destilační destilační přípravu nelze získat přístup přímo a nelze je exportovat externě nebo stáhnout.

Zbývající kroky odpovídají typickým krokům ladění Azure OpenAI. Další informace najdete v naší příručce Začínáme s vyladěním.

Hodnocení

Vyhodnocení velkých jazykových modelů je kritickým krokem při měření jejich výkonu v různých úlohách a dimenzích. To je zvlášť důležité pro jemně vyladěné modely, kdy je důležité vyhodnotit zvýšení výkonu (nebo ztráty) z trénování. Důkladné vyhodnocení vám může pomoct pochopit, jak mohou různé verze modelu ovlivnit vaši aplikaci nebo scénář.

Uložené dokončování je možné použít jako datovou sadu pro spouštění vyhodnocení.

V podokně Uložené dokončování na portálu Azure AI Foundry použijte možnosti filtru a vyberte dokončení, která chcete být součástí testovací datové sady.
Pokud chcete nakonfigurovat vyhodnocení, vyberte Vyhodnotit.
Tím se spustí podokno Vyhodnocení s předem vyplněným .jsonl souborem s náhodně vygenerovaným názvem, který se vytvoří jako testovací datová sada z uložených dokončení.

Poznámka:

K uloženým datovým souborům vyhodnocení dokončení nelze přistupovat přímo a nelze je exportovat externě nebo stáhnout.

Další informace o vyhodnocení najdete v tématu Začínáme se zkušebními verzemi.

Řešení problému

Potřebuji speciální oprávnění k používání uložených dokončování?

Přístup k uloženým dokončováním se řídí dvěma akcemi DataAction:

Microsoft.CognitiveServices/accounts/OpenAI/stored-completions/read
Microsoft.CognitiveServices/accounts/OpenAI/stored-completions/action

Ve výchozím nastavení Cognitive Services OpenAI Contributor má přístup k oběma těmto oprávněním:

Návody odstranit uložená data?

Data je možné odstranit odstraněním přidruženého prostředku Azure OpenAI. Pokud chcete odstranit pouze uložená data dokončení, musíte otevřít případ se zákaznickou podporou.

Kolik uložených dat dokončení můžu uložit?

Můžete uložit maximálně 10 GB dat.

Můžu zabránit povolení uložených dokončení v předplatném?

Pokud chcete zakázat uložené dokončování na úrovni předplatného, budete muset otevřít případ se zákaznickou podporou.

TypeError: Completions.create() získal neočekávaný argument Store.

K této chybě dochází v případě, že používáte starší verzi klientské knihovny OpenAI, která před vydáním uložené funkce dokončení předchází. Spusťte pip install openai --upgrade.

Sdílet prostřednictvím