Novinky ve službě Azure OpenAI
Tento článek obsahuje souhrn nejnovějších verzí a hlavních aktualizací dokumentace pro Azure OpenAI.
Prosince 2024
o1 model odůvodnění vydaný pro omezený přístup
Nejnovější o1
model je nyní k dispozici pro přístup k rozhraní API a nasazení modelu. Registrace je povinná a přístup se udělí na základě kritérií způsobilosti microsoftu. Zákazníci, kteří dříve použili a obdrželi přístup , o1-preview
nemusí znovu použít, protože jsou automaticky na seznamu čekání pro nejnovější model.
Vyžádání přístupu: aplikace modelu omezeného přístupu
Další informace o pokročilých o1
modelech řad najdete v tématu Začínáme s modely zdůvodňování řad o1.
Regionální dostupnost
Model | Oblast |
---|---|
o1 (Verze: 2024-12-17) |
USA – východ 2 (globální standard) Švédsko – střed (Global Standard) |
Vyladění předvoleb (Preview)
Optimalizace přímých předvoleb (DPO) je nová technika sladění pro velké jazykové modely, která je navržená k úpravě hmotností modelu na základě lidských preferencí. Na rozdíl od zpětné vazby od lidské zpětné vazby (RLHF) DPO nevyžaduje přizpůsobení modelu odměny a pro trénování používá jednodušší data (binární předvolby). Tato metoda je výpočetně lehčí a rychlejší, takže je stejně efektivní při sladění a zároveň efektivnější. DPO je zvlášť užitečné ve scénářích, kdy jsou důležité subjektivní prvky, jako je tón, styl nebo konkrétní předvolby obsahu. S radostí oznamujeme verzi Public Preview DPO ve službě Azure OpenAI, počínaje modelem gpt-4o-2024-08-06
.
Informace o vyladění dostupnosti oblastí modelu najdete na stránce modelů.
Uložené doplňování a destilování
Uložené dokončování umožňuje zachytit historii konverzací z relací dokončení chatu, aby se používaly jako datové sady pro vyhodnocení a vyladění.
GPT-4o 2024-11-20
gpt-4o-2024-11-20
je nyní k dispozici pro globální standardní nasazení v:
- East US
- USA – východ 2
- USA – středosever
- Středojižní USA
- USA – západ
- USA – západ 3
- Švédsko – střed
Nový typ nasazení zřízené zóny dat
Zřízená nasazení v zóně dat jsou k dispozici ve stejném prostředku Azure OpenAI jako všechny ostatní typy nasazení Azure OpenAI, ale umožňují využít globální infrastrukturu Azure k dynamickému směrování provozu do datového centra v rámci datové zóny definované Microsoftem s nejlepší dostupností pro každou žádost. Zřízená nasazení v zóně dat poskytují rezervovanou kapacitu zpracování modelu pro vysokou a předvídatelnou propustnost pomocí infrastruktury Azure v rámci určených datových zón Microsoftu. Zřízená nasazení v zóně dat jsou podporována na gpt-4o-2024-08-06
platformě gpt-4o-mini-2024-07-18
a gpt-4o-2024-05-13
modelech.
Další informace najdete v průvodci typy nasazení.
Listopad 2024
Obecná dostupnost vizuálního ladění
Vizuální jemné ladění pomocí GPT-4o (2024-08-06) v současné době obecně dostupné (GA).
Vyladění obrazu umožňuje přidávat obrázky do trénovacích dat JSONL. Stejně jako můžete do dokončení chatu odeslat jeden nebo mnoho vstupů obrázků, můžete do trénovacích dat zahrnout stejné typy zpráv. Obrázky je možné zadat buď jako adresy URL, nebo jako obrázky kódované v base64.
Informace o vyladění dostupnosti oblastí modelu najdete na stránce modelů.
NOVÉ monitorování zneužití umělé inteligence
Zavádíme nové formy monitorování zneužití, které využívají LLM ke zlepšení efektivity detekce potenciálně zneužívajícího používání služby Azure OpenAI a umožnění monitorování zneužití bez nutnosti kontroly výzev a dokončení člověka. Další informace najdete v tématu Monitorování zneužití.
Výzvy a dokončení, které jsou označeny prostřednictvím klasifikace obsahu nebo jsou identifikovány jako součást potenciálně zneužívajícího způsobu použití, podléhají dalšímu procesu kontroly, který pomáhá potvrdit analýzu systému a informovat o rozhodnutích o činnosti. Naše systémy monitorování zneužití byly rozšířeny tak, aby povolovaly kontrolu LLM ve výchozím nastavení i lidmi, pokud je to nezbytné a vhodné.
Října 2024
Nový typ nasazení datové zóny standard
Standardní nasazení zóny dat jsou k dispozici ve stejném prostředku Azure OpenAI jako všechny ostatní typy nasazení Azure OpenAI, ale umožňují využívat globální infrastrukturu Azure k dynamickému směrování provozu do datového centra v rámci datového centra definovaného Microsoftem s nejlepší dostupností pro každou žádost. Standard datové zóny poskytuje vyšší výchozí kvóty než naše typy nasazení založené na zeměpisné oblasti Azure. Nasazení standardu datové zóny jsou podporována na gpt-4o-2024-08-06
platformě , gpt-4o-2024-05-13
a gpt-4o-mini-2024-07-18
modelech.
Další informace najdete v průvodci typy nasazení.
Globální obecná dostupnost služby Batch
Globální dávka Azure OpenAI je teď obecně dostupná.
Rozhraní API služby Azure OpenAI Batch je navržené tak, aby efektivně zpracovával úlohy rozsáhlého a velkoobjemového zpracování. Zpracování asynchronních skupin požadavků s samostatnou kvótou s 24hodinovým cílovým turnaroundem s 50% nižšími náklady než globální standard. Při dávkovém zpracování místo odeslání jednoho požadavku v jednom souboru odešlete velký počet požadavků. Globální dávkové požadavky mají samostatnou kvótu front tokenů, aby nedošlo k přerušení online úloh.
Mezi klíčové případy použití patří:
Rozsáhlé zpracování dat: Paralelní rychlá analýza rozsáhlých datových sad
Generování obsahu: Umožňuje vytvářet velké objemy textu, jako jsou popisy produktů nebo články.
Kontrola a shrnutí dokumentů: Automatizujte kontrolu a shrnutí dlouhých dokumentů.
Automatizace zákaznické podpory: Zpracování mnoha dotazů současně za účelem rychlejších odpovědí
Extrakce a analýza dat: Extrahování a analýza informací z obrovského množství nestrukturovaných dat
Úlohy zpracování přirozeného jazyka (NLP): Provádění úkolů, jako je analýza mínění nebo překlad velkých datových sad
Marketing a přizpůsobení: Vygenerujte přizpůsobený obsah a doporučení ve velkém měřítku.
Další informace o zahájení práce s globálními dávkovými nasazeními.
omezený přístup k modelům o1-preview a o1-mini
o1-mini
K dispozici jsou teď modely o1-preview
pro přístup k rozhraní API a nasazení modelu. Registrace je povinná a přístup se udělí na základě kritérií způsobilosti microsoftu.
Vyžádání přístupu: aplikace modelu omezeného přístupu
Zákazníci, kteří už byli schváleni a mají přístup k modelu prostřednictvím dětského hřiště s rychlým přístupem, nemusí se znovu vztahovat. Automaticky se vám udělí přístup k rozhraní API. Po udělení přístupu budete muset pro každý model vytvořit nasazení.
Podpora rozhraní API:
Podpora modelů řady o1 byla přidána ve verzi 2024-09-01-preview
rozhraní API .
Parametr max_tokens
je zastaralý a nahrazen novým max_completion_tokens
parametrem. Modely řad o1 budou fungovat pouze s parametrem max_completion_tokens
.
Dostupnost oblastí:
Modely jsou k dispozici pro standardní a globální standardní nasazení v oblasti USA – východ 2 a Švédsko – střed pro schválené zákazníky.
Nové rozhraní GPT-4o REALTIME API pro řeč a zvuk ve verzi Public Preview
Zvuk v Azure OpenAI GPT-4o je součástí řady modelů GPT-4o, která podporuje konverzace s nízkou latencí a mluvenou řečí. Rozhraní GPT-4o Audio realtime
API je navržené tak, aby zpracovával konverzační interakce v reálném čase, což je skvělé pro případy použití zahrnující živé interakce mezi uživatelem a modelem, jako jsou agenti zákaznické podpory, hlasoví asistenti a překladatelé v reálném čase.
Model gpt-4o-realtime-preview
je k dispozici pro globální nasazení v oblastech USA – východ 2 a Švédsko – střed.
Další informace najdete v dokumentaci ke zvukovému přenosu GPT-4o v reálném čase.
Aktualizace globální dávkové podpory
Globální dávka teď podporuje GPT-4o (2024-08-06). Další informace najdete v průvodci začínáme s globální dávkou.
Září 2024
Aktualizace uživatelského rozhraní sady Azure OpenAI Studio
Od 19. září 2024 se při přechodu na Azure OpenAI Studio už ve výchozím nastavení nezobrazuje starší verze sady Azure OpenAI Studio . V případě potřeby se budete moct vrátit k předchozímu prostředí pomocí přepínače Přepnout na starý vzhled na horním panelu uživatelského rozhraní na několik týdnů. Pokud přepnete zpět na starší portál Azure AI Foundry, pomůže vám to, když vyplníte formulář pro zpětnou vazbu a dáte nám vědět, proč. Tuto zpětnou vazbu aktivně monitorujeme, abychom zlepšili nové prostředí.
Zřízená nasazení GPT-4o 2024-08-06
GPT-4o 2024-08-06 je nyní k dispozici pro zřízená nasazení v oblasti USA – východ, USA – východ 2, USA – středosever a Švédsko – střed. Je také k dispozici pro globální zřízená nasazení.
Nejnovější informace o dostupnosti modelu najdete na stránce modelů.
NOVÝ globální zřízený typ nasazení
Globální nasazení jsou k dispozici ve stejných prostředcích Azure OpenAI jako jiné než globální typy nasazení, ale umožňují využít globální infrastrukturu Azure k dynamickému směrování provozu do datacentra s nejlepší dostupností pro každou žádost. Globální zřízená nasazení poskytují rezervovanou kapacitu pro zpracování modelů pro vysokou a předvídatelnou propustnost pomocí globální infrastruktury Azure. Globální zřízená nasazení jsou podporována na gpt-4o-2024-08-06
modelech a gpt-4o-mini-2024-07-18
na modelech.
Další informace najdete v průvodci typy nasazení.
NOVÉ modely o1-preview a o1-mini dostupné pro omezený přístup
Azure OpenAI o1-preview
a o1-mini
modely jsou navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako jsou věda, kódování a matematika v porovnání s předchozími iteracemi.
Klíčové funkce řady o1
- Komplexní generování kódu: Umožňuje generovat algoritmy a zpracovávat pokročilé úlohy kódování pro podporu vývojářů.
- Pokročilé řešení problémů: Ideální pro komplexní debaty a řešení vícestranných problémů.
- Komplexní porovnání dokumentů: Ideální pro analýzu kontraktů, souborů případů nebo právních dokumentů k identifikaci drobných rozdílů.
- Instrukce Sledování a správa pracovních postupů: Zvláště efektivní pro správu pracovních postupů vyžadujících kratší kontexty.
Varianty modelů
o1-preview
:o1-preview
je schopnější modelyo1
řad.o1-mini
:o1-mini
je rychlejší a levnější modelyo1
řad.
Verze modelu: 2024-09-12
Vyžádání přístupu: aplikace modelu omezeného přístupu
Omezení
Modely o1
řad jsou aktuálně ve verzi Preview a neobsahují některé funkce dostupné v jiných modelech, jako je porozumění obrázkům a strukturované výstupy, které jsou k dispozici v nejnovějším modelu GPT-4o. U mnoha úloh můžou být obecně dostupné modely GPT-4o stále vhodnější.
Bezpečnost
OpenAI do modelů začlenila další bezpečnostní opatření o1
, včetně nových technik, které modelům pomáhají odmítnout nebezpečné žádosti. Díky těmto vylepšením jsou o1
některé z nej robustnějších modelů k dispozici.
Dostupnost
Tato o1-preview
oblast o1-mini
je k dispozici v oblasti USA – východ 2 pro omezený přístup prostřednictvím portálu Azure AI Foundry. Zpracování dat pro o1
modely může nastat v jiné oblasti než v případě, že jsou k dispozici pro použití.
K vyzkoušení o1-preview
a o1-mini
modelů v registraci dětského hřiště s dřívějším přístupem se vyžaduje a přístup bude udělen na základě kritérií způsobilosti microsoftu.
Vyžádání přístupu: aplikace modelu omezeného přístupu
Po udělení přístupu budete muset:
- Přejděte na https://ai.azure.com/resources prostředek v oblasti a vyberte ho
eastus2
. Pokud v této oblasti nemáte prostředek Azure OpenAI, budete ho muset vytvořit. - Jakmile vyberete
eastus2
prostředek Azure OpenAI, v levém horním panelu v části Dětské hřiště vyberte Dětské hřiště s předběžným přístupem (Preview).
Srpen 2024
Strukturované výstupy GPT-4o 2024-08-06
- K dispozici pro standardní a globální nasazení ve všech oblastech USA a Švédsku – střed.
- Tento model přidává podporu strukturovaných výstupů.
Minimální zřízená nasazení GPT-4o
GPT-4o mini je nyní k dispozici pro zřízená nasazení v Kanadě – východ, USA – východ, USA – východ 2, USA – středosever a Švédsko – střed.
Nejnovější informace o dostupnosti modelu najdete na stránce modelů.
Vyladění GPT-4o (Public Preview)
Vyladění GPT-4o je teď dostupné pro Azure OpenAI ve verzi Public Preview v oblasti USA – středosever a Švédsko – střed.
Další informace najdete v našem blogovém příspěvku.
Nová verze rozhraní API ve verzi Preview
Verze rozhraní API je nejnovější verze 2024-07-01-preview
rozhraní API pro vytváření a odvozování rozhraní API. Nahrazuje verzi 2024-05-01-preview
rozhraní API a přidává podporu pro:
- Přidání podpory rozhraní API služby Batch
- Parametry strategie vytváření bloků vektorového úložiště
max_num_results
by měl být výstupem nástroje pro vyhledávání souborů.
Další informace najdete v referenční dokumentaci.
Minimální dostupnost GPT-4o v jednotlivých oblastech
- GPT-4o mini je k dispozici pro standardní a globální standardní nasazení v oblastech USA – východ a Švédsko – střed.
- GPT-4o mini je k dispozici pro globální dávkové nasazení v oblastech USA – východ, Švédsko – střed a USA – západ.
Průvodce vyhodnocením
- Nový blogový příspěvek o zahájení testování modelů Tuto příručku doporučujeme použít jako součást procesu upgradu a vyřazení modelu.
Nejnovější model GPT-4o dostupný v dětském hřišti s rychlým přístupem (Preview)
6. srpna 2024 oznámil OpenAI nejnovější verzi svého vlajkového modelu 2024-08-06
GPT-4o . GPT-4o 2024-08-06
má všechny možnosti předchozí verze a také:
- Vylepšená schopnost podporovat složité strukturované výstupy.
- Maximální počet výstupních tokenů se zvýšil z 4 096 na 16 384.
Zákazníci Azure můžou dnes otestovat GPT-4o 2024-08-06
v novém dětském prostředí Azure AI Foundry s rychlým přístupem (Preview).
Na rozdíl od předchozího dětského hřiště s dřívějším dřívějším přístupem nevyžaduje portál Azure AI Foundry starší přístupové hřiště (Preview) k tomu, abyste měli prostředek v konkrétní oblasti.
Poznámka:
Výzvy a dokončení provedené prostřednictvím dětského hřiště s předběžným přístupem (Preview) se můžou zpracovat v jakékoli oblasti Azure OpenAI a v současné době podléhají 10 žádostem za minutu na limit předplatného Azure. Tento limit se může v budoucnu změnit.
Monitorování zneužití služby Azure OpenAI je povolené pro všechny uživatele dětského hřiště s dřívějším přístupem, i když jsou schváleny k úpravám; Výchozí filtry obsahu jsou povolené a nelze je upravit.
Pokud chcete otestovat GPT-4o 2024-08-06
, přihlaste se k dětskému hřišti Azure AI pro dřívější přístup (Preview) pomocí tohoto odkazu.
Globální dávkové nasazení jsou nyní k dispozici.
Rozhraní API služby Azure OpenAI Batch je navržené tak, aby efektivně zpracovával úlohy rozsáhlého a velkoobjemového zpracování. Zpracování asynchronních skupin požadavků s samostatnou kvótou s 24hodinovým cílovým turnaroundem s 50% nižšími náklady než globální standard. Při dávkovém zpracování místo odeslání jednoho požadavku v jednom souboru odešlete velký počet požadavků. Globální dávkové požadavky mají samostatnou kvótu front tokenů, aby nedošlo k přerušení online úloh.
Mezi klíčové případy použití patří:
Rozsáhlé zpracování dat: Paralelní rychlá analýza rozsáhlých datových sad
Generování obsahu: Umožňuje vytvářet velké objemy textu, jako jsou popisy produktů nebo články.
Kontrola a shrnutí dokumentů: Automatizujte kontrolu a shrnutí dlouhých dokumentů.
Automatizace zákaznické podpory: Zpracování mnoha dotazů současně za účelem rychlejších odpovědí
Extrakce a analýza dat: Extrahování a analýza informací z obrovského množství nestrukturovaných dat
Úlohy zpracování přirozeného jazyka (NLP): Provádění úkolů, jako je analýza mínění nebo překlad velkých datových sad
Marketing a přizpůsobení: Vygenerujte přizpůsobený obsah a doporučení ve velkém měřítku.
Další informace o zahájení práce s globálními dávkovými nasazeními.
Červenec 2024
GPT-4o mini je nyní k dispozici pro vyladění
Minimální vyladění GPT-4o je nyní dostupné ve verzi Public Preview ve Švédsku – střed a usa – středosever.
Nástroj Pro vyhledávání souborů asistentů se teď účtuje
Nástroj pro vyhledávání souborů pro Asistenty teď má další poplatky za využití. Další informace najdete na stránce s cenami.
Minimodel GPT-4o dostupný pro nasazení
GPT-4o mini je nejnovější model Azure OpenAI, který poprvé oznámil 18. července 2024:
"GPT-4o mini umožňuje zákazníkům dodávat ohromující aplikace s nižšími náklady s blazující rychlostí. GPT-4o mini je výrazně chytřejší než GPT-3.5 Turbo – hodnocení 82 % na měření masivní multitask Language Understanding (MMLU) v porovnání s 70 % a je více než 60% levnější.1 Model poskytuje rozšířené 128K kontextové okno a integruje vylepšené vícejazyčné funkce GPT-4o, což přináší větší kvalitu jazyků z celého světa."
Model je aktuálně k dispozici pro standardní i globální standardní nasazení v oblasti USA – východ.
Informace o kvótě modelu najdete na stránce kvót a omezení a nejnovější informace o dostupnosti modelu najdete na stránce modelů.
Nové výchozí zásady filtrování obsahu zodpovědné umělé inteligence
Nové výchozí zásady DefaultV2
filtrování obsahu poskytují nejnovější bezpečnostní a bezpečnostní omezení pro řadu modelů GPT (text), včetně:
- Vyzvání štítů k útokům s jailbreakem na výzvy uživatele (filtr),
- Detekce chráněného materiálu pro text (filtr) při dokončování modelu
- Detekce chráněných materiálů pro kód (anotace) při dokončování modelu
I když neexistují žádné změny filtrů obsahu pro existující prostředky a nasazení (výchozí nebo vlastní konfigurace filtrování obsahu zůstávají beze změny), nové prostředky a nasazení GPT automaticky dědí nové zásady DefaultV2
filtrování obsahu . Zákazníci mají možnost přepínat mezi výchozími nastaveními zabezpečení a vytvářet vlastní konfigurace filtrování obsahu.
Další informace najdete v naší dokumentaci k výchozím zásadám zabezpečení.
Nová verze rozhraní GA API
Verze rozhraní API je nejnovější verze 2024-06-01
rozhraní API pro odvozování roviny dat GA. Nahrazuje verzi 2024-02-01
rozhraní API a přidává podporu pro:
- vkládání &
encoding_format
dimensions
parametrů - dokončení chatu
logprobs
atop_logprobs
parametry.
Další informace najdete v referenční dokumentaci k odvozování roviny dat.
Rozšíření oblastí dostupných pro globální standardní nasazení gpt-4o
GpT-4o je teď k dispozici pro globální standardní nasazení v:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral git
- Německo – středozápad
- japaneast
- koreacentral
- northcentralus
- Norsko – východ
- polskocentral
- Jižní Afrika – sever
- Střed USA – jih
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
Informace o globální standardní kvótě najdete na stránce kvót a omezení.
Červen 2024
Aktualizace data vyřazení
- Datum vyřazení z provozu 0301 bylo aktualizováno
gpt-35-turbo
nejpozději do 1. října 2024. - Datum
gpt-35-turbo
vyřazení z provozu agpt-35-turbo-16k
aktualizace 0613 na 1. října 2024 - Datum
gpt-4
vyřazení z provozu &gpt-4-32k
0314 na 1. října 2024 a datum vyřazení do 6. června 2025
Nejnovější informace o vyřazení modelu a vyřazení modelu najdete v našem průvodci vyřazením modelu.
Fakturace na základě tokenů pro vyladění
- Fakturace jemného ladění Azure OpenAI je teď založená na počtu tokenů v trénovacím souboru , a ne na celkové době trénování. To může mít za následek výrazné snížení nákladů u některých trénovacích běhů a výrazně usnadňuje odhad nákladů na vyladění. Další informace najdete v oficiálním oznámení.
GPT-4o vydané v nových oblastech
- GPT-4o je nyní k dispozici také v:
- Švédsko – střed pro standardní regionální nasazení.
- Austrálie – východ, Kanada – východ, Japonsko – východ, Korea – střed, Švédsko – střed, Švýcarsko – sever a USA – západ 3 pro zřízené nasazení.
Nejnovější informace o dostupnosti modelu najdete na stránce modelů.
Podpora klíčů spravovaných zákazníkem (CMK) pro asistenty
Vlákna a soubory v asistentech teď podporují CMK v následující oblasti:
- USA – západ 3
Květen 2024
Zřízená nasazení GPT-4o
gpt-4o
Verze: 2024-05-13
je k dispozici pro standardní i zřízená nasazení. Zřízená a standardní nasazení modelu přijímají požadavky na odvozování textu i obrazu a obrazu.
Informace o regionální dostupnosti modelu najdete v matici modelu pro zřízená nasazení.
Asistenti v2 (Preview)
Aktualizace rozhraní API asistentů je teď veřejně dostupná. Obsahuje následující aktualizace:
- Nástroj pro vyhledávání souborů a úložiště vektorů
- Maximální podpora dokončení a maximální podpory tokenů výzvy ke správě využití tokenů
tool_choice
parametr pro vynucení použití zadaného nástroje pomocníkem. Teď můžete vytvářet zprávy s rolí asistenta a vytvářet vlastní historie konverzací ve vláknech.- Podpora pro
temperature
,top_p
,response_format
parametry. - Podpora streamování a dotazování Pomocné funkce v naší sadě Python SDK můžete použít k vytváření spuštěných a streamových odpovědí. Přidali jsme také pomocné rutiny sady SDK pro dotazování ke sdílení aktualizací stavu objektů bez nutnosti dotazování.
- Experimentujte s Logic Apps a voláním funkcí pomocí azure OpenAI Studia. Naimportujte rozhraní REST API implementovaná v Logic Apps jako funkce a studio vyvolá funkci (jako pracovní postup Logic Apps) automaticky na základě výzvy uživatele.
- AutoGen by Microsoft Research poskytuje více agentů konverzační architekturu, která umožňuje pohodlné vytváření pracovních postupů LLM (Large Language Model) v široké škále aplikací. Asistenti Azure OpenAI se teď integrují do AutoGenu prostřednictvím
GPTAssistantAgent
nového experimentálního agenta, který umožňuje bezproblémově přidávat asistenty do pracovních postupů s více agenty založenými na autogenu. To umožňuje více asistentů Azure OpenAI, které můžou být úkolem nebo doménou specializované na spolupráci a řešení složitých úloh. - Podpora jemně vyladěných
gpt-3.5-turbo-0125
modelů v následujících oblastech:- USA – východ 2
- Švédsko – střed
- Rozšířená regionální podpora pro:
- Japonsko – východ
- Spojené království – jih
- USA – západ
- USA – západ 3
- Norsko – východ
Další informace najdete v blogovém příspěvku o asistentech.
Obecná dostupnost modelu GPT-4o (GA)
GPT-4o ("o is for "omni") je nejnovější model od OpenAI spuštěný 13. května 2024.
- GPT-4o integruje text a obrázky v jednom modelu, což umožňuje současně zpracovávat více datových typů. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače.
- GPT-4o odpovídá GPT-4 Turbo v anglickém textu a programovacím úlohám a nabízí vynikající výkon v neanglických jazycích a ve vizuálních úkolech, nastavení nových srovnávacích testů pro funkce AI.
Informace o regionální dostupnosti modelu najdete na stránce modelů.
Globální typ standardního nasazení (Preview)
Globální nasazení jsou k dispozici ve stejných prostředcích Azure OpenAI jako jiné než globální nabídky, ale umožňují využít globální infrastrukturu Azure k dynamickému směrování provozu do datového centra s nejlepší dostupností pro každou žádost. Globální standard poskytuje nejvyšší výchozí kvótu pro nové modely a eliminuje potřebu vyrovnávání zatížení napříč několika prostředky.
Další informace najdete v průvodci typy nasazení.
Vyladění aktualizací
- Vyladění GPT-4 je teď dostupné ve verzi Public Preview.
- Přidání podpory počátečních hodnot, událostí, úplné statistiky ověření a kontrolních bodů v rámci
2024-05-01-preview
vydání rozhraní API
Konfigurovatelné filtry obsahu DALL-E a GPT-4 Turbo Vision GA
Vytvořte vlastní filtry obsahu pro vaše nasazení DALL-E 2 a 3, GPT-4 Turbo s vision GA (turbo-2024-04-09
) a GPT-4o nasazení. Filtrování obsahu
Asynchronní filtr dostupný pro všechny zákazníky Azure OpenAI
Spouštění filtrů asynchronně pro lepší latenci ve scénářích streamování je nyní k dispozici pro všechny zákazníky Azure OpenAI. Filtrování obsahu
Výzva štítů
Prompt Shields chrání aplikace využívající modely Azure OpenAI před dvěma typy útoků: přímým (jailbreakem) a nepřímými útoky. Nepřímé útoky (označované také jako útoky nepřímých výzev nebo útoky prostřednictvím injektáže mezi doménou) jsou typem útoku na systémy využívající modely Generative AI, ke kterým může dojít, když aplikace zpracuje informace, které přímo nevytvořil vývojář aplikace nebo uživatel. Filtrování obsahu
Verze rozhraní API verze Preview z 5. 5. 2024
- Další informace najdete v životním cyklu verze rozhraní API.
Obecná dostupnost modelu GPT-4 Turbo (GA)
Nejnovější verze GA GPT-4 Turbo je:
gpt-4
Verze:turbo-2024-04-09
Toto je náhrada následujících modelů Preview:
gpt-4
Verze:1106-Preview
gpt-4
Verze:0125-Preview
gpt-4
Verze:vision-preview
Rozdíly mezi modely OpenAI a Azure OpenAI GPT-4 Turbo GA
- Verze nejnovějšího
0409
modelu Turbo OpenAI podporuje režim JSON a volání funkcí pro všechny žádosti o odvozování. - Verze nejnovější
turbo-2024-04-09
verze Azure OpenAI v současné době nepodporuje použití režimu JSON a volání funkcí při odvozování požadavků na odvozování pomocí vstupu obrázku (vision). Textové vstupní požadavky (požadavky bezimage_url
a vložené obrázky) podporují režim JSON a volání funkcí.
Rozdíly od gpt-4 vision-preview
- Integrace vylepšení zpracování obrazu specifické pro Azure AI s GPT-4 Turbo s vision není pro
gpt-4
verzi podporovaná:turbo-2024-04-09
Patří sem optické rozpoznávání znaků (OCR), uzemnění objektů, výzvy k videu a vylepšené zpracování dat pomocí obrázků.
Důležité
Vylepšení obrazu ve verzi Preview, včetně optického rozpoznávání znaků (OCR), uzemnění objektů, zobrazování obrazových výzev se vyřadí a po upgradu turbo-2024-04-09
na verzi vision-preview
už nebudou k dispozicigpt-4
. Pokud se v současné době spoléháte na některou z těchto funkcí ve verzi Preview, bude tento automatický upgrade modelu zásadní změnou.
Spravovaná dostupnost zřízená pomocí GPT-4 Turbo
gpt-4
Verze:turbo-2024-04-09
je k dispozici pro standardní i zřízená nasazení. V současné době zřízená verze tohoto modelu nepodporuje požadavky na odvozování obrázků a obrazu. Zřízená nasazení tohoto modelu přijímají pouze textové zadání. Nasazení standardního modelu přijímají požadavky na odvozování textu i obrazu a obrazu.
Nasazení GPT-4 Turbo s ga vision
Pokud chcete nasadit model GA z portálu Azure AI Foundry, vyberte GPT-4
a pak v rozevírací nabídce zvolte turbo-2024-04-09
verzi. Výchozí kvóta modelu gpt-4-turbo-2024-04-09
bude stejná jako aktuální kvóta pro GPT-4-Turbo. Podívejte se na limity kvót v jednotlivých oblastech.
Duben 2024
Vyladění je nyní podporováno ve dvou nových oblastech USA – východ 2 a Švýcarsko – západ
Vyladění je nyní k dispozici s podporou pro:
USA – východ 2
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
Švýcarsko – západ
babbage-002
davinci-002
gpt-35-turbo
(0613)gpt-35-turbo
(1106)gpt-35-turbo
(0125)
Na stránce modelů najdete nejnovější informace o dostupnosti modelu a podpoře vyladění v jednotlivých oblastech.
Příklady trénování chatu s vícenásobným převodem
Vyladění teď podporuje příklady školení pro více konverzací.
GPT-4 (0125) je k dispozici pro Azure OpenAI ve vašich datech.
Model GPT-4 (0125) teď můžete použít v dostupných oblastech pomocí Azure OpenAI ve vašich datech.
Březen 2024
Monitorování rizik a bezpečnosti v nástroji Azure OpenAI Studio
Azure OpenAI Studio teď poskytuje řídicí panel Rizika a bezpečnost pro každé nasazení, které používá konfiguraci filtru obsahu. Slouží ke kontrole výsledků aktivity filtrování. Potom můžete upravit konfiguraci filtru tak, aby lépe sloužila vašim obchodním potřebám a splňovala zásady zodpovědné umělé inteligence.
Monitorování rizik a bezpečnosti
Aktualizace Azure OpenAI ve vašich datech
- Teď se můžete připojit k vektorové databázi Elasticsearch, která se bude používat s Azure OpenAI ve vašich datech.
- Pomocí parametru velikosti bloku bloků dat během příjmu dat můžete nastavit maximální počet tokenů libovolného datového bloku v indexu.
Vydáno 2024-02-01 – obecná dostupnost (GA) API
Toto je nejnovější verze rozhraní GA API a je náhradou za předchozí 2023-05-15
verzi GA. Tato verze přidává podporu nejnovějších funkcí GA pro Azure OpenAI, jako je Whisper, DALLE-3, jemné ladění, data a další.
Funkce, které jsou ve verzi Preview, jako jsou asistenti, převod textu na řeč (TTS) a některé zdroje dat "na vašich datech", vyžadují verzi rozhraní API ve verzi Preview. Další informace najdete v průvodci životním cyklem verze rozhraní API.
Obecná dostupnost šeptání (GA)
Model Šeptající řeč na text je nyní obecně dostupný pro REST i Python. Sady SDK klientské knihovny jsou v současné době stále ve verzi Public Preview.
Vyzkoušejte Šeptejte pomocí rychlého startu.
Obecná dostupnost DALL-E 3 (GA)
Model generování imagí DALL-E 3 je teď obecně dostupný pro REST i Python. Sady SDK klientské knihovny jsou v současné době stále ve verzi Public Preview.
Vyzkoušejte DALL-E 3 pomocí rychlého startu.
Nová regionální podpora pro DALL-E 3
K DALL-E 3 teď můžete přistupovat také pomocí prostředku Azure OpenAI v East US
oblasti Azure nebo AustraliaEast
oblasti Azure.SwedenCentral
Vyřazení modelu a vyřazení z provozu
Přidali jsme stránku pro sledování vyřazení a vyřazení modelu ve službě Azure OpenAI. Tato stránka obsahuje informace o modelech, které jsou aktuálně dostupné, zastaralé a vyřazené.
Vydáno 2024-03-01-Preview API
2024-03-01-preview
má všechny stejné funkce jako 2024-02-15-preview
a přidává dva nové parametry pro vkládání:
encoding_format
umožňuje určit formát pro generování vložených objektů dofloat
nebobase64
. Výchozí hodnota jefloat
.dimensions
umožňuje nastavit počet vložených výstupů. Tento parametr je podporován pouze s novými modely vkládání třetí generace:text-embedding-3-large
,text-embedding-3-small
. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametrdimensions
není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi:pip install openai --upgrade
Pokud aktuálně používáte verzi rozhraní API ve verzi Preview, abyste mohli využívat nejnovější funkce, doporučujeme si prohlédnout článek o životním cyklu verzí rozhraní API a zjistit, jak dlouho bude vaše aktuální verze rozhraní API podporována.
Aktualizace na plány upgradu GPT-4-1106-Preview
Upgrade nasazení verze gpt-4
1106-Preview na gpt-4
verzi 0125-Preview naplánovaný na 8. března 2024 už neprobíhá. gpt-4
Nasazení verzí 1106-Preview a 0125-Preview nastavená na "Automatické aktualizace na výchozí" a "Upgrade po vypršení platnosti" se začnou upgradovat po vydání stabilní verze modelu.
Další informace o procesu upgradu najdete na stránce modelů.
Únor 2024
Dostupný model GPT-3.5-turbo-0125
Tento model má různá vylepšení, včetně vyšší přesnosti při odpovídání v požadovaných formátech a opravy chyby, která způsobovala problém s kódováním textu pro volání funkcí jiného jazyka než v angličtině.
Informace o dostupnosti a upgradech modelů najdete na stránce modelů.
Dostupné modely vkládání třetí generace
text-embedding-3-large
text-embedding-3-small
Při testování nabízí OpenAI sestavy velkých i malých modelů vkládání třetí generace lepší průměrný výkon načítání více jazyků pomocí srovnávacího testu MIRACL , zatímco stále zachovává lepší výkon pro anglické úlohy s srovnávacím testem MTEB než model pro vkládání textu druhé generace ada-002.
Informace o dostupnosti a upgradech modelů najdete na stránce modelů.
Konsolidace kvót GPT-3.5 Turbo
Abychom zjednodušili migraci mezi různými verzemi modelů GPT-3.5-Turbo (včetně 16 tisíc), slučujeme všechny kvóty GPT-3.5-Turbo do jedné hodnoty kvóty.
Všechny zákazníky, kteří mají schválenou zvýšenou kvótu, zkombinují celkovou kvótu, která odráží předchozí zvýšení.
Každý zákazník, jehož aktuální celkové využití napříč verzemi modelu je menší než výchozí, získá ve výchozím nastavení novou kombinovanou celkovou kvótu.
Dostupný model GPT-4-0125-Preview
Verze gpt-4
modelu 0125-preview
je teď dostupná ve službě Azure OpenAI v oblastech USA – východ, USA – středosever a USA – středojiž. Zákazníci s nasazením gpt-4
verze 1106-preview
se automaticky upgradují na 0125-preview
nadcházející týdny.
Informace o dostupnosti a upgradech modelů najdete na stránce modelů.
Rozhraní API asistentů ve verzi Public Preview
Azure OpenAI teď podporuje rozhraní API, které využívá GPT OpenAI. Azure OpenAI Assistants (Preview) umožňuje vytvářet asistenty umělé inteligence přizpůsobené vašim potřebám prostřednictvím vlastních pokynů a pokročilých nástrojů, jako je interpret kódu a vlastní funkce. Další informace najdete v následujících tématech:
- Rychlý start
- Koncepty
- Podrobný návod k Pythonu
- Interpret kódu
- Volání funkcí
- Dostupnost modelu asistentů a oblastí
- Reference k Pythonu a REST pro asistenty
- Ukázky asistentů
OpenAI text to speech voices Public Preview
Služba Azure OpenAI teď podporuje rozhraní API pro převod textu na řeč s hlasy OpenAI. Získejte řeč vygenerovanou AI z textu, který zadáte. Další informace najdete v příručce s přehledem a vyzkoušejte rychlý start.
Poznámka:
Azure AI Speech podporuje také text OpenAI pro hlasové hlasy. Další informace najdete v tématu OpenAI text na hlasové hlasy prostřednictvím služby Azure OpenAI nebo průvodce službou Azure AI Speech .
Nové možnosti vyladění a podpora modelů
Nová regionální podpora pro Azure OpenAI ve vašich datech
Teď můžete ve svých datech použít Azure OpenAI v následující oblasti Azure:
- Jižní Afrika – sever
Obecná dostupnost Azure OpenAI pro vaše data
- Azure OpenAI Ve vašich datech je teď obecně dostupný.
Prosinec 2023
Azure OpenAI na vašich datech
- Úplná podpora vpn a privátních koncových bodů pro Azure OpenAI ve vašich datech, včetně podpory zabezpečení pro účty úložiště, prostředky Azure OpenAI a prostředky Azure AI Search.
- Nový článek o používání konfigurace Azure OpenAI ve vašich datech tím, že chrání data pomocí virtuálních sítí a privátních koncových bodů.
GPT-4 Turbo s vision je nyní k dispozici
GPT-4 Turbo s vision ve službě Azure OpenAI je teď ve verzi Public Preview. GPT-4 Turbo s vision je velký multimodální model (LMM) vyvinutý openAI, který dokáže analyzovat obrázky a poskytovat textové odpovědi na otázky o nich. Zahrnuje zpracování přirozeného jazyka i vizuální porozumění. V rozšířeném režimu můžete pomocí funkcí Azure AI Vision vygenerovat další přehledy z obrázků.
- Prozkoumejte možnosti GPT-4 Turbo s vision v prostředí bez kódu pomocí Azure OpenAI Playground. Další informace najdete v průvodci rychlým startem.
- Vylepšení obrazu pomocí GPT-4 Turbo s vision je nyní k dispozici v Azure OpenAI Playground a zahrnuje podporu optického rozpoznávání znaků, uzemnění objektů, podporu obrázků pro přidání dat a podporu výzvy k videu.
- Volání rozhraní API chatu můžete volat přímo pomocí rozhraní REST API.
- Dostupnost oblastí je v současné době omezená na
SwitzerlandNorth
,SwedenCentral
WestUS
, a , aAustraliaEast
- Přečtěte si další informace o známých omezeních GPT-4 Turbo s vision a dalších nejčastějších dotazech.
Listopad 2023
Podpora nového zdroje dat ve službě Azure OpenAI ve vašich datech
- K příjmu dat a chatu s podporovaným modelem Azure OpenAI teď můžete jako zdroje dat použít virtuální jádro a adresy URL nebo webové adresy Azure Cosmos DB pro MongoDB.
Vydáno GPT-4 Turbo Preview & GPT-3.5-Turbo-1106
Oba modely jsou nejnovější verzí OpenAI s vylepšenou instrukcí, režimem JSON, reprodukovatelným výstupem a paralelním voláním funkcí.
GPT-4 Turbo Preview má maximální kontextové okno s 128 000 tokeny a může generovat 4 096 výstupních tokenů. Obsahuje nejnovější trénovací data s znalostmi až do dubna 2023. Tento model je ve verzi Preview a nedoporučuje se pro produkční použití. Všechna nasazení tohoto modelu Preview se po zpřístupnění stabilní verze automaticky aktualizují.
GPT-3.5-Turbo-1106 má maximální kontextové okno s 16 385 tokeny a může generovat 4 096 výstupních tokenů.
Informace o regionální dostupnosti modelu najdete na stránce modelů.
Modely mají vlastní jedinečné přidělení kvót pro jednotlivé oblasti.
DALL-E 3 Public Preview
DALL-E 3 je nejnovější model generování obrázků z OpenAI. Nabízí vylepšenou kvalitu obrázků, složitější scény a lepší výkon při vykreslování textu v obrázcích. Obsahuje také více možností poměru stran. DALL-E 3 je k dispozici prostřednictvím OpenAI Studia a rozhraní REST API. Váš prostředek OpenAI musí být v SwedenCentral
oblasti Azure.
DALL-E 3 obsahuje integrované přepisování výzev pro vylepšení obrázků, omezení předsudků a zvýšení přirozené variace.
Vyzkoušejte DALL-E 3 pomocí rychlého startu.
Zodpovědná AI
Rozšířená konfigurovatelnost zákazníků: Všichni zákazníci Azure OpenAI teď můžou nakonfigurovat všechny úrovně závažnosti (nízká, střední, vysoká) pro kategorie nenávisti, násilí, sexuální a sebepoškozování, včetně filtrování jenom obsahu s vysokou závažností. Konfigurace filtrů obsahu
Přihlašovací údaje k obsahu ve všech modelech DALL-E: Obrázky generované AI ze všech modelů DALL-E teď obsahují digitální přihlašovací údaje, které zpřístupňují obsah jako vygenerované AI. Aplikace, které zobrazují prostředky obrázků, můžou k zobrazení přihlašovacích údajů ve svých imagích generovaných AI využít opensourcovou sadu SDK pro autentičnost obsahu. Přihlašovací údaje k obsahu v Azure OpenAI
Nové modely RAI
- Detekce rizik jailbreaku: Útoky jailbreaku jsou výzvy uživatelů navržené tak, aby vyvolaly model Generative AI na projevující se chování, které bylo natrénováno, aby se zabránilo nebo přerušilo pravidla nastavená v systémové zprávě. Model detekce rizik jailbreaku je volitelný (výchozí vypnuto) a je k dispozici v modelu poznámek a filtrů. Spustí se na dotazech uživatelů.
- Text chráněného materiálu: Chráněný text materiálu popisuje známý textový obsah (například text skladby, články, recepty a vybraný webový obsah), který je možné vypisovat velkými jazykovými modely. Chráněný textový model materiálu je volitelný (výchozí vypnuto) a je k dispozici v modelu s poznámkami a filtry. Spouští se na dokončení LLM.
- Chráněný kód materiálu: Chráněný kód materiálu popisuje zdrojový kód, který odpovídá sadě zdrojového kódu z veřejných úložišť, které lze vypisovat velkými jazykovými modely bez správné citace zdrojových úložišť. Model chráněného kódu materiálu je volitelný (výchozí nastavení) a je k dispozici v modelu s poznámkami a filtry. Spouští se na dokončení LLM.
Seznamy blokování: Zákazníci teď můžou rychle přizpůsobit chování filtru obsahu pro výzvy a dokončení vytvořením vlastního seznamu blokovaných položek ve svých filtrech. Vlastní seznam bloků umožňuje filtru provádět akce s přizpůsobeným seznamem vzorů, jako jsou konkrétní výrazy nebo vzory regulárních výrazů. Kromě vlastních seznamů blokování poskytujeme seznam blokovaných výrazů Microsoftu (angličtina). Použití seznamů blokovaných položek
Říjen 2023
Nové jemně vyladěné modely (Preview)
gpt-35-turbo-0613
je nyní k dispozici pro vyladění.babbage-002
adavinci-002
jsou nyní k dispozici pro vyladění. Tyto modely nahrazují starší modely ada, babbage, curie a davinci základní modely, které byly dříve k dispozici pro vyladění.Vyladění dostupnosti je omezené na určité oblasti. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
Jemně vyladěné modely mají jiné limity kvót než běžné modely.
Azure OpenAI na vašich datech
- Nové vlastní parametry pro určení počtu načtených dokumentů a striktnosti
- Nastavení striktnosti nastaví prahovou hodnotu pro kategorizaci dokumentů tak, aby byly relevantní pro vaše dotazy.
- Nastavení načtených dokumentů určuje počet dokumentů s nejvyšším skóre z indexu dat, které se používají k vygenerování odpovědí.
- Stav příjmu a nahrávání dat můžete zobrazit v nástroji Azure OpenAI Studio.
- Podpora privátních koncových bodů a sítí VPN pro kontejnery objektů blob
Září 2023
GPT-4
GpT-4 a GPT-4-32k jsou nyní k dispozici všem zákazníkům služby Azure OpenAI. Zákazníci už nemusí požádat o čekání na použití GPT-4 a GPT-4-32k (požadavky na registraci omezeného přístupu nadále platí pro všechny modely Azure OpenAI). Dostupnost se může lišit podle oblasti. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
GPT-3.5 Turbo Instruct
Služba Azure OpenAI teď podporuje model GPT-3.5 Turbo Instruct. Tento model má výkon srovnatelný text-davinci-003
s rozhraním API pro dokončování a je k dispozici pro použití s rozhraním API pro dokončování. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
Šeptej ve verzi Public Preview
Služba Azure OpenAI teď podporuje rozhraní API pro převod řeči na text, která využívají model šeptače OpenAI. Získejte text vygenerovaný pomocí umělé inteligence na základě vámi zadaného zvukového přenosu řeči. Další informace najdete v rychlém startu.
Poznámka:
Azure AI Speech podporuje také model šeptající openAI prostřednictvím rozhraní API pro dávkové přepisy. Další informace najdete v průvodci vytvořením dávkového přepisu . Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.
Nové oblasti
- Azure OpenAI je nyní k dispozici také v oblastech Švédsko – střed a Švýcarsko – sever. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
Zvýšení limitů kvót v jednotlivých oblastech
- Zvýší se na maximální výchozí limity kvót pro určité modely a oblasti. Migrace úloh do těchto modelů a oblastí vám umožní využívat vyšší tokeny za minutu (TPM).
Srpen 2023
Aktualizace Azure OpenAI na vlastních datech (Preview)
- Teď můžete azure OpenAI nasadit do vašich dat do power virtual agents.
- Azure OpenAI On Your Data teď podporuje privátní koncové body.
- Možnost filtrovat přístup k citlivým dokumentům
- Automaticky aktualizovat index podle plánu.
- Možnosti vektorové vyhledávání a sémantické hledání
- Zobrazení historie chatu v nasazené webové aplikaci
Červenec 2023
Podpora volání funkcí
- Azure OpenAI teď podporuje volání funkcí, které vám umožní pracovat s funkcemi v rozhraní API pro dokončování chatu.
Zvýšení vstupního pole vložení
- Azure OpenAI teď podporuje pole s až 16 vstupy na požadavek rozhraní API s textem embedding-ada-002 verze 2.
Nové oblasti
- Azure OpenAI je teď k dispozici také v oblastech Usa – východ, USA – východ 2, Japonsko – východ a USA – středosever. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
Červen 2023
Použití Azure OpenAI na vlastních datech (Preview)
- Azure OpenAI On Your Data je teď k dispozici ve verzi Preview a umožňuje vám chatovat s modely OpenAI, jako jsou GPT-35-Turbo a GPT-4, a přijímat odpovědi na základě vašich dat.
Nové verze modelů gpt-35-turbo a gpt-4
- gpt-35-turbo (verze 0613)
- gpt-35-turbo-16k (verze 0613)
- gpt-4 (verze 0613)
- gpt-4-32k (verze 0613)
Velká Británie – jih
- Azure OpenAI je teď k dispozici v oblasti Velká Británie – jih. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
Filtrování obsahu a poznámky (Preview)
- Jak nakonfigurovat filtry obsahu se službou Azure OpenAI Service
- Povolte poznámky k zobrazení kategorií filtrování obsahu a informací o závažnosti jako součást volání dokončení založeného na GPT a dokončení chatu.
Kvóta
- Kvóta poskytuje flexibilitu při aktivní správě přidělování omezení rychlosti napříč nasazeními v rámci vašeho předplatného.
Květen 2023
Podpora sady Java &JavaScript SDK
- NOVÉ sady SDK Azure OpenAI Preview nabízejí podporu pro JavaScript a Javu.
Obecná dostupnost dokončení chatu Azure OpenAI (GA)
- Obecná podpora dostupnosti pro:
- Verze
2023-05-15
rozhraní API pro dokončování chatu . - GPT-35-Turbo modely.
- Řada modelů GPT-4
- Verze
Pokud aktuálně používáte 2023-03-15-preview
rozhraní API, doporučujeme migrovat na rozhraní GA 2023-05-15
API. Pokud aktuálně používáte verzi 2022-12-01
rozhraní API, zůstane toto rozhraní API obecně dostupné, ale nezahrnuje nejnovější možnosti dokončování chatu.
Důležité
Použití aktuálních verzí modelů GPT-35-Turbo s koncovým bodem dokončení zůstává ve verzi Preview.
Francie – střed
- Azure OpenAI je teď k dispozici v oblasti Francie – střed. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
Duben 2023
DALL-E 2 Public Preview. Služba Azure OpenAI teď podporuje rozhraní API pro generování imagí využívající model DALL-E 2 openAI. Získejte obrázky generované AI na základě popisného textu, který zadáte. Další informace najdete v rychlém startu.
Neaktivní nasazení přizpůsobených modelů se teď odstraní po 15 dnech; modely zůstanou k dispozici pro opětovné nasazení. Pokud je přizpůsobený (vyladěný) model nasazený po dobu více než patnácti (15) dnů, během kterých se do něj neprovedou žádná dokončení ani volání do chatu, nasazení se automaticky odstraní (a za toto nasazení se nebudou účtovat žádné další poplatky za hostování). Základní přizpůsobený model zůstane dostupný a můžete ho kdykoli znovu nasadit. Další informace najdete v tomto článku.
Březen 2023
Modely řady GPT-4 jsou teď dostupné ve verzi Preview v Azure OpenAI. Pokud chcete požádat o přístup, můžou stávající zákazníci Azure OpenAI použít vyplněním tohoto formuláře. Tyto modely jsou aktuálně dostupné v oblastech USA – východ a USA – středojiž.
Nové rozhraní API pro dokončování chatu pro modely GPT-35-Turbo a GPT-4 vydané ve verzi Preview 21. Další informace najdete v aktualizovaných rychlých startech a článku s postupy.
GPT-35-Turbo Preview. Další informace najdete v článku s postupy.
Zvýšená omezení trénování pro vyladění: Maximální velikost trénovací úlohy (tokeny v trénovacím souboru) x (počet epoch) je 2 miliardy tokenů pro všechny modely. Zvýšili jsme také maximální trénovací úlohu z 120 na 720 hodin.
Přidání dalších případů použití do stávajícího přístupu Dříve proces přidání nových případů použití vyžadoval, aby se zákazníci znovu použili ke službě. Nyní vydáváme nový proces, který umožňuje rychle přidat nové případy použití do vašeho používání služby. Tento proces se řídí zavedeným procesem omezeného přístupu v rámci služeb Azure AI. Stávající zákazníci můžou otestovat všechny a všechny nové případy použití. Upozorňujeme, že to je nutné, kdykoli byste chtěli použít službu pro nový případ použití, na který jste původně nepožádali.
2023. únor
Nové funkce
- Ukázky verzí | sady .NET SDK (odvození) verze Preview
- Aktualizace sady Terraform SDK pro podporu operací správy Azure OpenAI
- Vkládání textu na konec dokončení se teď podporuje s parametrem
suffix
.
Aktualizace
- Filtrování obsahu je ve výchozím nastavení zapnuté.
Nové články o:
Nový školicí kurz:
Leden 2023
Nové funkce
Obecná dostupnost služby. Služba Azure OpenAI je teď obecně dostupná.
Nové modely: Přidání nejnovějšího textového modelu, text-davinci-003 (USA – východ, Západní Evropa), text-ada-embeddings-002 (USA – východ, USA – středojiž, Západní Evropa)
Prosinec 2022
Nové funkce
Nejnovější modely z OpenAI. Azure OpenAI poskytuje přístup ke všem nejnovějším modelům, včetně řady GPT-3.5.
Nová verze rozhraní API (12. 12. 2022) Tato aktualizace zahrnuje několik požadovaných vylepšení, včetně informací o využití tokenů v odpovědi rozhraní API, vylepšených chybových zpráv pro soubory, sladění s OpenAI při jemném ladění struktury dat vytváření a podpory parametru přípony, aby bylo možné vlastní pojmenování jemně vyladěných úloh.
Vyšší limity požadavků za sekundu. 50 pro modely jiných než Davinci. 20 pro modely Davinci.
Rychlejší vyladění nasazení Nasaďte modely Ada a Curie do 10 minut.
Vyšší limity trénování: 40M trénovací tokeny pro Ada, Babbage a Curie. 10 M pro Davinci.
Proces žádosti o úpravy zneužití a neúspěšné použití protokolování dat a lidské kontroly V současné chvíli služba protokoluje data žádostí a odpovědí za účelem zneužití a detekce zneužití, aby se zajistilo, že tyto výkonné modely nebudou zneužívané. Mnoho zákazníků ale má přísné požadavky na ochranu osobních údajů a zabezpečení dat, které vyžadují větší kontrolu nad svými daty. Pro podporu těchto případů použití vydáváme zákazníkům nový proces, abychom upravili zásady filtrování obsahu nebo vypnuli protokolování zneužití pro případy použití s nízkým rizikem. Tento proces se řídí zavedeným procesem omezeného přístupu v rámci služeb Azure AI a stávající zákazníci OpenAI mohou použít zde.
Šifrování klíče spravovaného zákazníkem (CMK). CMK poskytuje zákazníkům větší kontrolu nad správou dat v Azure OpenAI tím, že poskytuje vlastní šifrovací klíče používané k ukládání trénovacích dat a přizpůsobených modelů. Klíče spravované zákazníkem (CMK), označované také jako klíče BYOK (Bring Your Own Key), nabízí větší flexibilitu při vytváření, obměně, zakazování a odvolávání řízení přístupu. Šifrovací klíče sloužící k ochraně vašich dat můžete také auditovat. Další informace najdete v naší dokumentaci k šifrování neaktivních uložených dat.
Podpora Lockboxu
Dodržování předpisů SOC-2
Protokolování a diagnostika prostřednictvím služby Azure Resource Health, analýzy nákladů a nastavení metrik a diagnostiky
Vylepšení sady Studio Řadu vylepšení použitelnosti pracovního postupu studia, včetně podpory rolí Azure AD pro řízení, kdo má v týmu přístup k vytváření jemně vyladěných modelů a nasazení.
Změny (způsobující chybu)
Požadavek na vytvoření rozhraní API je vyladěný tak, aby odpovídal schématu OpenAI.
Verze rozhraní API ve verzi Preview:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
Rozhraní API verze 2022-12-01:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
Filtrování obsahu je ve výchozím nastavení dočasně vypnuté . Azure con režim stanu ration funguje jinak než Azure OpenAI. Azure OpenAI spouští filtry obsahu během volání generování, aby zjistil škodlivý nebo zneužívající obsah a vyfiltroval je z odpovědi. Víc se uč
Tyto modely budou znovu povoleny v Q1 2023 a budou ve výchozím nastavení zapnuté.
Akce zákazníka
- Pokud chcete, aby byly pro vaše předplatné zapnuté, obraťte se na podporu Azure.
- Pokud chcete, aby úpravy filtrování zůstaly vypnuté, použijte je. (Tato možnost bude určena pouze pro případy použití s nízkým rizikem.)
Další kroky
Přečtěte si další informace o základních modelech, které power Azure OpenAI.