Novinky ve službě Azure OpenAI

Článek
02/19/2025

Tento článek obsahuje souhrn nejnovějších verzí a hlavních aktualizací dokumentace pro službu Azure OpenAI.

Únor 2025

Nasazení standardu o3-mini datazone

o3-mini je nyní k dispozici pro globální standard a standardní nasazení zóny dat pro registrované zákazníky s omezeným přístupem. Oblasti nasazení úrovně Data Standard jsou aktuálně USA pouze oblasti.

Další informace najdete v našem průvodci modelem odůvodnění.

gpt-4o mini audio vydáno

Model gpt-4o-mini-audio-preview (2024-12-17) je nejnovější model dokončování zvuku. Další informace najdete v rychlém startu generování zvuku.

Model gpt-4o-mini-realtime-preview (2024-12-17) je nejnovější zvukový model v reálném čase. Modely v reálném čase používají stejný základní zvukový model GPT-4o jako rozhraní API pro dokončování, ale je optimalizovaný pro interakce zvuku v reálném čase s nízkou latencí. Další informace najdete v rychlém startu zvuku v reálném čase.

Další informace o dostupných modelech najdete v dokumentaci k modelům a verzím.

Leden 2025

o3-mini vydáno

o3-mini (2025-01-31) je nejnovější model odůvodnění, který nabízí vylepšené schopnosti odůvodnění. Další informace najdete v našem průvodci modelem odůvodnění.

Dokončování zvuku GPT-4o

Model gpt-4o-audio-preview je nyní k dispozici pro globální nasazení v oblastech USA – východ 2 a Švédsko – střed. gpt-4o-audio-preview Použijte model pro generování zvuku.

Model gpt-4o-audio-preview zavádí do stávajícího /chat/completions rozhraní API režim zvuku. Zvukový model rozšiřuje potenciál aplikací umělé inteligence v textových a hlasových interakcích a analýze zvuku. Mezi podporované způsoby modelu gpt-4o-audio-preview patří: text, zvuk a text + zvuk. Další informace najdete v rychlém startu generování zvuku.

Poznámka:

Rozhraní API v reálném čase používá stejný základní zvukový model GPT-4o jako rozhraní API pro dokončování, ale je optimalizovaný pro interakce zvuku v reálném čase s nízkou latencí.

GPT-4o Realtime API 2024-12-17

Model gpt-4o-realtime-preview verze 2024-12-17 je k dispozici pro globální nasazení v oblastech USA – východ 2 a Švédsko – střed. gpt-4o-realtime-preview Pro interakce zvuku v reálném čase použijte model verze 2024-12-17 místo gpt-4o-realtime-preview modelu verze 2024-10-01-preview.

Přidání podpory pro ukládání do mezipaměti s modelem gpt-4o-realtime-preview
Přidali jsme podporu pro nové hlasy. Modely gpt-4o-realtime-preview teď podporují následující hlasy: "slitina", "popel", "balada", "korál", "echo", "šalvěj", "shimmer", "verš".
Omezení rychlosti už nejsou založená na připojeních za minutu. Omezování rychlosti je teď založené na RPM (žádosti za minutu) a TPM (tokeny za minutu gpt-4o-realtime-preview ) pro model. Omezení rychlosti pro každé gpt-4o-realtime-preview nasazení modelu jsou 100K TPM a 1K RPM. Během období Preview může portál Azure AI Foundry a rozhraní API nepřesně zobrazovat různá omezení rychlosti. I když se pokusíte nastavit jiný limit rychlosti, bude skutečný limit rychlosti 100K TPM a 1K RPM.

Další informace najdete v rychlém startu pro zvuk GPT-4o v reálném čase a návodu.

Prosince 2024

o1 model odůvodnění vydaný pro omezený přístup

Nejnovější o1 model je nyní k dispozici pro přístup k rozhraní API a nasazení modelu. Registrace je povinná a přístup se udělí na základě kritérií způsobilosti microsoftu. Zákazníci, kteří dříve použili a obdrželi přístup , o1-previewnemusí znovu použít, protože jsou automaticky na seznamu čekání pro nejnovější model.

Vyžádání přístupu: aplikace modelu omezeného přístupu

Další informace o pokročilých o1 modelech řad najdete v tématu Začínáme s modely zdůvodňování řad o1.

Regionální dostupnost

Model	Oblast
`o1` (Verze: 2024-12-17)	USA – východ 2 (globální standard) Švédsko – střed (Global Standard)

Vyladění předvoleb (Preview)

Optimalizace přímých předvoleb (DPO) je nová technika sladění pro velké jazykové modely, která je navržená k úpravě hmotností modelu na základě lidských preferencí. Na rozdíl od zpětné vazby od lidské zpětné vazby (RLHF) DPO nevyžaduje přizpůsobení modelu odměny a pro trénování používá jednodušší data (binární předvolby). Tato metoda je výpočetně lehčí a rychlejší, takže je stejně efektivní při sladění a zároveň efektivnější. DPO je zvlášť užitečné ve scénářích, kdy jsou důležité subjektivní prvky, jako je tón, styl nebo konkrétní předvolby obsahu. S radostí oznamujeme verzi Public Preview DPO ve službě Azure OpenAI, počínaje modelem gpt-4o-2024-08-06 .

Informace o vyladění dostupnosti oblastí modelu najdete na stránce modelů.

Uložené doplňování a destilování

Uložené dokončování umožňuje zachytit historii konverzací z relací dokončení chatu, aby se používaly jako datové sady pro vyhodnocení a vyladění.

GPT-4o 2024-11-20

gpt-4o-2024-11-20 je nyní k dispozici pro globální standardní nasazení v:

East US
USA – východ 2
USA – středosever
Středojižní USA
USA – západ
USA – západ 3
Švédsko – střed

Nový typ nasazení zřízené zóny dat

Zřízená nasazení v zóně dat jsou k dispozici ve stejném prostředku Azure OpenAI jako všechny ostatní typy nasazení Azure OpenAI, ale umožňují využít globální infrastrukturu Azure k dynamickému směrování provozu do datového centra v rámci datové zóny definované Microsoftem s nejlepší dostupností pro každou žádost. Zřízená nasazení v zóně dat poskytují rezervovanou kapacitu zpracování modelu pro vysokou a předvídatelnou propustnost pomocí infrastruktury Azure v rámci určených datových zón Microsoftu. Zřízená nasazení v zóně dat jsou podporována na gpt-4o-2024-08-06platformě gpt-4o-mini-2024-07-18 a gpt-4o-2024-05-13modelech.

Další informace najdete v průvodci typy nasazení.

Listopad 2024

Obecná dostupnost vizuálního ladění

Vizuální jemné ladění pomocí GPT-4o (2024-08-06) v současné době obecně dostupné (GA).

Vyladění obrazu umožňuje přidávat obrázky do trénovacích dat JSONL. Stejně jako můžete do dokončení chatu odeslat jeden nebo mnoho vstupů obrázků, můžete do trénovacích dat zahrnout stejné typy zpráv. Obrázky je možné zadat buď jako adresy URL, nebo jako obrázky kódované v base64.

Informace o vyladění dostupnosti oblastí modelu najdete na stránce modelů.

NOVÉ monitorování zneužití umělé inteligence

Zavádíme nové formy monitorování zneužití, které využívají LLM ke zlepšení efektivity detekce potenciálně zneužívajícího používání služby Azure OpenAI a umožnění monitorování zneužití bez nutnosti kontroly výzev a dokončení člověka. Další informace najdete v tématu Monitorování zneužití.

Výzvy a dokončení, které jsou označeny prostřednictvím klasifikace obsahu nebo jsou identifikovány jako součást potenciálně zneužívajícího způsobu použití, podléhají dalšímu procesu kontroly, který pomáhá potvrdit analýzu systému a informovat o rozhodnutích o činnosti. Naše systémy monitorování zneužití byly rozšířeny tak, aby povolovaly kontrolu LLM ve výchozím nastavení i lidmi, pokud je to nezbytné a vhodné.

Října 2024

Nový typ nasazení datové zóny standard

Standardní nasazení zóny dat jsou k dispozici ve stejném prostředku Azure OpenAI jako všechny ostatní typy nasazení Azure OpenAI, ale umožňují využívat globální infrastrukturu Azure k dynamickému směrování provozu do datového centra v rámci datového centra definovaného Microsoftem s nejlepší dostupností pro každou žádost. Standard datové zóny poskytuje vyšší výchozí kvóty než naše typy nasazení založené na zeměpisné oblasti Azure. Nasazení standardu datové zóny jsou podporována na gpt-4o-2024-08-06platformě , gpt-4o-2024-05-13a gpt-4o-mini-2024-07-18 modelech.

Další informace najdete v průvodci typy nasazení.

Globální obecná dostupnost služby Batch

Globální dávka Azure OpenAI je teď obecně dostupná.

Rozhraní API služby Azure OpenAI Batch je navržené tak, aby efektivně zpracovával úlohy rozsáhlého a velkoobjemového zpracování. Zpracování asynchronních skupin požadavků s samostatnou kvótou s 24hodinovým cílovým turnaroundem s 50% nižšími náklady než globální standard. Při dávkovém zpracování místo odeslání jednoho požadavku v jednom souboru odešlete velký počet požadavků. Globální dávkové požadavky mají samostatnou kvótu front tokenů, aby nedošlo k přerušení online úloh.

Mezi klíčové případy použití patří:

Rozsáhlé zpracování dat: Paralelní rychlá analýza rozsáhlých datových sad
Generování obsahu: Umožňuje vytvářet velké objemy textu, jako jsou popisy produktů nebo články.
Kontrola a shrnutí dokumentů: Automatizujte kontrolu a shrnutí dlouhých dokumentů.
Automatizace zákaznické podpory: Zpracování mnoha dotazů současně za účelem rychlejších odpovědí
Extrakce a analýza dat: Extrahování a analýza informací z obrovského množství nestrukturovaných dat
Úlohy zpracování přirozeného jazyka (NLP): Provádění úkolů, jako je analýza mínění nebo překlad velkých datových sad
Marketing a přizpůsobení: Vygenerujte přizpůsobený obsah a doporučení ve velkém měřítku.

Další informace o zahájení práce s globálními dávkovými nasazeními.

omezený přístup k modelům o1-preview a o1-mini

o1-mini K dispozici jsou teď modely o1-preview pro přístup k rozhraní API a nasazení modelu. Registrace je povinná a přístup se udělí na základě kritérií způsobilosti microsoftu.

Vyžádání přístupu: aplikace modelu omezeného přístupu

Zákazníci, kteří už byli schváleni a mají přístup k modelu prostřednictvím dětského hřiště s rychlým přístupem, nemusí se znovu vztahovat. Automaticky se vám udělí přístup k rozhraní API. Po udělení přístupu budete muset pro každý model vytvořit nasazení.

Podpora rozhraní API:

Podpora modelů řady o1 byla přidána ve verzi 2024-09-01-previewrozhraní API .

Parametr max_tokens je zastaralý a nahrazen novým max_completion_tokens parametrem. Modely řad o1 budou fungovat pouze s parametrem max_completion_tokens .

Dostupnost oblastí:

Modely jsou k dispozici pro standardní a globální standardní nasazení v oblasti USA – východ 2 a Švédsko – střed pro schválené zákazníky.

Nové rozhraní GPT-4o REALTIME API pro řeč a zvuk ve verzi Public Preview

Zvuk v Azure OpenAI GPT-4o je součástí řady modelů GPT-4o, která podporuje konverzace s nízkou latencí a mluvenou řečí. Rozhraní GPT-4o Audio realtime API je navržené tak, aby zpracovával konverzační interakce v reálném čase, což je skvělé pro případy použití zahrnující živé interakce mezi uživatelem a modelem, jako jsou agenti zákaznické podpory, hlasoví asistenti a překladatelé v reálném čase.

Model gpt-4o-realtime-preview je k dispozici pro globální nasazení v oblastech USA – východ 2 a Švédsko – střed.

Další informace najdete v rychlém startu pro zvuk GPT-4o v reálném čase.

Aktualizace globální dávkové podpory

Globální dávka teď podporuje GPT-4o (2024-08-06). Další informace najdete v průvodci začínáme s globální dávkou.

Září 2024

Aktualizace uživatelského rozhraní sady Azure OpenAI Studio

Od 19. září 2024 se při přechodu na Azure OpenAI Studio už ve výchozím nastavení nezobrazuje starší verze sady Azure OpenAI Studio . V případě potřeby se budete moct vrátit k předchozímu prostředí pomocí přepínače Přepnout na starý vzhled na horním panelu uživatelského rozhraní na několik týdnů. Pokud přepnete zpět na starší portál Azure AI Foundry, pomůže vám to, když vyplníte formulář pro zpětnou vazbu a dáte nám vědět, proč. Tuto zpětnou vazbu aktivně monitorujeme, abychom zlepšili nové prostředí.

Zřízená nasazení GPT-4o 2024-08-06

GPT-4o 2024-08-06 je nyní k dispozici pro zřízená nasazení v oblasti USA – východ, USA – východ 2, USA – středosever a Švédsko – střed. Je také k dispozici pro globální zřízená nasazení.

Nejnovější informace o dostupnosti modelu najdete na stránce modelů.

NOVÝ globální zřízený typ nasazení

Globální nasazení jsou k dispozici ve stejných prostředcích Azure OpenAI jako jiné než globální typy nasazení, ale umožňují využít globální infrastrukturu Azure k dynamickému směrování provozu do datacentra s nejlepší dostupností pro každou žádost. Globální zřízená nasazení poskytují rezervovanou kapacitu pro zpracování modelů pro vysokou a předvídatelnou propustnost pomocí globální infrastruktury Azure. Globální zřízená nasazení jsou podporována na gpt-4o-2024-08-06 modelech a gpt-4o-mini-2024-07-18 na modelech.

Další informace najdete v průvodci typy nasazení.

NOVÉ modely o1-preview a o1-mini dostupné pro omezený přístup

Azure OpenAI o1-preview a o1-mini modely jsou navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako jsou věda, kódování a matematika v porovnání s předchozími iteracemi.

Klíčové funkce řady o1

Komplexní generování kódu: Umožňuje generovat algoritmy a zpracovávat pokročilé úlohy kódování pro podporu vývojářů.
Pokročilé řešení problémů: Ideální pro komplexní debaty a řešení vícestranných problémů.
Komplexní porovnání dokumentů: Ideální pro analýzu kontraktů, souborů případů nebo právních dokumentů k identifikaci drobných rozdílů.
Instrukce Sledování a správa pracovních postupů: Zvláště efektivní pro správu pracovních postupů vyžadujících kratší kontexty.

Varianty modelů

o1-preview: o1-preview je schopnější modely o1 řad.
o1-mini: o1-mini je rychlejší a levnější modely o1 řad.

Verze modelu: 2024-09-12

Vyžádání přístupu: aplikace modelu omezeného přístupu

Omezení

Modely o1 řad jsou aktuálně ve verzi Preview a neobsahují některé funkce dostupné v jiných modelech, jako je porozumění obrázkům a strukturované výstupy, které jsou k dispozici v nejnovějším modelu GPT-4o. U mnoha úloh můžou být obecně dostupné modely GPT-4o stále vhodnější.

Bezpečnost

OpenAI do modelů začlenila další bezpečnostní opatření o1 , včetně nových technik, které modelům pomáhají odmítnout nebezpečné žádosti. Díky těmto vylepšením jsou o1 některé z nej robustnějších modelů k dispozici.

Dostupnost

Tato o1-preview oblast o1-mini je k dispozici v oblasti USA – východ 2 pro omezený přístup prostřednictvím portálu Azure AI Foundry. Zpracování dat pro o1 modely může nastat v jiné oblasti než v případě, že jsou k dispozici pro použití.

K vyzkoušení o1-preview a o1-mini modelů v registraci dětského hřiště s dřívějším přístupem se vyžaduje a přístup bude udělen na základě kritérií způsobilosti microsoftu.

Vyžádání přístupu: aplikace modelu omezeného přístupu

Po udělení přístupu budete muset:

Přejděte na https://ai.azure.com/resources prostředek v oblasti a vyberte ho eastus2 . Pokud v této oblasti nemáte prostředek Azure OpenAI, budete ho muset vytvořit.
Jakmile vyberete eastus2 prostředek Azure OpenAI, v levém horním panelu v části Dětské hřiště vyberte Dětské hřiště s předběžným přístupem (Preview).

Srpen 2024

Strukturované výstupy GPT-4o 2024-08-06

K dispozici pro standardní a globální nasazení ve všech oblastech USA a Švédsku – střed.
Tento model přidává podporu strukturovaných výstupů.

Minimální zřízená nasazení GPT-4o

GPT-4o mini je nyní k dispozici pro zřízená nasazení v Kanadě – východ, USA – východ, USA – východ 2, USA – středosever a Švédsko – střed.

Nejnovější informace o dostupnosti modelu najdete na stránce modelů.

Vyladění GPT-4o (Public Preview)

Vyladění GPT-4o je teď dostupné pro Azure OpenAI ve verzi Public Preview v oblasti USA – středosever a Švédsko – střed.

Další informace najdete v našem blogovém příspěvku.

Nová verze rozhraní API ve verzi Preview

Verze rozhraní API je nejnovější verze 2024-07-01-preview rozhraní API pro vytváření a odvozování rozhraní API. Nahrazuje verzi 2024-05-01-preview rozhraní API a přidává podporu pro:

Přidání podpory rozhraní API služby Batch
Parametry strategie vytváření bloků vektorového úložiště
max_num_results by měl být výstupem nástroje pro vyhledávání souborů.

Další informace najdete v referenční dokumentaci.

Minimální dostupnost GPT-4o v jednotlivých oblastech

GPT-4o mini je k dispozici pro standardní a globální standardní nasazení v oblastech USA – východ a Švédsko – střed.
GPT-4o mini je k dispozici pro globální dávkové nasazení v oblastech USA – východ, Švédsko – střed a USA – západ.

Průvodce vyhodnocením

Nový blogový příspěvek o zahájení testování modelů Tuto příručku doporučujeme použít jako součást procesu upgradu a vyřazení modelu.

Nejnovější model GPT-4o dostupný v dětském hřišti s rychlým přístupem (Preview)

6. srpna 2024 oznámil OpenAI nejnovější verzi svého vlajkového modelu 2024-08-06GPT-4o . GPT-4o 2024-08-06 má všechny možnosti předchozí verze a také:

Vylepšená schopnost podporovat složité strukturované výstupy.
Maximální počet výstupních tokenů se zvýšil z 4 096 na 16 384.

Zákazníci Azure můžou dnes otestovat GPT-4o 2024-08-06 v novém dětském prostředí Azure AI Foundry s rychlým přístupem (Preview).

Na rozdíl od předchozího dětského hřiště s dřívějším dřívějším přístupem nevyžaduje portál Azure AI Foundry starší přístupové hřiště (Preview) k tomu, abyste měli prostředek v konkrétní oblasti.

Poznámka:

Výzvy a dokončení provedené prostřednictvím dětského hřiště s předběžným přístupem (Preview) se můžou zpracovat v jakékoli oblasti Azure OpenAI a v současné době podléhají 10 žádostem za minutu na limit předplatného Azure. Tento limit se může v budoucnu změnit.

Monitorování zneužití služby Azure OpenAI je povolené pro všechny uživatele dětského hřiště s dřívějším přístupem, i když jsou schváleny k úpravám; Výchozí filtry obsahu jsou povolené a nelze je upravit.

Pokud chcete otestovat GPT-4o 2024-08-06, přihlaste se k dětskému hřišti Azure AI pro dřívější přístup (Preview) pomocí tohoto odkazu.

Globální dávkové nasazení jsou nyní k dispozici.

Mezi klíčové případy použití patří:

Rozsáhlé zpracování dat: Paralelní rychlá analýza rozsáhlých datových sad
Generování obsahu: Umožňuje vytvářet velké objemy textu, jako jsou popisy produktů nebo články.
Kontrola a shrnutí dokumentů: Automatizujte kontrolu a shrnutí dlouhých dokumentů.
Automatizace zákaznické podpory: Zpracování mnoha dotazů současně za účelem rychlejších odpovědí
Extrakce a analýza dat: Extrahování a analýza informací z obrovského množství nestrukturovaných dat
Úlohy zpracování přirozeného jazyka (NLP): Provádění úkolů, jako je analýza mínění nebo překlad velkých datových sad
Marketing a přizpůsobení: Vygenerujte přizpůsobený obsah a doporučení ve velkém měřítku.

Další informace o zahájení práce s globálními dávkovými nasazeními.

Červenec 2024

GPT-4o mini je nyní k dispozici pro vyladění

Minimální vyladění GPT-4o je nyní dostupné ve verzi Public Preview ve Švédsku – střed a usa – středosever.

Nástroj Pro vyhledávání souborů asistentů se teď účtuje

Nástroj pro vyhledávání souborů pro Asistenty teď má další poplatky za využití. Další informace najdete na stránce s cenami.

Minimodel GPT-4o dostupný pro nasazení

GPT-4o mini je nejnovější model Azure OpenAI, který poprvé oznámil 18. července 2024:

"GPT-4o mini umožňuje zákazníkům dodávat ohromující aplikace s nižšími náklady s blazující rychlostí. GPT-4o mini je výrazně chytřejší než GPT-3.5 Turbo – hodnocení 82 % na měření masivní multitask Language Understanding (MMLU) v porovnání s 70 % a je více než 60% levnější.1 Model poskytuje rozšířené 128K kontextové okno a integruje vylepšené vícejazyčné funkce GPT-4o, což přináší větší kvalitu jazyků z celého světa."

Model je aktuálně k dispozici pro standardní i globální standardní nasazení v oblasti USA – východ.

Informace o kvótě modelu najdete na stránce kvót a omezení a nejnovější informace o dostupnosti modelu najdete na stránce modelů.

Nové výchozí zásady filtrování obsahu zodpovědné umělé inteligence

Nové výchozí zásady DefaultV2 filtrování obsahu poskytují nejnovější bezpečnostní a bezpečnostní omezení pro řadu modelů GPT (text), včetně:

Vyzvání štítů k útokům s jailbreakem na výzvy uživatele (filtr),
Detekce chráněného materiálu pro text (filtr) při dokončování modelu
Detekce chráněných materiálů pro kód (anotace) při dokončování modelu

I když neexistují žádné změny filtrů obsahu pro existující prostředky a nasazení (výchozí nebo vlastní konfigurace filtrování obsahu zůstávají beze změny), nové prostředky a nasazení GPT automaticky dědí nové zásady DefaultV2filtrování obsahu . Zákazníci mají možnost přepínat mezi výchozími nastaveními zabezpečení a vytvářet vlastní konfigurace filtrování obsahu.

Další informace najdete v naší dokumentaci k výchozím zásadám zabezpečení.

Nová verze rozhraní GA API

Verze rozhraní API je nejnovější verze 2024-06-01 rozhraní API pro odvozování roviny dat GA. Nahrazuje verzi 2024-02-01 rozhraní API a přidává podporu pro:

vkládání & encoding_formatdimensions parametrů
dokončení chatu logprobs a top_logprobs parametry.

Další informace najdete v referenční dokumentaci k odvozování roviny dat.

Rozšíření oblastí dostupných pro globální standardní nasazení gpt-4o

GpT-4o je teď k dispozici pro globální standardní nasazení v:

australiaeast
brazilsouth
canadaeast
eastus
eastus2
francecentral git
Německo – středozápad
japaneast
koreacentral
northcentralus
Norsko – východ
polskocentral
Jižní Afrika – sever
Střed USA – jih
southindia
swedencentral
switzerlandnorth
uksouth
westeurope
westus
westus3

Informace o globální standardní kvótě najdete na stránce kvót a omezení.

Červen 2024

Aktualizace data vyřazení

Datum vyřazení z provozu 0301 bylo aktualizováno gpt-35-turbo nejpozději do 1. října 2024.
Datum gpt-35-turbo vyřazení z provozu a gpt-35-turbo-16kaktualizace 0613 na 1. října 2024
Datum gpt-4 vyřazení z provozu & gpt-4-32k 0314 na 1. října 2024 a datum vyřazení do 6. června 2025

Nejnovější informace o vyřazení modelu a vyřazení modelu najdete v našem průvodci vyřazením modelu.

Fakturace na základě tokenů pro vyladění

Fakturace jemného ladění Azure OpenAI je teď založená na počtu tokenů v trénovacím souboru , a ne na celkové době trénování. To může mít za následek výrazné snížení nákladů u některých trénovacích běhů a výrazně usnadňuje odhad nákladů na vyladění. Další informace najdete v oficiálním oznámení.

GPT-4o vydané v nových oblastech

GPT-4o je nyní k dispozici také v:
- Švédsko – střed pro standardní regionální nasazení.
- Austrálie – východ, Kanada – východ, Japonsko – východ, Korea – střed, Švédsko – střed, Švýcarsko – sever a USA – západ 3 pro zřízené nasazení.

Nejnovější informace o dostupnosti modelu najdete na stránce modelů.

Podpora klíčů spravovaných zákazníkem (CMK) pro asistenty

Vlákna a soubory v asistentech teď podporují CMK v následující oblasti:

USA – západ 3

Květen 2024

Zřízená nasazení GPT-4o

gpt-4o Verze: 2024-05-13 je k dispozici pro standardní i zřízená nasazení. Zřízená a standardní nasazení modelu přijímají požadavky na odvozování textu i obrazu a obrazu. Informace o regionální dostupnosti modelu najdete v matici modelu pro zřízená nasazení.

Asistenti v2 (Preview)

Aktualizace rozhraní API asistentů je teď veřejně dostupná. Obsahuje následující aktualizace:

Nástroj pro vyhledávání souborů a úložiště vektorů
Maximální podpora dokončení a maximální podpory tokenů výzvy ke správě využití tokenů
tool_choice parametr pro vynucení použití zadaného nástroje pomocníkem. Teď můžete vytvářet zprávy s rolí asistenta a vytvářet vlastní historie konverzací ve vláknech.
Podpora pro temperature, top_p, response_formatparametry.
Podpora streamování a dotazování Pomocné funkce v naší sadě Python SDK můžete použít k vytváření spuštěných a streamových odpovědí. Přidali jsme také pomocné rutiny sady SDK pro dotazování ke sdílení aktualizací stavu objektů bez nutnosti dotazování.
Experimentujte s Logic Apps a voláním funkcí pomocí azure OpenAI Studia. Naimportujte rozhraní REST API implementovaná v Logic Apps jako funkce a studio vyvolá funkci (jako pracovní postup Logic Apps) automaticky na základě výzvy uživatele.
AutoGen by Microsoft Research poskytuje více agentů konverzační architekturu, která umožňuje pohodlné vytváření pracovních postupů LLM (Large Language Model) v široké škále aplikací. Asistenti Azure OpenAI se teď integrují do AutoGenu prostřednictvím GPTAssistantAgentnového experimentálního agenta, který umožňuje bezproblémově přidávat asistenty do pracovních postupů s více agenty založenými na autogenu. To umožňuje více asistentů Azure OpenAI, které můžou být úkolem nebo doménou specializované na spolupráci a řešení složitých úloh.
Podpora jemně vyladěných gpt-3.5-turbo-0125modelů v následujících oblastech:
- USA – východ 2
- Švédsko – střed
Rozšířená regionální podpora pro:
- Japonsko – východ
- Spojené království – jih
- USA – západ
- USA – západ 3
- Norsko – východ

Další informace najdete v blogovém příspěvku o asistentech.

Obecná dostupnost modelu GPT-4o (GA)

GPT-4o ("o is for "omni") je nejnovější model od OpenAI spuštěný 13. května 2024.

GPT-4o integruje text a obrázky v jednom modelu, což umožňuje současně zpracovávat více datových typů. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače.
GPT-4o odpovídá GPT-4 Turbo v anglickém textu a programovacím úlohám a nabízí vynikající výkon v neanglických jazycích a ve vizuálních úkolech, nastavení nových srovnávacích testů pro funkce AI.

Informace o regionální dostupnosti modelu najdete na stránce modelů.

Globální typ standardního nasazení (Preview)

Globální nasazení jsou k dispozici ve stejných prostředcích Azure OpenAI jako jiné než globální nabídky, ale umožňují využít globální infrastrukturu Azure k dynamickému směrování provozu do datového centra s nejlepší dostupností pro každou žádost. Globální standard poskytuje nejvyšší výchozí kvótu pro nové modely a eliminuje potřebu vyrovnávání zatížení napříč několika prostředky.

Další informace najdete v průvodci typy nasazení.

Vyladění aktualizací

Vyladění GPT-4 je teď dostupné ve verzi Public Preview.
Přidání podpory počátečních hodnot, událostí, úplné statistiky ověření a kontrolních bodů v rámci 2024-05-01-preview vydání rozhraní API

Konfigurovatelné filtry obsahu DALL-E a GPT-4 Turbo Vision GA

Vytvořte vlastní filtry obsahu pro vaše nasazení DALL-E 2 a 3, GPT-4 Turbo s vision GA (turbo-2024-04-09) a GPT-4o nasazení. Filtrování obsahu

Asynchronní filtr dostupný pro všechny zákazníky Azure OpenAI

Spouštění filtrů asynchronně pro lepší latenci ve scénářích streamování je nyní k dispozici pro všechny zákazníky Azure OpenAI. Filtrování obsahu

Výzva štítů

Prompt Shields chrání aplikace využívající modely Azure OpenAI před dvěma typy útoků: přímým (jailbreakem) a nepřímými útoky. Nepřímé útoky (označované také jako útoky nepřímých výzev nebo útoky prostřednictvím injektáže mezi doménou) jsou typem útoku na systémy využívající modely Generative AI, ke kterým může dojít, když aplikace zpracuje informace, které přímo nevytvořil vývojář aplikace nebo uživatel. Filtrování obsahu

Verze rozhraní API verze Preview z 5. 5. 2024

Další informace najdete v životním cyklu verze rozhraní API.

Obecná dostupnost modelu GPT-4 Turbo (GA)

Nejnovější verze GA GPT-4 Turbo je:

gpt-4 Verze:turbo-2024-04-09

Toto je náhrada následujících modelů Preview:

gpt-4 Verze:1106-Preview
gpt-4 Verze:0125-Preview
gpt-4 Verze:vision-preview

Rozdíly mezi modely OpenAI a Azure OpenAI GPT-4 Turbo GA

Verze nejnovějšího 0409 modelu Turbo OpenAI podporuje režim JSON a volání funkcí pro všechny žádosti o odvozování.
Verze nejnovější turbo-2024-04-09 verze Azure OpenAI v současné době nepodporuje použití režimu JSON a volání funkcí při odvozování požadavků na odvozování pomocí vstupu obrázku (vision). Textové vstupní požadavky (požadavky bez image_url a vložené obrázky) podporují režim JSON a volání funkcí.

Rozdíly od gpt-4 vision-preview

Integrace vylepšení zpracování obrazu specifické pro Azure AI s GPT-4 Turbo s vision není pro gpt-4verzi podporovaná:turbo-2024-04-09 Patří sem optické rozpoznávání znaků (OCR), uzemnění objektů, výzvy k videu a vylepšené zpracování dat pomocí obrázků.

Důležité

Vylepšení obrazu ve verzi Preview, včetně optického rozpoznávání znaků (OCR), uzemnění objektů, zobrazování obrazových výzev se vyřadí a po upgradu turbo-2024-04-09na verzi vision-preview už nebudou k dispozicigpt-4. Pokud se v současné době spoléháte na některou z těchto funkcí ve verzi Preview, bude tento automatický upgrade modelu zásadní změnou.

Spravovaná dostupnost zřízená pomocí GPT-4 Turbo

gpt-4 Verze:turbo-2024-04-09 je k dispozici pro standardní i zřízená nasazení. V současné době zřízená verze tohoto modelu nepodporuje požadavky na odvozování obrázků a obrazu. Zřízená nasazení tohoto modelu přijímají pouze textové zadání. Nasazení standardního modelu přijímají požadavky na odvozování textu i obrazu a obrazu.

Nasazení GPT-4 Turbo s ga vision

Pokud chcete nasadit model GA z portálu Azure AI Foundry, vyberte GPT-4 a pak v rozevírací nabídce zvolte turbo-2024-04-09 verzi. Výchozí kvóta modelu gpt-4-turbo-2024-04-09 bude stejná jako aktuální kvóta pro GPT-4-Turbo. Podívejte se na limity kvót v jednotlivých oblastech.

Duben 2024

Vyladění je nyní podporováno ve dvou nových oblastech USA – východ 2 a Švýcarsko – západ

Vyladění je nyní k dispozici s podporou pro:

USA – východ 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Švýcarsko – západ

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Na stránce modelů najdete nejnovější informace o dostupnosti modelu a podpoře vyladění v jednotlivých oblastech.

Příklady trénování chatu s vícenásobným převodem

Vyladění teď podporuje příklady školení pro více konverzací.

GPT-4 (0125) je k dispozici pro Azure OpenAI ve vašich datech.

Model GPT-4 (0125) teď můžete použít v dostupných oblastech pomocí Azure OpenAI ve vašich datech.

Březen 2024

Monitorování rizik a bezpečnosti v nástroji Azure OpenAI Studio

Azure OpenAI Studio teď poskytuje řídicí panel Rizika a bezpečnost pro každé nasazení, které používá konfiguraci filtru obsahu. Slouží ke kontrole výsledků aktivity filtrování. Potom můžete upravit konfiguraci filtru tak, aby lépe sloužila vašim obchodním potřebám a splňovala zásady zodpovědné umělé inteligence.

Monitorování rizik a bezpečnosti

Aktualizace Azure OpenAI ve vašich datech

Teď se můžete připojit k vektorové databázi Elasticsearch, která se bude používat s Azure OpenAI ve vašich datech.
Pomocí parametru velikosti bloku bloků dat během příjmu dat můžete nastavit maximální počet tokenů libovolného datového bloku v indexu.

Vydáno 2024-02-01 – obecná dostupnost (GA) API

Toto je nejnovější verze rozhraní GA API a je náhradou za předchozí 2023-05-15 verzi GA. Tato verze přidává podporu nejnovějších funkcí GA pro Azure OpenAI, jako je Whisper, DALLE-3, jemné ladění, data a další.

Funkce, které jsou ve verzi Preview, jako jsou asistenti, převod textu na řeč (TTS) a některé zdroje dat "na vašich datech", vyžadují verzi rozhraní API ve verzi Preview. Další informace najdete v průvodci životním cyklem verze rozhraní API.

Obecná dostupnost šeptání (GA)

Model Šeptající řeč na text je nyní obecně dostupný pro REST i Python. Sady SDK klientské knihovny jsou v současné době stále ve verzi Public Preview.

Vyzkoušejte Šeptejte pomocí rychlého startu.

Obecná dostupnost DALL-E 3 (GA)

Model generování imagí DALL-E 3 je teď obecně dostupný pro REST i Python. Sady SDK klientské knihovny jsou v současné době stále ve verzi Public Preview.

Vyzkoušejte DALL-E 3 pomocí rychlého startu.

Nová regionální podpora pro DALL-E 3

K DALL-E 3 teď můžete přistupovat také pomocí prostředku Azure OpenAI v East US oblasti Azure nebo AustraliaEast oblasti Azure.SwedenCentral

Vyřazení modelu a vyřazení z provozu

Přidali jsme stránku pro sledování vyřazení a vyřazení modelu ve službě Azure OpenAI. Tato stránka obsahuje informace o modelech, které jsou aktuálně dostupné, zastaralé a vyřazené.

Vydáno 2024-03-01-Preview API

2024-03-01-preview má všechny stejné funkce jako 2024-02-15-preview a přidává dva nové parametry pro vkládání:

encoding_format umožňuje určit formát pro generování vložených objektů do floatnebo base64. Výchozí hodnota je float.
dimensions umožňuje nastavit počet vložených výstupů. Tento parametr je podporován pouze s novými modely vkládání třetí generace: text-embedding-3-large, text-embedding-3-small. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade

Pokud aktuálně používáte verzi rozhraní API ve verzi Preview, abyste mohli využívat nejnovější funkce, doporučujeme si prohlédnout článek o životním cyklu verzí rozhraní API a zjistit, jak dlouho bude vaše aktuální verze rozhraní API podporována.

Aktualizace na plány upgradu GPT-4-1106-Preview

Upgrade nasazení verze gpt-4 1106-Preview na gpt-4 verzi 0125-Preview naplánovaný na 8. března 2024 už neprobíhá. gpt-4 Nasazení verzí 1106-Preview a 0125-Preview nastavená na "Automatické aktualizace na výchozí" a "Upgrade po vypršení platnosti" se začnou upgradovat po vydání stabilní verze modelu.

Další informace o procesu upgradu najdete na stránce modelů.

Únor 2024

Dostupný model GPT-3.5-turbo-0125

Tento model má různá vylepšení, včetně vyšší přesnosti při odpovídání v požadovaných formátech a opravy chyby, která způsobovala problém s kódováním textu pro volání funkcí jiného jazyka než v angličtině.

Informace o dostupnosti a upgradech modelů najdete na stránce modelů.

Dostupné modely vkládání třetí generace

text-embedding-3-large
text-embedding-3-small

Při testování nabízí OpenAI sestavy velkých i malých modelů vkládání třetí generace lepší průměrný výkon načítání více jazyků pomocí srovnávacího testu MIRACL , zatímco stále zachovává lepší výkon pro anglické úlohy s srovnávacím testem MTEB než model pro vkládání textu druhé generace ada-002.

Informace o dostupnosti a upgradech modelů najdete na stránce modelů.

Konsolidace kvót GPT-3.5 Turbo

Abychom zjednodušili migraci mezi různými verzemi modelů GPT-3.5-Turbo (včetně 16 tisíc), slučujeme všechny kvóty GPT-3.5-Turbo do jedné hodnoty kvóty.

Všechny zákazníky, kteří mají schválenou zvýšenou kvótu, zkombinují celkovou kvótu, která odráží předchozí zvýšení.
Každý zákazník, jehož aktuální celkové využití napříč verzemi modelu je menší než výchozí, získá ve výchozím nastavení novou kombinovanou celkovou kvótu.

Dostupný model GPT-4-0125-Preview

Verze gpt-4 modelu 0125-preview je teď dostupná ve službě Azure OpenAI v oblastech USA – východ, USA – středosever a USA – středojiž. Zákazníci s nasazením gpt-4 verze 1106-preview se automaticky upgradují na 0125-preview nadcházející týdny.

Informace o dostupnosti a upgradech modelů najdete na stránce modelů.

Rozhraní API asistentů ve verzi Public Preview

Azure OpenAI teď podporuje rozhraní API, které využívá GPT OpenAI. Azure OpenAI Assistants (Preview) umožňuje vytvářet asistenty umělé inteligence přizpůsobené vašim potřebám prostřednictvím vlastních pokynů a pokročilých nástrojů, jako je interpret kódu a vlastní funkce. Další informace najdete v následujících tématech:

OpenAI text to speech voices Public Preview

Služba Azure OpenAI teď podporuje rozhraní API pro převod textu na řeč s hlasy OpenAI. Získejte řeč vygenerovanou AI z textu, který zadáte. Další informace najdete v příručce s přehledem a vyzkoušejte rychlý start.

Poznámka:

Azure AI Speech podporuje také text OpenAI pro hlasové hlasy. Další informace najdete v tématu OpenAI text na hlasové hlasy prostřednictvím služby Azure OpenAI nebo průvodce službou Azure AI Speech .

Nové možnosti vyladění a podpora modelů

Nová regionální podpora pro Azure OpenAI ve vašich datech

Teď můžete ve svých datech použít Azure OpenAI v následující oblasti Azure:

Jižní Afrika – sever

Obecná dostupnost Azure OpenAI pro vaše data

Azure OpenAI Ve vašich datech je teď obecně dostupný.

Prosinec 2023

Azure OpenAI na vašich datech

Úplná podpora vpn a privátních koncových bodů pro Azure OpenAI ve vašich datech, včetně podpory zabezpečení pro účty úložiště, prostředky Azure OpenAI a prostředky Azure AI Search.
Nový článek o používání konfigurace Azure OpenAI ve vašich datech tím, že chrání data pomocí virtuálních sítí a privátních koncových bodů.

GPT-4 Turbo s vision je nyní k dispozici

GPT-4 Turbo s vision ve službě Azure OpenAI je teď ve verzi Public Preview. GPT-4 Turbo s vision je velký multimodální model (LMM) vyvinutý openAI, který dokáže analyzovat obrázky a poskytovat textové odpovědi na otázky o nich. Zahrnuje zpracování přirozeného jazyka i vizuální porozumění. V rozšířeném režimu můžete pomocí funkcí Azure AI Vision vygenerovat další přehledy z obrázků.

Prozkoumejte možnosti GPT-4 Turbo s vision v prostředí bez kódu pomocí Azure OpenAI Playground. Další informace najdete v průvodci rychlým startem.
Vylepšení obrazu pomocí GPT-4 Turbo s vision je nyní k dispozici v Azure OpenAI Playground a zahrnuje podporu optického rozpoznávání znaků, uzemnění objektů, podporu obrázků pro přidání dat a podporu výzvy k videu.
Volání rozhraní API chatu můžete volat přímo pomocí rozhraní REST API.
Dostupnost oblastí je v současné době omezená na SwitzerlandNorth, SwedenCentralWestUS, a , aAustraliaEast
Přečtěte si další informace o známých omezeních GPT-4 Turbo s vision a dalších nejčastějších dotazech.

Listopad 2023

Podpora nového zdroje dat ve službě Azure OpenAI ve vašich datech

K příjmu dat a chatu s podporovaným modelem Azure OpenAI teď můžete jako zdroje dat použít virtuální jádro a adresy URL nebo webové adresy Azure Cosmos DB pro MongoDB.

Vydáno GPT-4 Turbo Preview & GPT-3.5-Turbo-1106

Oba modely jsou nejnovější verzí OpenAI s vylepšenou instrukcí, režimem JSON, reprodukovatelným výstupem a paralelním voláním funkcí.

GPT-4 Turbo Preview má maximální kontextové okno s 128 000 tokeny a může generovat 4 096 výstupních tokenů. Obsahuje nejnovější trénovací data s znalostmi až do dubna 2023. Tento model je ve verzi Preview a nedoporučuje se pro produkční použití. Všechna nasazení tohoto modelu Preview se po zpřístupnění stabilní verze automaticky aktualizují.
GPT-3.5-Turbo-1106 má maximální kontextové okno s 16 385 tokeny a může generovat 4 096 výstupních tokenů.

Informace o regionální dostupnosti modelu najdete na stránce modelů.

Modely mají vlastní jedinečné přidělení kvót pro jednotlivé oblasti.

DALL-E 3 Public Preview

DALL-E 3 je nejnovější model generování obrázků z OpenAI. Nabízí vylepšenou kvalitu obrázků, složitější scény a lepší výkon při vykreslování textu v obrázcích. Obsahuje také více možností poměru stran. DALL-E 3 je k dispozici prostřednictvím OpenAI Studia a rozhraní REST API. Váš prostředek OpenAI musí být v SwedenCentral oblasti Azure.

DALL-E 3 obsahuje integrované přepisování výzev pro vylepšení obrázků, omezení předsudků a zvýšení přirozené variace.

Vyzkoušejte DALL-E 3 pomocí rychlého startu.

Zodpovědná AI

Rozšířená konfigurovatelnost zákazníků: Všichni zákazníci Azure OpenAI teď můžou nakonfigurovat všechny úrovně závažnosti (nízká, střední, vysoká) pro kategorie nenávisti, násilí, sexuální a sebepoškozování, včetně filtrování jenom obsahu s vysokou závažností. Konfigurace filtrů obsahu
Přihlašovací údaje k obsahu ve všech modelech DALL-E: Obrázky generované AI ze všech modelů DALL-E teď obsahují digitální přihlašovací údaje, které zpřístupňují obsah jako vygenerované AI. Aplikace, které zobrazují prostředky obrázků, můžou k zobrazení přihlašovacích údajů ve svých imagích generovaných AI využít opensourcovou sadu SDK pro autentičnost obsahu. Přihlašovací údaje k obsahu v Azure OpenAI
Nové modely RAI
- Detekce rizik jailbreaku: Útoky jailbreaku jsou výzvy uživatelů navržené tak, aby vyvolaly model Generative AI na projevující se chování, které bylo natrénováno, aby se zabránilo nebo přerušilo pravidla nastavená v systémové zprávě. Model detekce rizik jailbreaku je volitelný (výchozí vypnuto) a je k dispozici v modelu poznámek a filtrů. Spustí se na dotazech uživatelů.
- Text chráněného materiálu: Chráněný text materiálu popisuje známý textový obsah (například text skladby, články, recepty a vybraný webový obsah), který je možné vypisovat velkými jazykovými modely. Chráněný textový model materiálu je volitelný (výchozí vypnuto) a je k dispozici v modelu s poznámkami a filtry. Spouští se na dokončení LLM.
- Chráněný kód materiálu: Chráněný kód materiálu popisuje zdrojový kód, který odpovídá sadě zdrojového kódu z veřejných úložišť, které lze vypisovat velkými jazykovými modely bez správné citace zdrojových úložišť. Model chráněného kódu materiálu je volitelný (výchozí nastavení) a je k dispozici v modelu s poznámkami a filtry. Spouští se na dokončení LLM.
Konfigurace filtrů obsahu
Seznamy blokování: Zákazníci teď můžou rychle přizpůsobit chování filtru obsahu pro výzvy a dokončení vytvořením vlastního seznamu blokovaných položek ve svých filtrech. Vlastní seznam bloků umožňuje filtru provádět akce s přizpůsobeným seznamem vzorů, jako jsou konkrétní výrazy nebo vzory regulárních výrazů. Kromě vlastních seznamů blokování poskytujeme seznam blokovaných výrazů Microsoftu (angličtina). Použití seznamů blokovaných položek

Říjen 2023

Nové jemně vyladěné modely (Preview)

gpt-35-turbo-0613 je nyní k dispozici pro vyladění.
babbage-002 a davinci-002 jsou nyní k dispozici pro vyladění. Tyto modely nahrazují starší modely ada, babbage, curie a davinci základní modely, které byly dříve k dispozici pro vyladění.
Vyladění dostupnosti je omezené na určité oblasti. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.
Jemně vyladěné modely mají jiné limity kvót než běžné modely.
Kurz: vyladění GPT-3.5-Turbo

Azure OpenAI na vašich datech

Nové vlastní parametry pro určení počtu načtených dokumentů a striktnosti
- Nastavení striktnosti nastaví prahovou hodnotu pro kategorizaci dokumentů tak, aby byly relevantní pro vaše dotazy.
- Nastavení načtených dokumentů určuje počet dokumentů s nejvyšším skóre z indexu dat, které se používají k vygenerování odpovědí.
Stav příjmu a nahrávání dat můžete zobrazit v nástroji Azure OpenAI Studio.
Podpora privátních koncových bodů a sítí VPN pro kontejnery objektů blob

Září 2023

GPT-4

GpT-4 a GPT-4-32k jsou nyní k dispozici všem zákazníkům služby Azure OpenAI. Zákazníci už nemusí požádat o čekání na použití GPT-4 a GPT-4-32k (požadavky na registraci omezeného přístupu nadále platí pro všechny modely Azure OpenAI). Dostupnost se může lišit podle oblasti. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.

GPT-3.5 Turbo Instruct

Služba Azure OpenAI teď podporuje model GPT-3.5 Turbo Instruct. Tento model má výkon srovnatelný text-davinci-003 s rozhraním API pro dokončování a je k dispozici pro použití s rozhraním API pro dokončování. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.

Šeptej ve verzi Public Preview

Služba Azure OpenAI teď podporuje rozhraní API pro převod řeči na text, která využívají model šeptače OpenAI. Získejte text vygenerovaný pomocí umělé inteligence na základě vámi zadaného zvukového přenosu řeči. Další informace najdete v rychlém startu.

Poznámka:

Azure AI Speech podporuje také model šeptající openAI prostřednictvím rozhraní API pro dávkové přepisy. Další informace najdete v průvodci vytvořením dávkového přepisu . Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.

Nové oblasti

Azure OpenAI je nyní k dispozici také v oblastech Švédsko – střed a Švýcarsko – sever. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.

Zvýšení limitů kvót v jednotlivých oblastech

Zvýší se na maximální výchozí limity kvót pro určité modely a oblasti. Migrace úloh do těchto modelů a oblastí vám umožní využívat vyšší tokeny za minutu (TPM).

Srpen 2023

Aktualizace Azure OpenAI na vlastních datech (Preview)

Teď můžete azure OpenAI nasadit do vašich dat do power virtual agents.
Azure OpenAI On Your Data teď podporuje privátní koncové body.
Možnost filtrovat přístup k citlivým dokumentům
Automaticky aktualizovat index podle plánu.
Možnosti vektorové vyhledávání a sémantické hledání
Zobrazení historie chatu v nasazené webové aplikaci

Červenec 2023

Podpora volání funkcí

Azure OpenAI teď podporuje volání funkcí, které vám umožní pracovat s funkcemi v rozhraní API pro dokončování chatu.

Zvýšení vstupního pole vložení

Azure OpenAI teď podporuje pole s až 16 vstupy na požadavek rozhraní API s textem embedding-ada-002 verze 2.

Nové oblasti

Azure OpenAI je teď k dispozici také v oblastech Usa – východ, USA – východ 2, Japonsko – východ a USA – středosever. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.

Červen 2023

Použití Azure OpenAI na vlastních datech (Preview)

Azure OpenAI On Your Data je teď k dispozici ve verzi Preview a umožňuje vám chatovat s modely OpenAI, jako jsou GPT-35-Turbo a GPT-4, a přijímat odpovědi na základě vašich dat.

Nové verze modelů gpt-35-turbo a gpt-4

gpt-35-turbo (verze 0613)
gpt-35-turbo-16k (verze 0613)
gpt-4 (verze 0613)
gpt-4-32k (verze 0613)

Velká Británie – jih

Azure OpenAI je teď k dispozici v oblasti Velká Británie – jih. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.

Filtrování obsahu a poznámky (Preview)

Jak nakonfigurovat filtry obsahu se službou Azure OpenAI Service
Povolte poznámky k zobrazení kategorií filtrování obsahu a informací o závažnosti jako součást volání dokončení založeného na GPT a dokončení chatu.

Kvóta

Kvóta poskytuje flexibilitu při aktivní správě přidělování omezení rychlosti napříč nasazeními v rámci vašeho předplatného.

Květen 2023

Podpora sady Java &JavaScript SDK

NOVÉ sady SDK Azure OpenAI Preview nabízejí podporu pro JavaScript a Javu.

Obecná dostupnost dokončení chatu Azure OpenAI (GA)

Obecná podpora dostupnosti pro:
- Verze 2023-05-15rozhraní API pro dokončování chatu .
- GPT-35-Turbo modely.
- Řada modelů GPT-4

Pokud aktuálně používáte 2023-03-15-preview rozhraní API, doporučujeme migrovat na rozhraní GA 2023-05-15 API. Pokud aktuálně používáte verzi 2022-12-01 rozhraní API, zůstane toto rozhraní API obecně dostupné, ale nezahrnuje nejnovější možnosti dokončování chatu.

Důležité

Použití aktuálních verzí modelů GPT-35-Turbo s koncovým bodem dokončení zůstává ve verzi Preview.

Francie – střed

Azure OpenAI je teď k dispozici v oblasti Francie – střed. Na stránce modelů najdete nejnovější informace o dostupnosti modelu v jednotlivých oblastech.

Duben 2023

DALL-E 2 Public Preview. Služba Azure OpenAI teď podporuje rozhraní API pro generování imagí využívající model DALL-E 2 openAI. Získejte obrázky generované AI na základě popisného textu, který zadáte. Další informace najdete v rychlém startu.
Neaktivní nasazení přizpůsobených modelů se teď odstraní po 15 dnech; modely zůstanou k dispozici pro opětovné nasazení. Pokud je přizpůsobený (vyladěný) model nasazený po dobu více než patnácti (15) dnů, během kterých se do něj neprovedou žádná dokončení ani volání do chatu, nasazení se automaticky odstraní (a za toto nasazení se nebudou účtovat žádné další poplatky za hostování). Základní přizpůsobený model zůstane dostupný a můžete ho kdykoli znovu nasadit. Další informace najdete v tomto článku.

Březen 2023

Modely řady GPT-4 jsou teď dostupné ve verzi Preview v Azure OpenAI. Pokud chcete požádat o přístup, můžou stávající zákazníci Azure OpenAI použít vyplněním tohoto formuláře. Tyto modely jsou aktuálně dostupné v oblastech USA – východ a USA – středojiž.
Nové rozhraní API pro dokončování chatu pro modely GPT-35-Turbo a GPT-4 vydané ve verzi Preview 21. Další informace najdete v aktualizovaných rychlých startech a článku s postupy.
GPT-35-Turbo Preview. Další informace najdete v článku s postupy.
Zvýšená omezení trénování pro vyladění: Maximální velikost trénovací úlohy (tokeny v trénovacím souboru) x (počet epoch) je 2 miliardy tokenů pro všechny modely. Zvýšili jsme také maximální trénovací úlohu z 120 na 720 hodin.
Přidání dalších případů použití do stávajícího přístupu Dříve proces přidání nových případů použití vyžadoval, aby se zákazníci znovu použili ke službě. Nyní vydáváme nový proces, který umožňuje rychle přidat nové případy použití do vašeho používání služby. Tento proces se řídí zavedeným procesem omezeného přístupu v rámci služeb Azure AI. Stávající zákazníci můžou otestovat všechny a všechny nové případy použití. Upozorňujeme, že to je nutné, kdykoli byste chtěli použít službu pro nový případ použití, na který jste původně nepožádali.

2023. únor

Nové funkce

Ukázky verzí | sady .NET SDK (odvození) verze Preview
Aktualizace sady Terraform SDK pro podporu operací správy Azure OpenAI
Vkládání textu na konec dokončení se teď podporuje s parametrem suffix .

Aktualizace

Filtrování obsahu je ve výchozím nastavení zapnuté.

Nové články o:

Nový školicí kurz:

Úvod do Azure OpenAI

Leden 2023

Nové funkce

Obecná dostupnost služby. Služba Azure OpenAI je teď obecně dostupná.
Nové modely: Přidání nejnovějšího textového modelu, text-davinci-003 (USA – východ, Západní Evropa), text-ada-embeddings-002 (USA – východ, USA – středojiž, Západní Evropa)

Prosinec 2022

Nové funkce

Nejnovější modely z OpenAI. Azure OpenAI poskytuje přístup ke všem nejnovějším modelům, včetně řady GPT-3.5.
Nová verze rozhraní API (12. 12. 2022) Tato aktualizace zahrnuje několik požadovaných vylepšení, včetně informací o využití tokenů v odpovědi rozhraní API, vylepšených chybových zpráv pro soubory, sladění s OpenAI při jemném ladění struktury dat vytváření a podpory parametru přípony, aby bylo možné vlastní pojmenování jemně vyladěných úloh.
Vyšší limity požadavků za sekundu. 50 pro modely jiných než Davinci. 20 pro modely Davinci.
Rychlejší vyladění nasazení Nasaďte modely Ada a Curie do 10 minut.
Vyšší limity trénování: 40M trénovací tokeny pro Ada, Babbage a Curie. 10 M pro Davinci.
Proces žádosti o úpravy zneužití a neúspěšné použití protokolování dat a lidské kontroly V současné chvíli služba protokoluje data žádostí a odpovědí za účelem zneužití a detekce zneužití, aby se zajistilo, že tyto výkonné modely nebudou zneužívané. Mnoho zákazníků ale má přísné požadavky na ochranu osobních údajů a zabezpečení dat, které vyžadují větší kontrolu nad svými daty. Pro podporu těchto případů použití vydáváme zákazníkům nový proces, abychom upravili zásady filtrování obsahu nebo vypnuli protokolování zneužití pro případy použití s nízkým rizikem. Tento proces se řídí zavedeným procesem omezeného přístupu v rámci služeb Azure AI a stávající zákazníci OpenAI mohou použít zde.
Šifrování klíče spravovaného zákazníkem (CMK). CMK poskytuje zákazníkům větší kontrolu nad správou dat v Azure OpenAI tím, že poskytuje vlastní šifrovací klíče používané k ukládání trénovacích dat a přizpůsobených modelů. Klíče spravované zákazníkem (CMK), označované také jako klíče BYOK (Bring Your Own Key), nabízí větší flexibilitu při vytváření, obměně, zakazování a odvolávání řízení přístupu. Šifrovací klíče sloužící k ochraně vašich dat můžete také auditovat. Další informace najdete v naší dokumentaci k šifrování neaktivních uložených dat.
Podpora Lockboxu
Dodržování předpisů SOC-2
Protokolování a diagnostika prostřednictvím služby Azure Resource Health, analýzy nákladů a nastavení metrik a diagnostiky
Vylepšení sady Studio Řadu vylepšení použitelnosti pracovního postupu studia, včetně podpory rolí Azure AD pro řízení, kdo má v týmu přístup k vytváření jemně vyladěných modelů a nasazení.

Změny (způsobující chybu)

Požadavek na vytvoření rozhraní API je vyladěný tak, aby odpovídal schématu OpenAI.

Verze rozhraní API ve verzi Preview:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

Rozhraní API verze 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

Filtrování obsahu je ve výchozím nastavení dočasně vypnuté . Azure con režim stanu ration funguje jinak než Azure OpenAI. Azure OpenAI spouští filtry obsahu během volání generování, aby zjistil škodlivý nebo zneužívající obsah a vyfiltroval je z odpovědi. Víc se uč

Tyto modely budou znovu povoleny v Q1 2023 a budou ve výchozím nastavení zapnuté.

Akce zákazníka

Pokud chcete, aby byly pro vaše předplatné zapnuté, obraťte se na podporu Azure.
Pokud chcete, aby úpravy filtrování zůstaly vypnuté, použijte je. (Tato možnost bude určena pouze pro případy použití s nízkým rizikem.)

Další kroky

Přečtěte si další informace o základních modelech, které power Azure OpenAI.

Sdílet prostřednictvím

Novinky ve službě Azure OpenAI

Únor 2025

Nasazení standardu o3-mini datazone

gpt-4o mini audio vydáno

Leden 2025

o3-mini vydáno

Dokončování zvuku GPT-4o

GPT-4o Realtime API 2024-12-17

Prosince 2024

o1 model odůvodnění vydaný pro omezený přístup

Regionální dostupnost

Vyladění předvoleb (Preview)

Uložené doplňování a destilování

GPT-4o 2024-11-20

Nový typ nasazení zřízené zóny dat

Listopad 2024

Obecná dostupnost vizuálního ladění

NOVÉ monitorování zneužití umělé inteligence

Října 2024

Nový typ nasazení datové zóny standard

Globální obecná dostupnost služby Batch

omezený přístup k modelům o1-preview a o1-mini

Nové rozhraní GPT-4o REALTIME API pro řeč a zvuk ve verzi Public Preview

Aktualizace globální dávkové podpory

Září 2024

Aktualizace uživatelského rozhraní sady Azure OpenAI Studio

Zřízená nasazení GPT-4o 2024-08-06

NOVÝ globální zřízený typ nasazení

NOVÉ modely o1-preview a o1-mini dostupné pro omezený přístup

Klíčové funkce řady o1

Varianty modelů

Omezení

Bezpečnost

Dostupnost

Srpen 2024

Strukturované výstupy GPT-4o 2024-08-06

Minimální zřízená nasazení GPT-4o

Vyladění GPT-4o (Public Preview)

Nová verze rozhraní API ve verzi Preview

Minimální dostupnost GPT-4o v jednotlivých oblastech

Průvodce vyhodnocením

Nejnovější model GPT-4o dostupný v dětském hřišti s rychlým přístupem (Preview)

Globální dávkové nasazení jsou nyní k dispozici.

Červenec 2024

GPT-4o mini je nyní k dispozici pro vyladění

Nástroj Pro vyhledávání souborů asistentů se teď účtuje

Minimodel GPT-4o dostupný pro nasazení

Nové výchozí zásady filtrování obsahu zodpovědné umělé inteligence

Nová verze rozhraní GA API

Rozšíření oblastí dostupných pro globální standardní nasazení gpt-4o

Červen 2024

Aktualizace data vyřazení

Fakturace na základě tokenů pro vyladění

GPT-4o vydané v nových oblastech

Podpora klíčů spravovaných zákazníkem (CMK) pro asistenty

Květen 2024

Zřízená nasazení GPT-4o

Asistenti v2 (Preview)

Obecná dostupnost modelu GPT-4o (GA)

Globální typ standardního nasazení (Preview)

Vyladění aktualizací

Konfigurovatelné filtry obsahu DALL-E a GPT-4 Turbo Vision GA

Asynchronní filtr dostupný pro všechny zákazníky Azure OpenAI

Výzva štítů

Verze rozhraní API verze Preview z 5. 5. 2024

Obecná dostupnost modelu GPT-4 Turbo (GA)

Rozdíly mezi modely OpenAI a Azure OpenAI GPT-4 Turbo GA

Rozdíly od gpt-4 vision-preview

Spravovaná dostupnost zřízená pomocí GPT-4 Turbo

Nasazení GPT-4 Turbo s ga vision

Duben 2024

Vyladění je nyní podporováno ve dvou nových oblastech USA – východ 2 a Švýcarsko – západ

USA – východ 2

Švýcarsko – západ

Příklady trénování chatu s vícenásobným převodem

GPT-4 (0125) je k dispozici pro Azure OpenAI ve vašich datech.

Březen 2024

Monitorování rizik a bezpečnosti v nástroji Azure OpenAI Studio

Aktualizace Azure OpenAI ve vašich datech