Delen via


Wat is er nieuw in de Azure OpenAI-service?

Dit artikel bevat een overzicht van de nieuwste releases en belangrijke documentatie-updates voor Azure OpenAI.

November 2024

Vision Fine-tuning GA

Vision fine-tuning with GPT-4o (2024-08-06) in now Generally Available (GA).

Met Vision kunt u afbeeldingen toevoegen aan uw JSONL-trainingsgegevens . Net zoals u één of veel afbeeldingsinvoer kunt verzenden naar chatvoltooiingen, kunt u dezelfde berichttypen opnemen in uw trainingsgegevens. Installatiekopieën kunnen worden opgegeven als URL's of als met base64 gecodeerde afbeeldingen.

Zie de pagina modellen voor het afstemmen van de beschikbaarheid van modelregio's.

BEWAKING VAN NIEUWE AI-misbruik

We introduceren nieuwe vormen van misbruikcontrole die gebruikmaken van LLM's om de efficiëntie van het detecteren van mogelijk misbruik van de Azure OpenAI-service te verbeteren en misbruikbewaking mogelijk te maken zonder menselijke beoordeling van prompts en voltooiingen. Zie Misbruikcontrole voor meer informatie.

Prompts en voltooiingen die zijn gemarkeerd via inhoudsclassificatie en/of geïdentificeerd als onderdeel van een mogelijk misbruikend gebruikspatroon, worden onderworpen aan een extra beoordelingsproces om de analyse van het systeem te bevestigen en beslissingen te nemen. Onze systemen voor misbruikbewaking zijn uitgebreid om controle door LLM standaard en door mensen mogelijk te maken, indien nodig en passend.

Oktober 2024

Standaardimplementatietype NIEUWE gegevenszone

Standaardimplementaties voor gegevenszones zijn beschikbaar in dezelfde Azure OpenAI-resource als alle andere Azure OpenAI-implementatietypen, maar u kunt gebruikmaken van de globale Infrastructuur van Azure om verkeer dynamisch te routeren naar het datacenter binnen de door Microsoft gedefinieerde gegevenszone met de beste beschikbaarheid voor elke aanvraag. De standaard voor de gegevenszone biedt hogere standaardquota dan onze implementatietypen op basis van geografie in Azure. Standaardimplementaties voor gegevenszones worden ondersteund op gpt-4o-2024-08-06, gpt-4o-2024-05-13en gpt-4o-mini-2024-07-18 modellen.

Zie de handleiding voor implementatietypen voor meer informatie.

Algemene algemene beschikbaarheid van Batch

Globale Azure OpenAI-batch is nu algemeen beschikbaar.

De Azure OpenAI Batch-API is ontworpen om grootschalige en grote verwerkingstaken efficiënt te verwerken. Asynchrone groepen aanvragen verwerken met een afzonderlijk quotum, met 24-uurs doeltijd, tegen 50% lagere kosten dan de algemene standaard. Met batchverwerking, in plaats van één aanvraag tegelijk te verzenden, verzendt u een groot aantal aanvragen in één bestand. Globale batchaanvragen hebben een afzonderlijk ge enqueued tokenquotum om onderbrekingen van uw onlineworkloads te voorkomen.

Enkele belangrijke gebruiksvoorbeelden:

  • Grootschalige gegevensverwerking: analyseer snel uitgebreide gegevenssets parallel.

  • Inhoudsgeneratie: Maak grote hoeveelheden tekst, zoals productbeschrijvingen of artikelen.

  • Documentbeoordeling en samenvatting: Automatiseer de beoordeling en samenvatting van lange documenten.

  • Automatisering van klantondersteuning: meerdere query's tegelijk verwerken voor snellere antwoorden.

  • Gegevensextractie en analyse: gegevens extraheren en analyseren uit grote hoeveelheden ongestructureerde gegevens.

  • NLP-taken (Natural Language Processing): voer taken uit zoals sentimentanalyse of vertaling op grote gegevenssets.

  • Marketing en personalisatie: genereer gepersonaliseerde inhoud en aanbevelingen op schaal.

Voor meer informatie over het aan de slag gaan met wereldwijde batchimplementaties.

beperkte toegang tot o1-preview- en o1-minimodellen

De o1-preview en o1-mini modellen zijn nu beschikbaar voor API-toegang en modelimplementatie. Registratie is vereist en toegang wordt verleend op basis van de geschiktheidscriteria van Microsoft.

Toegang aanvragen: beperkte toegangsmodeltoepassing

Klanten die al zijn goedgekeurd en toegang hebben tot het model via de vroege toegangsspeeltuin hoeven niet opnieuw toe te passen. U krijgt automatisch API-toegang. Zodra toegang is verleend, moet u voor elk model een implementatie maken.

API-ondersteuning:

Ondersteuning voor de o1-seriemodellen is toegevoegd in API-versie 2024-09-01-preview.

De max_tokens parameter is afgeschaft en vervangen door de nieuwe max_completion_tokens parameter. o1-seriemodellen werken alleen met de max_completion_tokens parameter.

Beschikbaarheid van regio's:

Modellen zijn beschikbaar voor standaard en wereldwijde standaardimplementatie in VS - oost 2 en Zweden - centraal voor goedgekeurde klanten.

Nieuwe GPT-4o Realtime-API voor openbare preview voor spraak en audio

Azure OpenAI GPT-4o-audio maakt deel uit van de GPT-4o-modelfamilie die ondersteuning biedt voor gesprekken met een lage latentie, spraak in spraak en spraak. De GPT-4o-audio-API realtime is ontworpen om realtime, gespreksinteracties met lage latentie af te handelen, waardoor het een uitstekende keuze is voor gebruiksvoorbeelden met live interacties tussen een gebruiker en een model, zoals klantondersteuningsmedewerkers, spraakassistenten en realtime vertalers.

Het gpt-4o-realtime-preview model is beschikbaar voor wereldwijde implementaties in regio's VS - oost 2 en Zweden - centraal.

Zie de gpt-4o realtime audiodocumentatie voor meer informatie.

Wereldwijde batchondersteuningsupdates

Globale batch ondersteunt nu GPT-4o (2024-08-06). Zie de handleiding aan de slag met globale batches voor meer informatie.

September 2024

UX-updates voor Azure OpenAI Studio

Wanneer u op 19 september toegang krijgt tot Azure OpenAI Studio , ziet u de verouderde gebruikersinterface van Studio niet meer standaard. Indien nodig kunt u nog steeds teruggaan naar de vorige ervaring met behulp van de schakeloptie Overschakelen naar de oude look in de bovenste balk van de gebruikersinterface voor de komende weken. Als u terugschakelt naar de verouderde gebruikersinterface van Studio, helpt dit als u het feedbackformulier invult om ons te laten weten waarom. We houden deze feedback actief in de gaten om de nieuwe ervaring te verbeteren.

Met GPT-4o 2024-08-06 ingerichte implementaties

GPT-4o 2024-08-06 is nu beschikbaar voor ingerichte implementaties in VS - oost, VS - oost 2, VS - noord-centraal en Zweden - centraal. Het is ook beschikbaar voor globale ingerichte implementaties.

Zie de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen.

Nieuw, globaal ingericht implementatietype

Globale implementaties zijn beschikbaar in dezelfde Azure OpenAI-resources als niet-globale implementatietypen, maar u kunt de globale infrastructuur van Azure gebruiken om verkeer dynamisch naar het datacenter te routeren met de beste beschikbaarheid voor elke aanvraag. Globale ingerichte implementaties bieden gereserveerde modelverwerkingscapaciteit voor hoge en voorspelbare doorvoer met behulp van de globale Azure-infrastructuur. Globale ingerichte implementaties worden ondersteund op gpt-4o-2024-08-06 en gpt-4o-mini-2024-07-18 modellen.

Zie de handleiding voor implementatietypen voor meer informatie.

NIEUWE o1-preview- en o1-minimodellen beschikbaar voor beperkte toegang

De Azure OpenAI o1-preview en o1-mini modellen zijn ontworpen voor het aanpakken van redenerings- en probleemoplossingstaken met meer focus en mogelijkheden. Deze modellen besteden meer tijd aan het verwerken en begrijpen van de aanvraag van de gebruiker, waardoor ze uitzonderlijk sterk zijn op gebieden als wetenschap, codering en wiskunde in vergelijking met eerdere iteraties.

Belangrijkste mogelijkheden van de o1-serie

  • Complexe codegeneratie: geschikt voor het genereren van algoritmen en het verwerken van geavanceerde coderingstaken ter ondersteuning van ontwikkelaars.
  • Geavanceerde probleemoplossing: ideaal voor uitgebreide brainstormsessies en het aanpakken van uitdagingen met meerdere facetten.
  • Complexe documentvergelijking: perfect voor het analyseren van contracten, casebestanden of juridische documenten om subtiele verschillen te identificeren.
  • Instructies volgen en werkstroombeheer: met name effectief voor het beheren van werkstromen waarvoor kortere contexten nodig zijn.

Modelvarianten

  • o1-preview: o1-preview is des te meer geschikt voor de o1 seriemodellen.
  • o1-mini: o1-mini is de snellere en goedkopere van de o1 seriemodellen.

Modelversie: 2024-09-12

Toegang aanvragen: beperkte toegangsmodeltoepassing

Beperkingen

De o1 seriemodellen zijn momenteel in preview en bevatten geen enkele functies die beschikbaar zijn in andere modellen, zoals beeldbegrip en gestructureerde uitvoer die beschikbaar zijn in het nieuwste GPT-4o-model. Voor veel taken zijn de algemeen beschikbare GPT-4o-modellen mogelijk nog steeds geschikter.

Veiligheid

OpenAI heeft aanvullende veiligheidsmaatregelen opgenomen in de o1 modellen, waaronder nieuwe technieken om de modellen te helpen onveilige aanvragen te weigeren. Deze ontwikkelingen maken de o1 serie enkele van de meest robuuste modellen beschikbaar.

Beschikbaarheid

De o1-preview en o1-mini zijn beschikbaar in de regio VS - oost 2 voor beperkte toegang via de vroege toegangsspeeltuin van AI Studio . Gegevensverwerking voor de o1 modellen kan zich in een andere regio voordoen dan waar ze beschikbaar zijn voor gebruik.

Als u de o1-preview registratie o1-mini voor de vroege toegangsspeeltuin wilt uitproberen, is registratie vereist en wordt toegang verleend op basis van de geschiktheidscriteria van Microsoft.

Toegang aanvragen: beperkte toegangsmodeltoepassing

Zodra toegang is verleend, moet u het volgende doen:

  1. Navigeer naar https://ai.azure.com/resources en selecteer een resource in de eastus2 regio. Als u geen Azure OpenAI-resource in deze regio hebt, moet u er een maken.
  2. Zodra de eastus2 Azure OpenAI-resource is geselecteerd, selecteert u in het linkerdeelvenster onder Playgrounds early access playground (preview).

Augustus 2024

GPT-4o 2024-08-06 gestructureerde uitvoer

GPT-4o mini-ingerichte implementaties

GPT-4o mini is nu beschikbaar voor ingerichte implementaties in Canada - oost, VS - oost, VS - oost2, VS - noord-centraal en Zweden - centraal.

Zie de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen.

GPT-4o fine-tuning (openbare preview)

GPT-4o fine-tuning is nu beschikbaar voor Azure OpenAI in openbare preview in VS - noord-centraal en Zweden - centraal.

Zie onze blogpost voor meer informatie.

Nieuwe preview-API-release

API-versie 2024-07-01-preview is de nieuwste dataplane-release voor het ontwerpen en deductie-API. De API-versie 2024-05-01-preview wordt vervangen en er wordt ondersteuning toegevoegd voor:

Zie onze referentiedocumentatie voor meer informatie

GPT-4o mini regionale beschikbaarheid

  • GPT-4o mini is beschikbaar voor standaard- en wereldwijde standaardimplementatie in de regio's VS - oost en Zweden - centraal.
  • GPT-4o mini is beschikbaar voor wereldwijde batchimplementatie in regio's VS - oost, Zweden - centraal en VS - west.

Handleiding voor evaluaties

Nieuwste GPT-4o-model beschikbaar in de vroege toegangsspeeltuin (preview)

Op 6 augustus 2024 kondigde OpenAI de nieuwste versie van hun vlaggenschip GPT-4o-modelversie 2024-08-06aan. GPT-4o 2024-08-06 heeft alle mogelijkheden van de vorige versie en:

  • Een verbeterde mogelijkheid om complexe gestructureerde uitvoer te ondersteunen.
  • Het maximum aantal uitvoertokens is verhoogd van 4.096 tot 16.384.

Azure-klanten kunnen gpt-4o 2024-08-06 vandaag testen in de nieuwe ai Studio early access playground (preview).

In tegenstelling tot de vorige vroege toegangsspeeltuin hoeft u voor ai Studio geen resource in een specifieke regio te hebben.

Notitie

Vragen en voltooiingen die zijn gedaan via de early access playground (preview) kunnen worden verwerkt in elke Azure OpenAI-regio en zijn momenteel onderworpen aan een aanvraag van 10 aanvragen per minuut per Azure-abonnementslimiet. Deze limiet kan in de toekomst veranderen.

Misbruikcontrole van Azure OpenAI-service is ingeschakeld voor alle gebruikers van een vroege toegangsspeeltuin, zelfs als ze zijn goedgekeurd voor wijziging; standaardinhoudsfilters zijn ingeschakeld en kunnen niet worden gewijzigd.

Als u GPT-4o 2024-08-06wilt testen, meldt u zich aan bij de Early Access Playground (preview) van Azure AI met behulp van deze koppeling.

Globale batchimplementaties zijn nu beschikbaar

De Azure OpenAI Batch-API is ontworpen om grootschalige en grote verwerkingstaken efficiënt te verwerken. Asynchrone groepen aanvragen verwerken met een afzonderlijk quotum, met 24-uurs doeltijd, tegen 50% lagere kosten dan de algemene standaard. Met batchverwerking, in plaats van één aanvraag tegelijk te verzenden, verzendt u een groot aantal aanvragen in één bestand. Globale batchaanvragen hebben een afzonderlijk ge enqueued tokenquotum om onderbrekingen van uw onlineworkloads te voorkomen.

Enkele belangrijke gebruiksvoorbeelden:

  • Grootschalige gegevensverwerking: analyseer snel uitgebreide gegevenssets parallel.

  • Inhoudsgeneratie: Maak grote hoeveelheden tekst, zoals productbeschrijvingen of artikelen.

  • Documentbeoordeling en samenvatting: Automatiseer de beoordeling en samenvatting van lange documenten.

  • Automatisering van klantondersteuning: meerdere query's tegelijk verwerken voor snellere antwoorden.

  • Gegevensextractie en analyse: gegevens extraheren en analyseren uit grote hoeveelheden ongestructureerde gegevens.

  • NLP-taken (Natural Language Processing): voer taken uit zoals sentimentanalyse of vertaling op grote gegevenssets.

  • Marketing en personalisatie: genereer gepersonaliseerde inhoud en aanbevelingen op schaal.

Voor meer informatie over het aan de slag gaan met wereldwijde batchimplementaties.

Juli 2024

GPT-4o mini is nu beschikbaar voor fine-tuning

GPT-4o mini fine-tuning is nu beschikbaar in openbare preview in Zweden - centraal en in VS - noord-centraal.

Hulpprogramma Bestandszoekopdrachten voor assistenten wordt nu gefactureerd

Het hulpprogramma voor het zoeken van bestanden voor assistenten heeft nu extra kosten voor gebruik. Zie de pagina met prijzen voor meer informatie.

GPT-4o minimodel beschikbaar voor implementatie

GPT-4o mini is het nieuwste Azure OpenAI-model dat op 18 juli 2024 is aangekondigd:

"GPT-4o mini stelt klanten in staat om prachtige toepassingen te leveren tegen lagere kosten met een razendsnelle snelheid. GPT-4o mini is aanzienlijk slimmer dan GPT-3.5 Turbo— score 82% op Het meten van Massive Multitask Language Understanding (MMLU) vergeleken met 70%, en is meer dan 60% goedkoper.1 Het model levert een uitgebreid contextvenster van 128K en integreert de verbeterde meertalige mogelijkheden van GPT-4o, waardoor talen van over de hele wereld beter van kwaliteit zijn."

Het model is momenteel beschikbaar voor zowel de standaard- als de wereldwijde standaardimplementatie in de regio VS - oost.

Raadpleeg de pagina quota en limieten voor informatie over modelquota en raadpleeg de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen.

Nieuw beleid voor het standaardfilteren van verantwoordelijke AI-inhoud

Het nieuwe standaardbeleid DefaultV2 voor inhoudsfilters biedt de nieuwste veiligheids- en beveiligingsbeperking voor de GPT-modelreeks (tekst), waaronder:

  • Prompt Shields voor jailbreakaanvallen op gebruikersprompts (filter),
  • Beveiligde materiaaldetectie voor tekst (filter) bij modelvoltooiingen
  • Beveiligde materiaaldetectie voor code (aantekeningen maken) bij modelvoltooiingen

Hoewel er geen wijzigingen zijn in inhoudsfilters voor bestaande resources en implementaties (standaard- of aangepaste configuraties voor inhoudsfilters blijven ongewijzigd), nemen nieuwe resources en GPT-implementaties automatisch het nieuwe beleid DefaultV2voor inhoudsfilters over. Klanten hebben de mogelijkheid om te schakelen tussen de standaardinstellingen voor veiligheid en aangepaste configuraties voor inhoudsfilters te maken.

Raadpleeg onze documentatie over het standaardveiligheidsbeleid voor meer informatie.

Nieuwe GA API-release

API-versie 2024-06-01 is de nieuwste API-release voor deductie-API voor ga-gegevensvlakken. De API-versie 2024-02-01 wordt vervangen en er wordt ondersteuning toegevoegd voor:

  • insluitingen encoding_format en dimensions parameters.
  • chatvoltooiingen logprobs & top_logprobs parameters.

Raadpleeg onze referentiedocumentatie voor gegevensvlakdeductie voor meer informatie.

Uitbreiding van regio's die beschikbaar zijn voor wereldwijde standaardimplementaties van gpt-4o

GPT-4o is nu beschikbaar voor wereldwijde standaardimplementaties in:

  • australiaeast
  • brazilsouth
  • canadaeast
  • eastus
  • eastus2
  • francecentral git
  • germanywestcentral
  • japaneast
  • koreacentral
  • northcentralus
  • norwayeast
  • Polencentral
  • southafricanorth
  • US - zuid-centraal
  • southindia
  • swedencentral
  • switzerlandnorth
  • uksouth
  • westeurope
  • westus
  • westus3

Raadpleeg de pagina quota en limieten voor informatie over het algemene standaardquotum.

Juni 2024

Updates voor buitengebruikstellingsdatum

  • De gpt-35-turbo buitengebruikstellingsdatum van 0301 is bijgewerkt naar niet eerder dan 1 oktober 2024.
  • Bijgewerkt gpt-35-turbo & gpt-35-turbo-16k0613 buitengebruikstellingsdatum tot 1 oktober 2024.
  • Bijgewerkt gpt-4 en gpt-4-32k 0314 afschaffingsdatum tot 1 oktober 2024 en buitengebruikstellingsdatum tot 6 juni 2025.

Raadpleeg onze handleiding voor buitengebruikstelling van modellen voor de meest recente informatie over modelafschaffen en buitengebruikstelling.

Facturering op basis van tokens voor het afstemmen

  • Azure OpenAI-facturering is nu gebaseerd op het aantal tokens in uw trainingsbestand, in plaats van de totale verstreken trainingstijd. Dit kan leiden tot een aanzienlijke kostenreductie voor sommige trainingsuitvoeringen en maakt het schatten van de kosten veel eenvoudiger. Voor meer informatie kunt u de officiële aankondiging raadplegen.

GPT-4o uitgebracht in nieuwe regio's

  • GPT-4o is nu ook beschikbaar in:
    • Zweden - centraal voor standaard regionale implementatie.
    • Australië - oost, Canada - oost, Japan - oost, Korea - centraal, Zweden - centraal, Zwitserland - noord, en VS - west 3 voor ingerichte implementatie.

Zie de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen.

Cmk-ondersteuning (Door de klant beheerde sleutel) voor assistenten

Threads en bestanden in assistenten ondersteunen nu CMK in de volgende regio:

  • US - west 3

Mei 2024

Met GPT-4o ingerichte implementaties

gpt-4o Versie: 2024-05-13 is beschikbaar voor zowel standaard- als ingerichte implementaties. Ingerichte en standaardmodelimplementaties accepteren zowel tekst- als afbeeldings-/visiondeductieaanvragen. Raadpleeg de modelmatrix voor ingerichte implementaties voor informatie over regionale beschikbaarheid van modellen.

Assistenten v2 (preview)

Een vernieuwing van de Assistants-API is nu openbaar beschikbaar. Deze bevat de volgende updates:

  • Hulpprogramma voor bestandszoekopdrachten en vectoropslag
  • Maximale voltooiing en maximale ondersteuning voor prompttoken voor het beheren van tokengebruik.
  • tool_choiceparameter voor het afdwingen van de Assistent om een opgegeven hulpprogramma te gebruiken. U kunt nu berichten maken met de assistentrol om aangepaste gespreksgeschiedenissen te maken in Threads.
  • Ondersteuning voor temperature, top_pparameters response_format .
  • Ondersteuning voor streaming en polling. U kunt de helperfuncties in onze Python SDK gebruiken om uitvoeringen te maken en antwoorden te streamen. We hebben ook polling SDK-helpers toegevoegd om objectstatusupdates te delen zonder dat er polling nodig is.
  • Experimenteer met Logic Apps en functie-aanroepen met behulp van Azure OpenAI Studio. Importeer uw REST API's die zijn geïmplementeerd in Logic Apps als functies en de studio roept automatisch de functie aan (als een Logic Apps-werkstroom) op basis van de gebruikersprompt.
  • AutoGen by Microsoft Research biedt een gespreksframework met meerdere agents om handige bouw van LLM-werkstromen (Large Language Model) mogelijk te maken voor een breed scala aan toepassingen. Azure OpenAI-assistenten zijn nu geïntegreerd in AutoGen via GPTAssistantAgenteen nieuwe experimentele agent waarmee u naadloos assistenten kunt toevoegen aan op AutoGen gebaseerde werkstromen voor meerdere agents. Hierdoor kunnen meerdere Azure OpenAI-assistenten worden gebruikt die taak of domein kunnen zijn om samen te werken en complexe taken aan te pakken.
  • Ondersteuning voor nauwkeurig afgestemde gpt-3.5-turbo-0125 modellen in de volgende regio's:
    • VS - oost 2
    • Zweden - centraal
  • Uitgebreide regionale ondersteuning voor:
    • Japan East
    • Verenigd Koninkrijk Zuid
    • VS - west
    • US - west 3
    • Noorwegen - oost

Zie het blogbericht over assistenten voor meer informatie.

GPT-4o model algemene beschikbaarheid (GA)

GPT-4o ("o is for "omni") is het nieuwste model van OpenAI gelanceerd op 13 mei 2024.

  • GPT-4o integreert tekst en afbeeldingen in één model, zodat het meerdere gegevenstypen tegelijk kan verwerken. Deze multimodale benadering verbetert de nauwkeurigheid en reactiesnelheid in interacties tussen menselijke computers.
  • GPT-4o komt overeen met GPT-4 Turbo in engelse tekst- en coderingstaken en biedt superieure prestaties in niet-Engelse talen en in vision-taken, waardoor nieuwe benchmarks voor AI-mogelijkheden worden ingesteld.

Zie de pagina modellen voor informatie over regionale beschikbaarheid van modellen.

Globaal standaardimplementatietype (preview)

Globale implementaties zijn beschikbaar in dezelfde Azure OpenAI-resources als niet-globale aanbiedingen, maar bieden u de mogelijkheid om de globale infrastructuur van Azure te gebruiken om verkeer dynamisch naar het datacenter te routeren met de beste beschikbaarheid voor elke aanvraag. Globale standaard biedt het hoogste standaardquotum voor nieuwe modellen en elimineert de noodzaak om taken te verdelen over meerdere resources.

Zie de handleiding voor implementatietypen voor meer informatie.

Updates afstemmen

Configureerbare inhoudsfilters van DALL-E en GPT-4 Turbo Vision GA

Maak aangepaste inhoudsfilters voor uw DALL-E 2 en 3, GPT-4 Turbo met Vision GA (turbo-2024-04-09) en GPT-4o-implementaties. Inhoud filteren

Asynchroon filter beschikbaar voor alle Azure OpenAI-klanten

Het asynchroon uitvoeren van filters voor verbeterde latentie in streamingscenario's is nu beschikbaar voor alle Azure OpenAI-klanten. Inhoud filteren

Promptschilden

Prompt Shields beschermt toepassingen die worden aangedreven door Azure OpenAI-modellen tegen twee soorten aanvallen: directe (jailbreak) en indirecte aanvallen. Indirecte aanvallen (ook wel indirecte promptaanvallen of aanvallen tussen domeinprompts genoemd) zijn een type aanval op systemen die mogelijk worden aangedreven door Generatieve AI-modellen die kunnen optreden wanneer een toepassing informatie verwerkt die niet rechtstreeks is geschreven door de ontwikkelaar van de toepassing of de gebruiker. Inhoud filteren

API-release 2024-05-01-preview

  • Zie de levenscyclus van de API-versie voor meer informatie.

GPT-4 Turbo model algemene beschikbaarheid (GA)

De nieuwste GA-release van GPT-4 Turbo is:

  • gpt-4Versie: turbo-2024-04-09

Dit is de vervanging voor de volgende preview-modellen:

  • gpt-4Versie: 1106-Preview
  • gpt-4Versie: 0125-Preview
  • gpt-4Versie: vision-preview

Verschillen tussen OpenAI en Azure OpenAI GPT-4 Turbo GA-modellen

  • OpenAI's versie van het nieuwste 0409 turbomodel ondersteunt JSON-modus en functie-aanroepen voor alle deductieaanvragen.
  • De versie van Azure OpenAI van de meest recente turbo-2024-04-09 versie biedt momenteel geen ondersteuning voor het gebruik van de JSON-modus en functie-aanroepen bij het maken van deductieaanvragen met afbeeldingsinvoer (vision). Invoeraanvragen op basis van tekst (aanvragen zonder image_url en inline-afbeeldingen) ondersteunen de JSON-modus en functie-aanroepen.

Verschillen met gpt-4 vision-preview

  • Integratie van azure AI-specifieke Vision-verbeteringen met GPT-4 Turbo met Vision wordt niet ondersteund voor gpt-4 versie: turbo-2024-04-09. Dit omvat Optical Character Recognition (OCR), objectaarding, videoprompts en verbeterde verwerking van uw gegevens met afbeeldingen.

Belangrijk

Preview-functies voor visuele verbeteringen, waaronder OCR (Optical Character Recognition), objectgronding, videoprompts worden buiten gebruik gesteld en zijn niet meer beschikbaar zodra gpt-4 versie: vision-preview wordt bijgewerkt naar turbo-2024-04-09. Als u momenteel afhankelijk bent van een van deze preview-functies, is deze automatische modelupgrade een belangrijke wijziging.

Beheerde beschikbaarheid van GPT-4 Turbo ingericht

  • gpt-4Versie: turbo-2024-04-09 is beschikbaar voor zowel standaard- als ingerichte implementaties. Momenteel biedt de ingerichte versie van dit model geen ondersteuning voor aanvragen voor afbeeldings-/visiondeductie. Ingerichte implementaties van dit model accepteren alleen tekstinvoer. Standaardmodelimplementaties accepteren zowel tekst- als afbeeldings-/visiondeductieaanvragen.

GPT-4 Turbo implementeren met Vision GA

Als u het GA-model wilt implementeren vanuit de gebruikersinterface van Studio, selecteert en kiest u GPT-4 vervolgens de turbo-2024-04-09 versie in de vervolgkeuzelijst. Het standaardquotum voor het gpt-4-turbo-2024-04-09 model is hetzelfde als het huidige quotum voor GPT-4-Turbo. Zie de regionale quotumlimieten.

April 2024

Fine-tuning wordt nu ondersteund in twee nieuwe regio's VS - oost 2 en Zwitserland - west

Het afstemmen is nu beschikbaar met ondersteuning voor:

VS - oost 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Zwitserland - west

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Controleer de modellenpagina voor de meest recente informatie over de beschikbaarheid van modellen en het afstemmen van ondersteuning in elke regio.

Voorbeelden van chattrainingen met meerdere bochten

Afstemming biedt nu ondersteuning voor trainingsvoorbeelden voor chats met meerdere bochten.

GPT-4 (0125) is beschikbaar voor Azure OpenAI op uw gegevens

U kunt nu het GPT-4-model (0125) gebruiken in beschikbare regio's met Azure OpenAI op uw gegevens.

Maart 2024

Risico's en veiligheidsbewaking in Azure OpenAI Studio

Azure OpenAI Studio biedt nu een risico- en veiligheidsdashboard voor elk van uw implementaties die gebruikmaken van een configuratie voor inhoudsfilters. Gebruik deze om de resultaten van de filteractiviteit te controleren. Vervolgens kunt u uw filterconfiguratie aanpassen om uw bedrijfsbehoeften beter te kunnen bedienen en te voldoen aan de principes voor verantwoorde AI.

Risico's en veiligheidsbewaking gebruiken

Azure OpenAI op uw gegevensupdates

  • U kunt nu verbinding maken met een Elasticsearch-vectordatabase die moet worden gebruikt met Azure OpenAI op uw gegevens.
  • U kunt de parameter segmentgrootte tijdens gegevensopname gebruiken om het maximum aantal tokens van een bepaald segment van gegevens in uw index in te stellen.

API voor algemene beschikbaarheid van 2024-02-01 (GA) uitgebracht

Dit is de nieuwste GA API-release en is de vervanging voor de vorige 2023-05-15 GA-release. In deze release wordt ondersteuning toegevoegd voor de nieuwste Functies van Azure OpenAI GA, zoals Whisper, DALLE-3, fine-tuning, op uw gegevens en meer.

Voor functies die in preview zijn, zoals assistenten, tekst-naar-spraak (TTS) en sommige gegevensbronnen voor 'op uw gegevens', is een preview-API-versie vereist. Raadpleeg onze levenscyclushandleiding voor API-versies voor meer informatie.

Algemene beschikbaarheid van Fluisteren (GA)

Het Fluisterse spraak-naar-tekstmodel is nu algemeen beschikbaar voor zowel REST als Python. Clientbibliotheek-SDK's zijn momenteel nog in openbare preview.

Fluisteren door een quickstart te volgen.

Algemene beschikbaarheid van DALL-E 3 (GA)

Het DALL-E 3-model voor het genereren van installatiekopieën is nu algemeen beschikbaar voor zowel REST als Python. Clientbibliotheek-SDK's zijn momenteel nog in openbare preview.

Probeer DALL-E 3 uit door een quickstart te volgen.

Nieuwe regionale ondersteuning voor DALL-E 3

U hebt nu toegang tot DALL-E 3 met een Azure OpenAI-resource in de East US of AustraliaEast Azure-regio, naast SwedenCentral.

Afschaffingen en buitengebruikstelling van modellen

We hebben een pagina toegevoegd om modelaftredingen en buitengebruikstelling bij te houden in Azure OpenAI Service. Deze pagina bevat informatie over de modellen die momenteel beschikbaar zijn, afgeschaft en buiten gebruik worden gesteld.

API 2024-03-01-preview uitgebracht

2024-03-01-preview heeft dezelfde functionaliteit als 2024-02-15-preview en voegt twee nieuwe parameters toe voor insluitingen:

  • encoding_format hiermee kunt u de indeling opgeven voor het genereren van insluitingen in float, of base64. De standaardwaarde is float.
  • dimensions hiermee kunt u het aantal insluitingen van uitvoer instellen. Deze parameter wordt alleen ondersteund met de nieuwe insluitingsmodellen van de derde generatie: text-embedding-3-large, text-embedding-3-small. Meestal zijn grotere insluitingen duurder vanuit reken-, geheugen- en opslagperspectief. Als u het aantal dimensies kunt aanpassen, hebt u meer controle over de totale kosten en prestaties. De dimensions parameter wordt niet ondersteund in alle versies van de OpenAI 1.x Python-bibliotheek om te profiteren van deze parameter. We raden u aan een upgrade uit te voeren naar de nieuwste versie: pip install openai --upgrade.

Als u momenteel een preview-API-versie gebruikt om te profiteren van de nieuwste functies, raden we u aan het artikel over de levenscyclus van de API-versie te raadplegen om bij te houden hoe lang uw huidige API-versie wordt ondersteund.

Update naar GPT-4-1106-Preview-upgradeplannen

De implementatie-upgrade van gpt-4 1106-Preview naar gpt-4 0125-Preview gepland voor 8 maart 2024 vindt niet meer plaats. Implementaties van gpt-4 versies 1106-Preview en 0125-Preview ingesteld op 'Automatisch bijwerken naar standaard' en 'Upgraden wanneer verlopen' wordt bijgewerkt nadat een stabiele versie van het model is uitgebracht.

Raadpleeg de pagina modellen voor meer informatie over het upgradeproces.

Februari 2024

GPT-3.5-turbo-0125 model beschikbaar

Dit model heeft verschillende verbeteringen, waaronder een hogere nauwkeurigheid bij het reageren in aangevraagde indelingen en een oplossing voor een fout die een tekstcoderingsprobleem veroorzaakte voor niet-Engelse functie-aanroepen.

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid en upgrades van het model.

Insluitingsmodellen van de derde generatie zijn beschikbaar

  • text-embedding-3-large
  • text-embedding-3-small

Bij het testen rapporteert OpenAI zowel de grote als de kleine derde generatie insluitingsmodellen betere gemiddelde prestaties van het ophalen van meerdere talen met de MIRACL-benchmark , terwijl nog steeds betere prestaties blijven behouden voor Engelse taken met de MTEB-benchmark dan het tweede generatie text-embedding-ada-002-model.

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid en upgrades van het model.

GPT-3.5 Turbo quotaconsolidatie

Ter vereenvoudiging van de migratie tussen verschillende versies van de GPT-3.5-Turbo-modellen (inclusief 16k), consolideren we alle GPT-3.5-Turbo-quota in één quotumwaarde.

  • Alle klanten die een verhoogd quotum hebben goedgekeurd, hebben een gecombineerd totaalquotum dat overeenkomt met de vorige verhogingen.

  • Elke klant waarvan het huidige totale gebruik in modelversies kleiner is dan de standaardwaarde, krijgt standaard een nieuw gecombineerd totaalquotum.

GPT-4-0125-preview model beschikbaar

De gpt-4 modelversie 0125-preview is nu beschikbaar in De Azure OpenAI-service in de regio's VS - oost, VS - noord-centraal en VS - zuid-centraal. Klanten met implementaties van gpt-4 de versie 1106-preview worden in de komende weken automatisch bijgewerkt naar 0125-preview .

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid en upgrades van het model.

Openbare preview van assistenten-API

Azure OpenAI ondersteunt nu de API die de GPT's van OpenAI aanroept. Met Azure OpenAI Assistants (preview) kunt u AI-assistenten maken die zijn afgestemd op uw behoeften via aangepaste instructies en geavanceerde hulpprogramma's zoals code-interpreter en aangepaste functies. Raadpleeg voor meer informatie:

Openbare preview van OpenAI-tekst naar spraakstemmen

Azure OpenAI Service ondersteunt nu tekst-naar-spraak-API's met de stemmen van OpenAI. Haal door AI gegenereerde spraak op uit de tekst die u opgeeft. Zie de overzichtshandleiding en probeer de quickstart voor meer informatie.

Notitie

Azure AI Speech ondersteunt ook OpenAI-tekst naar spraakstemmen. Zie OpenAI-tekst naar spraakstemmen via Azure OpenAI Service of via azure AI Speech Guide voor meer informatie.

Nieuwe mogelijkheden voor het afstemmen van modellen en modelondersteuning

Nieuwe regionale ondersteuning voor Azure OpenAI op uw gegevens

U kunt nu Azure OpenAI op uw gegevens gebruiken in de volgende Azure-regio:

  • Zuid-Afrika - noord

Algemene beschikbaarheid van Azure OpenAI voor uw gegevens

December 2023

Azure OpenAI op uw gegevens

  • Volledige ondersteuning voor VPN en privé-eindpunten voor Azure OpenAI op uw gegevens, waaronder beveiligingsondersteuning voor: opslagaccounts, Azure OpenAI-resources en Azure AI-Search-service-resources.
  • Nieuw artikel voor het veilig gebruiken van Azure OpenAI On Your Data door gegevens te beveiligen met virtuele netwerken en privé-eindpunten.

GPT-4 Turbo met Vision nu beschikbaar

GPT-4 Turbo with Vision in Azure OpenAI-service is nu in openbare preview. GPT-4 Turbo with Vision is een groot multimodale model (LMM) ontwikkeld door OpenAI dat afbeeldingen kan analyseren en tekstuele antwoorden kan geven op vragen over deze modellen. Het bevat zowel natuurlijke taalverwerking als visueel begrip. Met de verbeterde modus kunt u de Azure AI Vision-functies gebruiken om extra inzichten te genereren op basis van de afbeeldingen.

  • Verken de mogelijkheden van GPT-4 Turbo met Vision in een ervaring zonder code met behulp van de Azure OpenAI Playground. Meer informatie vindt u in de snelstartgids.
  • Visuele verbetering met GPT-4 Turbo met Vision is nu beschikbaar in de Azure OpenAI Playground en bevat ondersteuning voor optische tekenherkenning, objectgronding, ondersteuning voor afbeeldingen voor 'uw gegevens toevoegen' en ondersteuning voor videoprompt.
  • Maak rechtstreeks aanroepen naar de chat-API met behulp van de REST API.
  • Beschikbaarheid van regio's is momenteel beperkt totSwitzerlandNorth, SwedenCentralen WestUSAustraliaEast
  • Meer informatie over de bekende beperkingen van GPT-4 Turbo met Vision en andere veelgestelde vragen.

November 2023

Nieuwe ondersteuning voor gegevensbronnen in Azure OpenAI op uw gegevens

  • U kunt nu Azure Cosmos DB voor MongoDB vCore en URL's/webadressen gebruiken als gegevensbronnen om uw gegevens op te nemen en te chatten met een ondersteund Azure OpenAI-model.

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 uitgebracht

Beide modellen zijn de nieuwste versie van OpenAI met verbeterde instructies na, JSON-modus, reproduceerbare uitvoer en parallelle functie aanroepen.

  • GPT-4 Turbo Preview heeft een maximaal contextvenster van 128.000 tokens en kan 4096 uitvoertokens genereren. Het bevat de nieuwste trainingsgegevens met kennis tot april 2023. Dit model is in preview en wordt niet aanbevolen voor productiegebruik. Alle implementaties van dit preview-model worden automatisch bijgewerkt zodra de stabiele release beschikbaar is.

  • GPT-3.5-Turbo-1106 heeft een maximaal contextvenster van 16.385 tokens en kan 4.096 uitvoertokens genereren.

Raadpleeg de pagina modellen voor informatie over regionale beschikbaarheid van modellen.

De modellen hebben hun eigen unieke toewijzingen per regioquotum.

Openbare preview van DALL-E 3

DALL-E 3 is het nieuwste model voor het genereren van installatiekopieën van OpenAI. Het biedt verbeterde beeldkwaliteit, complexere scènes en verbeterde prestaties bij het weergeven van tekst in afbeeldingen. Het wordt ook geleverd met meer opties voor hoogte-breedteverhouding. DALL-E 3 is beschikbaar via OpenAI Studio en via de REST API. Uw OpenAI-resource moet zich in de SwedenCentral Azure-regio bevinden.

DALL-E 3 bevat ingebouwde promptherschrijven om afbeeldingen te verbeteren, vooroordelen te verminderen en natuurlijke variatie te vergroten.

Probeer DALL-E 3 uit door een quickstart te volgen.

Verantwoorde AI

  • Uitgebreide configureerbaarheid van klanten: alle Azure OpenAI-klanten kunnen nu alle ernstniveaus (laag, gemiddeld, hoog) configureren voor de categorieën haat, geweld, seksueel en zelfschade, waaronder het filteren van alleen inhoud met hoge ernst. Inhoudsfilters configureren

  • Inhoudsreferenties in alle DALL-E-modellen: door AI gegenereerde afbeeldingen van alle DALL-E-modellen bevatten nu een digitale referentie die de inhoud openbaar maakt als DOOR AI gegenereerd. Toepassingen die afbeeldingsassets weergeven, kunnen gebruikmaken van de open source Content Authenticity Initiative SDK om referenties weer te geven in hun door AI gegenereerde afbeeldingen. Referenties voor inhoud in Azure OpenAI

  • Nieuwe RAI-modellen

    • Jailbreak-risicodetectie: Jailbreak-aanvallen zijn gebruikersprompts die zijn ontworpen om het Generatieve AI-model te veroorzaken bij het vertonen van gedrag dat is getraind om de regels die zijn ingesteld in het systeembericht te vermijden of te verbreken. Het jailbreakrisicodetectiemodel is optioneel (standaard uitgeschakeld) en beschikbaar in aantekeningen en filtermodel. Deze wordt uitgevoerd op gebruikersprompts.
    • Beveiligde materiaaltekst: Beveiligde materiaaltekst beschrijft bekende tekstinhoud (bijvoorbeeld liedteksten, artikelen, recepten en geselecteerde webinhoud) die kan worden uitgevoerd door grote taalmodellen. Het beveiligde tekstmodel voor materiaal is optioneel (standaard uitgeschakeld) en beschikbaar in aantekeningen- en filtermodel. Deze wordt uitgevoerd op LLM-voltooiingen.
    • Beveiligde materiaalcode: met beveiligde materiaalcode wordt broncode beschreven die overeenkomt met een set broncode uit openbare opslagplaatsen, die kan worden uitgevoerd door grote taalmodellen zonder de juiste bronvermelding van bronopslagplaatsen. Het beveiligde materiaalcodemodel is optioneel (standaard uitgeschakeld) en beschikbaar in aantekeningen- en filtermodel. Deze wordt uitgevoerd op LLM-voltooiingen.

    Inhoudsfilters configureren

  • Blokkeringslijsten: Klanten kunnen nu snel het gedrag van inhoudsfilters aanpassen voor prompts en voltooiingen door een aangepaste blokkeringslijst in hun filters te maken. Met de aangepaste blokkeringslijst kan het filter actie ondernemen op een aangepaste lijst met patronen, zoals specifieke termen of regex-patronen. Naast aangepaste bloklijsten bieden we een blokkeringslijst voor Microsoft-grof taalgebruik (Engels). Blokkeringslijsten gebruiken

Oktober 2023

Nieuwe verfijningsmodellen (preview)

Azure OpenAI op uw gegevens

  • Nieuwe aangepaste parameters voor het bepalen van het aantal opgehaalde documenten en striktheid.
    • Met de strikte instelling wordt de drempelwaarde ingesteld voor het categoriseren van documenten als relevant voor uw query's.
    • De instelling voor opgehaalde documenten geeft het aantal topscoredocumenten op van uw gegevensindex die wordt gebruikt voor het genereren van antwoorden.
  • U kunt de status van gegevensopname/upload bekijken in Azure OpenAI Studio.
  • Ondersteuning voor privé-eindpunten en VPN's voor blobcontainers.

September 2023

GPT-4

GPT-4 en GPT-4-32k zijn nu beschikbaar voor alle Azure OpenAI Service-klanten. Klanten hoeven niet langer op de wachtlijst te wachten om GPT-4 en GPT-4-32k te gebruiken (de registratievereisten voor beperkte toegang blijven van toepassing op alle Azure OpenAI-modellen). De beschikbaarheid kan per regio verschillen. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

GPT-3.5 Turbo Instruct

Azure OpenAI Service ondersteunt nu het GPT-3.5 Turbo Instruct-model. Dit model heeft prestaties die vergelijkbaar zijn met text-davinci-003 en is beschikbaar voor gebruik met de Voltooiings-API. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Fluister openbare preview

Azure OpenAI Service biedt nu ondersteuning voor spraak-naar-tekst-API's, mogelijk gemaakt door het Whisper-model van OpenAI. Door AI gegenereerde tekst ophalen op basis van de spraakaudio die u opgeeft. Bekijk de quickstart voor meer informatie.

Notitie

Azure AI Speech ondersteunt ook het Whisper-model van OpenAI via de batchtranscriptie-API. Raadpleeg de handleiding Een batchtranscriptie maken voor meer informatie. Bekijk wat is het Fluistermodel? voor meer informatie over wanneer u Azure AI Speech versus Azure OpenAI Service gebruikt.

Nieuwe regio's

  • Azure OpenAI is nu ook beschikbaar in de regio's Zweden - centraal en Zwitserland - noord. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Verhogingen van regionale quotumlimieten

  • Hiermee worden de maximale standaardquotumlimieten voor bepaalde modellen en regio's verhoogd. Door workloads naar deze modellen en regio's te migreren, kunt u profiteren van hogere tokens per minuut (TPM).

Augustus 2023

Azure OpenAI op uw eigen gegevens (preview)-updates

Juli 2023

Ondersteuning voor functie-aanroepen

Toename invoermatrix insluiten

Nieuwe regio's

  • Azure OpenAI is nu ook beschikbaar in de regio's Canada - oost, VS - oost 2, Japan - oost en VS - noord-centraal. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Juni 2023

Azure OpenAI gebruiken op uw eigen gegevens (preview)

  • Azure OpenAI On Your Data is nu beschikbaar in preview, zodat u kunt chatten met OpenAI-modellen zoals GPT-35-Turbo en GPT-4 en antwoorden ontvangt op basis van uw gegevens.

Nieuwe versies van gpt-35-turbo- en gpt-4-modellen

  • gpt-35-turbo (versie 0613)
  • gpt-35-turbo-16k (versie 0613)
  • gpt-4 (versie 0613)
  • gpt-4-32k (versie 0613)

Verenigd Koninkrijk Zuid

  • Azure OpenAI is nu beschikbaar in de regio VK - zuid. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

Inhoud filteren en aantekeningen (preview)

  • Inhoudsfilters configureren met De Azure OpenAI-service.
  • Schakel aantekeningen in om inhoudsfiltercategorie en ernstgegevens weer te geven als onderdeel van uw op GPT gebaseerde voltooiings- en chatvoltooiingsgesprekken.

Quotum

Mei 2023

Ondersteuning voor Java & JavaScript SDK

  • NIEUWE Azure OpenAI Preview SDK's die ondersteuning bieden voor JavaScript en Java.

Algemene beschikbaarheid van Azure OpenAI-chats (GA)

  • Ondersteuning voor algemene beschikbaarheid voor:
    • Api-versie van 2023-05-15chatvoltooiing.
    • GPT-35-Turbo modellen.
    • GPT-4-modelserie.

Als u momenteel de 2023-03-15-preview API gebruikt, raden we u aan om te migreren naar de GA-API 2023-05-15 . Als u momenteel API-versie 2022-12-01 gebruikt, blijft deze API algemeen beschikbaar, maar bevat deze niet de nieuwste mogelijkheden voor chatten.

Belangrijk

Het gebruik van de huidige versies van de GPT-35-Turbo-modellen met het voltooiingseindpunt blijft in preview.

Frankrijk - centraal

  • Azure OpenAI is nu beschikbaar in de regio Frankrijk - centraal. Controleer de pagina modellen voor de meest recente informatie over de beschikbaarheid van modellen in elke regio.

April 2023

  • Openbare preview van DALL-E 2. Azure OpenAI Service ondersteunt nu API's voor het genereren van installatiekopieën, mogelijk gemaakt door het DALL-E 2-model van OpenAI. Haal door AI gegenereerde afbeeldingen op op basis van de beschrijvende tekst die u opgeeft. Bekijk de quickstart voor meer informatie.

  • Inactieve implementaties van aangepaste modellen worden nu na 15 dagen verwijderd; modellen blijven beschikbaar voor opnieuw implementeren. Als een aangepast (afgestemd) model gedurende meer dan vijftien (15) dagen wordt geïmplementeerd waarin er geen aanroepen voor voltooiingen of chats worden gedaan, wordt de implementatie automatisch verwijderd (en worden er geen verdere hostingkosten in rekening gebracht voor die implementatie). Het onderliggende aangepaste model blijft beschikbaar en kan op elk gewenst moment opnieuw worden geïmplementeerd. Raadpleeg het artikel voor meer informatie.

Maart 2023

  • GPT-4-seriemodellen zijn nu beschikbaar in preview op Azure OpenAI. Als u toegang wilt aanvragen, kunnen bestaande Azure OpenAI-klanten van toepassing zijn door dit formulier in te vullen. Deze modellen zijn momenteel beschikbaar in de regio's VS - oost en VS - zuid-centraal.

  • Nieuwe API voor voltooiing van chat voor GPT-35-Turbo- en GPT-4-modellen die zijn uitgebracht in preview op 3/21. Bekijk de bijgewerkte quickstarts en procedures voor meer informatie.

  • GPT-35-Turbo preview. Bekijk het artikel voor meer informatie.

  • Verhoogde trainingslimieten voor het afstemmen: de maximale grootte van de trainingstaak (tokens in trainingsbestand) x (# van tijdvakken) is 2 miljard tokens voor alle modellen. We hebben ook de maximale trainingstaak verhoogd van 120 tot 720 uur.

  • Aanvullende use cases toevoegen aan uw bestaande toegang. Voorheen vereist het proces voor het toevoegen van nieuwe gebruiksvoorbeelden dat klanten opnieuw moeten worden toegepast op de service. Nu brengen we een nieuw proces uit waarmee u snel nieuwe use cases kunt toevoegen aan uw gebruik van de service. Dit proces volgt het tot stand gebrachte proces voor beperkte toegang binnen Azure AI-services. Bestaande klanten kunnen hier alle nieuwe gebruiksvoorbeelden bevestigen. Houd er rekening mee dat dit vereist is wanneer u de service wilt gebruiken voor een nieuwe use case waarvoor u oorspronkelijk geen aanvraag hebt gedaan.

2023 februari

Nieuwe functies

Updates

  • Inhoudsfiltering is standaard ingeschakeld.

Nieuwe artikelen over:

Nieuwe trainingscursus:

Januari 2023

Nieuwe functies

  • Ga naar service. De Azure OpenAI-service is nu algemeen beschikbaar.

  • Nieuwe modellen: Toevoeging van het nieuwste tekstmodel, text-davinci-003 (VS - oost, Europa - west), text-ada-embeddings-002 (VS - oost, VS - zuid-centraal, Europa - west)

December 2022

Nieuwe functies

  • De nieuwste modellen van OpenAI. Azure OpenAI biedt toegang tot alle nieuwste modellen, waaronder de GPT-3.5-serie.

  • Nieuwe API-versie (2022-12-01). Deze update bevat verschillende aangevraagde verbeteringen, waaronder tokengebruiksgegevens in het API-antwoord, verbeterde foutberichten voor bestanden, afstemming met OpenAI op het verfijnen van de gegevensstructuur voor het maken van gegevens en ondersteuning voor de parameter achtervoegsel om aangepaste namen van nauwkeurig afgestemde taken toe te staan. ​

  • Hogere aanvraaglimieten per seconde. 50 voor niet-Davinci-modellen. 20 voor Davinci-modellen.

  • Snellere implementaties afstemmen. Implementeer in minder dan 10 minuten een nauwkeurig afgestemde Ada- en Curie-modellen.

  • Hogere trainingslimieten: 40M trainingstokens voor Ada, Babbage en Curie. 10M voor Davinci.

  • Proces voor het aanvragen van wijzigingen aan het misbruik en miss-use gegevenslogboeken en menselijke beoordeling. Vandaag de dag registreert de service aanvraag-/antwoordgegevens voor misbruik en misbruikdetectie om ervoor te zorgen dat deze krachtige modellen niet worden misbruikt. Veel klanten hebben echter strikte vereisten voor gegevensprivacy en beveiliging die meer controle over hun gegevens vereisen. Ter ondersteuning van deze use cases brengen we een nieuw proces uit voor klanten om het beleid voor inhoudsfiltering te wijzigen of de logboekregistratie voor misbruik uit te schakelen voor use cases met een laag risico. Dit proces volgt het tot stand gebrachte proces voor beperkte toegang binnen Azure AI-services en bestaande OpenAI-klanten kunnen hier van toepassing zijn.

  • Cmk-versleuteling (door de klant beheerde sleutel). CMK biedt klanten meer controle over het beheren van hun gegevens in Azure OpenAI door hun eigen versleutelingssleutels op te geven die worden gebruikt voor het opslaan van trainingsgegevens en aangepaste modellen. Door de klant beheerde sleutels (CMK), ook wel bekend als BYOK (Bring Your Own Key), bieden meer flexibiliteit bij het maken, roteren, uitschakelen en intrekken van toegangsbeheer. U kunt ook de versleutelingssleutels controleren die worden gebruikt voor het beveiligen van uw gegevens. Meer informatie vindt u in onze documentatie over versleuteling-at-rest.

  • Ondersteuning voor Lockbox

  • SOC-2-naleving

  • Logboekregistratie en diagnostische gegevens via Azure Resource Health, Kostenanalyse en Metrische gegevens & Diagnostische instellingen.

  • Studio-verbeteringen. Talloze bruikbaarheidsverbeteringen in de Studio-werkstroom, waaronder ondersteuning voor Azure AD-rollen, om te bepalen wie in het team toegang heeft om nauwkeurig afgestemde modellen te maken en te implementeren.

Wijzigingen (fouten)

Het maken van een API-aanvraag is bijgewerkt zodat deze overeenkomt met het schema van OpenAI.

Preview-API-versies:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API-versie 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

Inhoudsfiltering is standaard tijdelijk uitgeschakeld . Azure-con tentmodus ration werkt anders dan Azure OpenAI. Azure OpenAI voert inhoudsfilters uit tijdens de generatieoproep om schadelijke of beledigende inhoud te detecteren en te filteren op basis van het antwoord. Meer informatie

Deze modellen worden opnieuw ingeschakeld in Q1 2023 en zijn standaard ingeschakeld. ​

Klantacties

Volgende stappen

Meer informatie over de onderliggende modellen die Azure OpenAI mogelijk maken.