Partager via


Découvrez comment générer des incorporations avec Azure OpenAI

Une incorporation est un format spécial de représentation des données qui peut être facilement utilisé par les modèles et algorithmes Machine Learning. L’incorporation est une représentation dense d’informations de la signification sémantique d’un morceau de texte. Chaque incorporation est un vecteur de nombres à virgule flottante, de sorte que la distance entre deux incorporations dans l’espace vectoriel est corrélée avec la similitude sémantique entre deux entrées au format d’origine. Par exemple, si deux textes sont similaires, leurs représentations vectorielles doivent également être similaires. Les incorporations optimisent la recherche vectorielle par similarité dans les services Azure Database, par exemple Azure Cosmos DB for MongoDB vCore, Azure SQL Database ou Azure Database pour PostgreSQL - Serveur flexible.

Comment obtenir des incorporations

Pour obtenir un vecteur d’incorporation pour un morceau de texte, nous effectuons une demande au point de terminaison d’incorporations, comme indiqué dans les extraits de code suivants :

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Bonnes pratiques

Vérifier que les entrées ne dépassent pas la longueur maximale

  • La longueur maximale du texte d’entrée pour nos modèles d’incorporation les plus récents est de 8 192 jetons. Vous devez vérifier que vos entrées ne dépassent pas cette limite avant d’effectuer une demande.
  • Si vous envoyez un tableau d’entrées dans une seule requête d’incorporation, la taille maximale du tableau est de 2048.
  • Lors de l’envoi d’un tableau d’entrées dans une seule requête, n’oubliez pas que le nombre de jetons par minute dans vos requêtes doit rester inférieur à la limite de quota affectée au déploiement du modèle. Par défaut, les derniers modèles d’incorporation de génération 3 sont soumis à une limite de 350 000 jetons par minute par région.

Limitations et risques

Nos modèles d’incorporation peuvent être peu fiables ou poser des risques sociaux dans certains cas, et peuvent causer des dommages en l’absence d’atténuations. Consultez notre contenu d’IA responsable pour plus d’informations sur l’approche de leur utilisation responsable.

Étapes suivantes