Découvrez comment générer des incorporations avec Azure OpenAI
Une incorporation est un format spécial de représentation des données qui peut être facilement utilisé par les modèles et algorithmes Machine Learning. L’incorporation est une représentation dense d’informations de la signification sémantique d’un morceau de texte. Chaque incorporation est un vecteur de nombres à virgule flottante, de sorte que la distance entre deux incorporations dans l’espace vectoriel est corrélée avec la similitude sémantique entre deux entrées au format d’origine. Par exemple, si deux textes sont similaires, leurs représentations vectorielles doivent également être similaires. Les incorporations optimisent la recherche vectorielle par similarité dans les services Azure Database, par exemple Azure Cosmos DB for MongoDB vCore, Azure SQL Database ou Azure Database pour PostgreSQL - Serveur flexible.
Comment obtenir des incorporations
Pour obtenir un vecteur d’incorporation pour un morceau de texte, nous effectuons une demande au point de terminaison d’incorporations, comme indiqué dans les extraits de code suivants :
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
Bonnes pratiques
Vérifier que les entrées ne dépassent pas la longueur maximale
- La longueur maximale du texte d’entrée pour nos modèles d’incorporation les plus récents est de 8 192 jetons. Vous devez vérifier que vos entrées ne dépassent pas cette limite avant d’effectuer une demande.
- Si vous envoyez un tableau d’entrées dans une seule requête d’incorporation, la taille maximale du tableau est de 2048.
- Lors de l’envoi d’un tableau d’entrées dans une seule requête, n’oubliez pas que le nombre de jetons par minute dans vos requêtes doit rester inférieur à la limite de quota affectée au déploiement du modèle. Par défaut, les derniers modèles d’incorporation de génération 3 sont soumis à une limite de 350 000 jetons par minute par région.
Limitations et risques
Nos modèles d’incorporation peuvent être peu fiables ou poser des risques sociaux dans certains cas, et peuvent causer des dommages en l’absence d’atténuations. Consultez notre contenu d’IA responsable pour plus d’informations sur l’approche de leur utilisation responsable.
Étapes suivantes
- Découvrez-en plus sur l’utilisation d’Azure OpenAI et des incorporations pour effectuer une recherche de documents, consultez notre tutoriel sur les incorporations.
- Découvrez-en plus sur les modèles sous-jacents d’Azure OpenAI.
- Stockez vos incorporations et effectuez une recherche vectorielle (similarité) à l’aide du service de votre choix :
- Azure AI Search
- Azure Cosmos DB for MongoDB vCore
- Azure SQL Database
- Azure Cosmos DB pour NoSQL
- Azure Cosmos DB pour PostgreSQL
- Azure Database pour PostgreSQL - Serveur flexible
- Cache Azure pour Redis
- Utiliser Eventhouse comme base de données vectorielle – Intelligence en temps réel dans Microsoft Fabric