Qu’est-ce que le classement sémantique ?

Effectué

Le classement sémantique est une fonctionnalité dans la Recherche Azure AI qui vise à améliorer le classement des résultats de recherche. Le classement sémantique améliore le classement des résultats de la recherche en utilisant la compréhension du langage pour mieux correspondre au contexte de la requête originale.

Fonction de classement BM25

Recherche Azure AI utilise la fonction de classement BM25, par défaut. La fonction de classement BM25 classe les résultats de la recherche en fonction de la fréquence d'apparition du terme recherché dans un document. La fonction de classement BM25 permet souvent d'obtenir d'excellents résultats, car un document qui contient fréquemment un terme de recherche est souvent le plus pertinent, mais ce n'est pas toujours le cas. Le classement BM25 n'accorde aucune importance à la sémantique de la requête et le classement peut parfois être amélioré en ajoutant la compréhension de la langue.

Classement sémantique

Le classement sémantique a deux fonctions : il améliore le classement des résultats de la requête sur la base de la compréhension de la langue et il améliore la réponse à la requête en fournissant des légendes et des réponses dans les résultats.

Le classement sémantique utilise le classement BM25 et calcule un nouveau score de pertinence en utilisant le classement BM25 original combiné à des modèles de compréhension du langage pour extraire le contexte et le sens de la requête.

Légendes sémantiques et réponses

Les légendes et réponses sémantiques fournissent des résultats supplémentaires à côté des résultats de recherche classés que vous pouvez afficher pour améliorer la compréhension des résultats pour les utilisateurs.

Les légendes sémantiques extraient textuellement les phrases de résumé du document et mettent en évidence le texte le plus pertinent dans les phrases de résumé.

Les réponses sémantiques sont une fonctionnalité facultative de classement sémantique qui fournit des réponses aux questions. Si la requête semble être une question et que les résultats de la recherche contiennent un texte qui semble être une réponse pertinente, la réponse sémantique est renvoyée.

Fonctionnement du classement sémantique

Le classement sémantique prend les 50 premiers résultats des résultats du classement BM25. Les résultats sont divisés en plusieurs champs, comme défini par une configuration sémantique. Les champs sont convertis en chaînes de texte et rognés en 256 jetons uniques. Un jeton équivaut approximativement à un mot dans le document.

Une fois les chaînes préparées, elles sont transmises à des modèles de compréhension de la lecture automatique afin de trouver les expressions et les phrases qui correspondent le mieux à la requête. Les résultats de cette expression de synthèse sont une légende sémantique et, éventuellement, une réponse sémantique.

Les légendes sémantiques sont désormais classées en fonction de la pertinence sémantique de la légende. Les résultats sont ensuite retournés dans l’ordre décroissant de pertinence.

Fonctionnalités de classement sémantique

Consultez la vidéo suivante pour obtenir une vue d’ensemble des fonctionnalités de recherche IA :

Avantages du classement sémantique

Le classement sémantique présente deux avantages clés par rapport aux résultats de recherche traditionnels :

  • Le classement sémantique permet de classer les résultats de manière à ce qu'ils correspondent davantage à la sémantique de la requête initiale. Cela peut rendre plus probable les documents les plus utiles qui apparaissent en haut des résultats de recherche.
  • Le classement sémantique permet de trouver des chaînes de caractères dans les résultats afin de les afficher sous forme de légende sur la page des résultats de la recherche et de fournir une réponse à une question.

Limitations du classement sémantique

Le classement sémantique est appliqué aux résultats retournés par la fonction de classement BM25. Bien que le classement sémantique puisse reclasser les résultats fournis par la fonction de classement BM25, elle ne fournira pas de documents supplémentaires qui n'ont pas été retournés par la fonction de classement BM25.

Le classement sémantique utilise les 50 premiers résultats de la fonction de classement BM25. Si plus de 50 résultats sont retournés, seuls les 50 premiers résultats sont pris en compte.

Tarification du classement sémantique

Jusqu’à 1000 requêtes de classement sémantique par mois sont disponibles gratuitement.

Pour plus de 1 000 requêtes par mois, vous devez choisir la tarification standard. Le coût de la tarification standard est basé sur le volume de recherches, le type de recherche et la région de la recherche.

Pour plus d’informations sur la tarification du classement sémantique, consultez l’article Tarification de la Recherche Azure AI