Extraire les phrases clés

Effectué

L’extraction de phrases clés est une fonctionnalité fournie par Azure AI Language. Elle identifie les phrases clés, ou concepts principaux, dans le texte.

Il existe plusieurs façons d’appeler l’API d’extraction de phrases clés. Ici, vous utilisez l’extension azure_ai pour extraire les phrases clés des requêtes SQL.

Prérequis

Vous avez besoin d’une instance d’Azure Database pour PostgreSQL - Serveur flexible, avec l’extension azure_ai activée et configurée. Vous devez également l’autoriser auprès d’Azure Cognitive Services en définissant la clé et le point de terminaison d’une ressource Language.

Scénarios

L’extraction de phrases clés s’applique à diverses tâches :

  • Résumé : Utilisez des phrases clés pour condenser de longs documents en sujets essentiels, par exemple afin d’identifier les sujets abordés dans des transcriptions audio ou des notes de réunion.
  • Catégorisation du contenu : Utilisez des phrases clés pour indexer les documents à des fins de recherche et de navigation. Les phrases clés peuvent également être utilisées pour visualiser des documents dans des nuages de mots.
  • Clustering de documents : De vastes collections de tickets de support, d’évaluations de produits et d’autres entrées non structurées peuvent être regroupées en cluster et analysées à l’aide de phrases clés.

Utilisation du SQL pour l’extraction de phrases clés avec Azure Cognitive Services

L’extension azure_ai d’Azure Database pour PostgreSQL - Serveur flexible fournit des fonctions définies par l’utilisateur pour accéder aux fonctionnalités IA directement à partir du code SQL. L’API d’extraction de phrases clés est accessible avec la fonction azure_cognitive.extract_key_phrases :

azure_cognitive.extract_key_phrases(
 text TEXT,
 language TEXT,
 timeout_ms INTEGER DEFAULT 3600000,
 throw_on_error BOOLEAN DEFAULT TRUE,
 disable_service_logs BOOLEAN DEFAULT FALSE
)

Les paramètres obligatoires sont text, l’entrée, et language, la langue dans laquelle text est écrit. Par exemple, en-us correspond à l’anglais américain, et fr au français. Consultez prise en charge linguistique pour obtenir la liste complète des langues disponibles.

Par défaut, l’extraction de phrases clés est arrêtée si elle n’est pas terminée au bout de 3 600 000 ms, soit une heure. Vous pouvez personnaliser ce délai en changeant timeout_ms.

Si une erreur se produit, le comportement par défaut consiste à lever une exception, ce qui entraîne une restauration de transaction. Vous pouvez désactiver ce comportement en affectant la valeur false à throw_on_error.

Consultez la documentation de l’extension Azure Cognitive Services pour obtenir une documentation complète sur les paramètres.

Par exemple, l’appel de cette requête :

SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');

Donne ce résultat :

 extract_key_phrases 
---------------------
 {food,staff}

Vous pouvez utiliser des colonnes de table pour le texte d’entrée :

SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;

Qui retourne (avec \x activé pour l’affichage étendu) :

description    | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}

Résumé

L’extraction de phrases clés sélectionne les concepts principaux dans le texte. Le modèle de langage d’Azure Cognitive Services est chargé de réduire le langage naturel à des mots clés ou phrases clés. L’extension azure_ai d’Azure Database pour PostgreSQL fournit l’API azure_cognitive.extract_key_phrases pour accéder à l’extraction de phrases clés directement au sein des requêtes SQL.