Extraire les phrases clés d’un texte
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Extrait des expressions clés du texte donné
catégorie : Analyse de texte
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Vue d’ensemble du module
cet article explique comment utiliser le module extraire des expressions clés du module de texte dans Machine Learning Studio (classic) pour prétraiter une colonne de texte. À partir d’une colonne de texte en langage naturel, le module extrait une ou plusieurs expressions explicites. Une expression peut être un mot unique, un nom composé ou un modificateur plus un nom.
Ce module est un wrapper pour les API de traitement en langage naturel pour l’extraction de phrases clés. Les expressions sont analysées comme potentiellement significatives dans le contexte de la phrase pour diverses raisons :
- L’expression capture la rubrique de la phrase.
- L’expression contient une combinaison de modificateur et de nom qui indique le sentiment.
Par exemple, supposons que la phrase analysée est : « il s’agissait d’un joyeux hôtel pour rester, avec un personnel décor et convivial ».
Le module extraire les expressions clés du module Text peut renvoyer les expressions clés suivantes :
- Hôtel merveilleux
- personnel convivial
- décor unique
Comment configurer l’extraction d’expressions clés à partir d’un texte
Pour extraire des expressions clés, vous devez connecter un jeu de données qui contient une colonne de texte.
ajoutez l' extrait des expressions clés du module Text à votre expérience dans Machine Learning Studio (classic). Ensuite, connectez un DataSet qui possède au moins une colonne de texte intégral.
Utilisez le sélecteur de colonne pour sélectionner une colonne de type chaîne, à partir de laquelle extraire les expressions clés.
Pour langue, sélectionnez une langue à utiliser lors de l’analyse des expressions. Si vous spécifiez une langue, seules les expressions de la langue cible seront générées.
Si la colonne de texte contient des expressions dans plusieurs langues, choisissez l’option langue identifiée dans les colonnes. Un nouveau sélecteur de colonne s’affiche pour vous permettre de sélectionner une colonne dans votre jeu de données qui contient un identificateur de langue. L’identificateur de langue peut être soit le nom de la langue, soit l’identificateur de culture Iso6391. Par exemple, soit « English » soit « fr » sont acceptables.
Conseil
Avant d’exécuter, vous pouvez extraire des expressions clés du texteà l’aide du module détecter les langues pour identifier la langue de chaque ligne et générer l’identificateur pour vous. Une erreur est générée si la colonne d’identificateur de langue contient des langues non prises en charge par l' extraction d’expressions clés du texte.
Résultats
La sortie du module est un jeu de données contenant une colonne de phrases clés séparées par des virgules.
Par exemple, les résultats de l’exemple suivant concernent un jeu de données d’entrée contenant des révisions dans plusieurs langues :
Expressions clés |
---|
nouveau, sous-marin nucléaire, livre, aventure Story, avalanche d’événements, bons caractères |
premier Misterio, personajes, fan, Aventura, Isla |
Toutes les expressions de sortie sont contenues dans une seule colonne ; aucune autre colonne n’est passée, et aucun identificateur n’est ajouté. Toutefois, si vous souhaitez aligner les expressions de sortie avec le texte source, vous pouvez recombiner les expressions de sortie avec l’entrée à l’aide du module Ajouter des colonnes .
La sortie de l’extraction d’expressions clés ne marque pas la langue des expressions individuelles.
Si une langue qui n’est pas prise en charge par le module extraire les expressions clés est incluse, une erreur est générée (0039). Pour éviter les erreurs, veillez à filtrer le texte d’entrée dont l’identificateur de langage est incompatible.
S’il y a très peu de lignes d’autres langues, vous pouvez également éviter l’erreur en omettant l’identificateur de langue et en analysant tout le texte à l’aide d’une sélection de langue unique. Toutefois, dans ce cas, les résultats sont très médiocres, car les phrases entières dans les autres langages peuvent être générées en tant qu’expression clé unique.
Exemples
L’exemple suivant montre comment utiliser ce module pour extraire des expressions clés et créer un Cloud Word à partir des expressions suivantes : extraire des expressions clés et afficher le Cloud Word
Pour plus d’exemples de traitement de texte à l’aide de Machine Learning, consultez l' Azure ai Gallery .
Notes techniques
Ce module prend actuellement en charge les langues suivantes :
- Néerlandais
- Anglais
- Français
- Allemand
- Italien
- Espagnol
pour d’autres langues, envisagez d’utiliser l' API Analyse de texte dans Azure Cognitive Services. pour plus d’informations, consultez comment extraire des expressions clés dans Analyse de texte
Entrées attendues
Nom | Type | Description |
---|---|---|
Dataset | Table de données | Table contenant le texte à traiter. |
Paramètres du module
Nom | Type | Plage | Facultatif | Default | Description |
---|---|---|---|---|---|
Colonne langue de la culture | ColumnSelection | langue : la colonne contient la langue | Nom ou index de base un de la colonne contenant les informations sur la langue de la culture | ||
Colonne de texte | ColumnSelection | Obligatoire | Nom ou index de base un de la colonne de texte. | ||
Language | T_Language | L’anglais, l’espagnol, le français, le néerlandais, l’allemand, l’italien, la colonne contient la langue | Obligatoire | Anglais | Sélectionnez la langue du texte à traiter. |
Sorties
Nom | Type | Description |
---|---|---|
Jeu de données de résultats | Table de données | Expressions clés extraites |
Exceptions
Exception | Description |
---|---|
Erreur 0003 | Cette exception se produit si une ou plusieurs entrées sont null ou vide. |
Erreur 0010 | Une exception se produit si les jeux de données d’entrée possèdent des noms de colonnes qui ne correspondent pas alors qu’ils le devraient correspondre. |
Erreur 0016 | Une exception se produit si des jeux de données d’entrée transmis au module possèdent des types de colonnes incompatibles les uns avec les autres. |
Erreur 0008 | Une exception se produit si le paramètre n’est pas dans la plage. |
pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.
pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.