Récupérer les détails d’une page Web
L’extraction d’informations sur les pages Web est une fonction essentielle dans la plupart des flux web. L’action Obtenir les détails de la page Web vous permet de récupérer divers détails à partir de pages Web et de les traiter dans vos flux de bureau.
Pour utiliser l’action, vous avez besoin d’une instance de navigateur déjà créée qui spécifie la page Web dont vous souhaitez extraire les détails. Une instance de navigateur peut être créée avec n’importe quelle action de lancement du navigateur.
Après avoir sélectionné l’instance de navigateur appropriée, choisissez les informations que vous souhaitez extraire de la page Web. L’action Obtenir les détails de la page Web propose six options différentes :
- La description de la page Web
- Les méta mots de la page Web
- Le titre de la page Web
- Le texte de la page Web
- Le code source de la page Web
- L’adresse URL de la page Web
Les informations récupérées sont stockées pour une utilisation ultérieure dans une variable de texte nommée WebPageProperty.
Éviter les erreurs lors de la récupération des détails
Bien que la plupart des propriétés existent pratiquement sur chaque page Web, il existe des scénarios dans lesquels l’action Obtenir les détails de la page Web ne parvient pas à récupérer le détail sélectionné. Par exemple, les pages Web sans méta mots sont monnaie courante.
Si vous ne savez pas si un attribut existe sur une page Web, configurez les options En cas d’erreur de l’action Obtenir les détails de la page Web pour continuer à exécuter le flux après un échec. Pour plus d’informations sur la gestion des erreurs d’action, reportez-vous à Gérer les erreurs dans les flux de bureau.
Pour déterminer si l’extraction des données a réussi, utilisez un conditionnel Si afin de vérifier si la variable WebPageProperty est vide ou non.
Le conditionnel vous permet d’implémenter différentes fonctionnalités pour les cas d’extraction de données réussie et non réussie. Vous pouvez trouver plus d’informations sur les conditions dans Utiliser des conditions.
L’exemple de sous-flux suivant récupère les méta mots disponibles à partir d’une page Web et les affiche dans une boîte de message. Si l’extraction échoue, le flux s’arrête et renvoie un message d’erreur.