Obter detalhes a partir de uma página Web
Extrair informações relacionadas com páginas Web é uma função essencial na maioria dos fluxos relacionados com Web. A ação Obter detalhes de página Web permite-lhe obter vários detalhes de páginas Web e processá-los nos seus fluxos de ambiente de trabalho.
Para utilizar a ação, precisa de uma instância de browser já criada que especifica a página Web da qual pretende extrair detalhes. Uma instância de browser pode ser criada com qualquer ação de lançamento do browser.
Depois de selecionar a instância de browser adequada, escolha as informações que pretende extrair da página Web. A ação Obter detalhes de uma página Web oferece seis opções diferentes:
- A descrição da página Web
- As metapalavras-chave da página Web
- O título da página Web
- O texto da página Web
- O código fonte da página Web
- O endereço URL da página Web
A informação obtida é armazenada para utilização posterior numa variável de texto denominada WebPageProperty.
Evitar erros ao obter os detalhes
Apesar de a maioria das propriedades existir praticamente em cada página Web, existem cenários em que a ação Obter detalhes de uma página Web falha ao obter o detalhe selecionado. Por exemplo, as páginas Web sem metapalavras-chave são uma ocorrência comum.
Se não tiver a certeza se existe um atributo numa página Web, configure as opções Em caso de erro da ação Obter detalhes de uma página Web para continuar a executar o fluxo pós-falha. Para obter mais informações sobre o processamento de erros de ação, consulte Processar erros em fluxos de ambiente de trabalho.
Para determinar se a extração de dados é concluída com êxito, utilize um condicional Se para verificar se a variável WebPageProperty está ou não vazia.
O condicional permite implementar diferentes funcionalidades para os casos de extração de dados concluída com e sem êxito. Pode encontrar mais informações sobre condicionais em Utilizar condicionais.
O seguinte subfluxo de exemplo obtém as metapalavras-chave disponíveis a partir de uma página Web e apresenta-as numa caixa de mensagens. Se a extração não for concluída com êxito, o fluxo para e devolve uma mensagem de erro.