Compartilhar via


Extrair as frases-chave do texto

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

Extrai frases-chave de determinado texto

Categoria: Análise de Texto

Observação

Aplica-se a: Machine Learning Studio (clássico) somente

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

Visão geral do módulo

Este artigo explica como usar o módulo Extrair Frases-Chave de Texto no Machine Learning Studio (clássico) para pré-processar uma coluna de texto. Dado uma coluna de texto em idioma natural, o módulo extrai uma ou mais frases significativas. Uma frase pode ser uma única palavra, um substantivo composto ou um modificador mais um substantivo.

Este módulo é um wrapper para APIs de processamento de linguagem natural para extração de frase-chave. As frases são analisadas como potencialmente significativas no contexto da frase por vários motivos:

  • A frase captura o tópico da frase.
  • A frase contém uma combinação de modificador e substantivo que indica sentimento.

Por exemplo, suponha que a frase analisada seja: "Foi um hotel incrível permanecer, com uma equipe amigável e decoração exclusiva".

O módulo Extrair Frases-Chave de Texto pode retornar estas frases-chave:

  • hotel incrível
  • equipe amigável
  • exclusivo

Como configurar a extração de frases-chave de texto

Para extrair frases-chave, você deve conectar um conjuntos de dados que tenha uma coluna de texto.

  1. Adicione o módulo Extrair Frases-Chave de Texto ao seu experimento no Machine Learning Studio (clássico). Em seguida, conecte um conjuntos de dados que tenha pelo menos uma coluna de texto completo.

  2. Use o Seletor de Coluna para selecionar uma coluna do tipo cadeia de caracteres, da qual extrair frases-chave.

  3. Para Idioma, selecione um idioma a ser usado ao analisar frases. Se você especificar um idioma, somente frases no idioma de destino serão saída.

  4. Se a coluna de texto contiver frases em vários idiomas, escolha a opção Idioma identificado em colunas. Um novo seletor de coluna é exibido que permite selecionar uma coluna no conjunto de dados que contém um identificador de idioma. O identificador de idioma pode ser o nome do idioma ou o identificador de cultura Iso6391. Por exemplo, "inglês" ou "en" são aceitáveis.

    Dica

    Antes de executar Extrair Frases-Chave de Texto, use o módulo Detectar Idiomas para identificar o idioma em cada linha e gerar o identificador para você. Um erro será gerado se a coluna do identificador de idioma contiver idiomas sem suporte em Extrair Frases-Chave de Texto.

Resultados

A saída do módulo é um conjuntos de dados que contém uma coluna de frases-chave separadas por vírgulas.

Por exemplo, os seguintes resultados de exemplo são para um conjuntos de dados de entrada que contém revisões em vários idiomas:

Frases-chave
novel, reserve, good book, adventure story, ltda de eventos, bons caracteres
primer primerio,personajes, fan,áo, isla
  • Todas as frases de saída estão contidas em uma única coluna; nenhuma outra coluna é passada e um identificador não é adicionado. No entanto, se você quiser alinhar as frases de saída com o texto de origem, poderá recombinar as frases de saída com a entrada usando o módulo Adicionar Colunas .

  • A saída da extração de frase-chave não sinaliza o idioma de frases individuais.

  • Se um idioma for incluído sem suporte no módulo Extrair Frases-Chave , um erro será gerado (0039). Para evitar erros, filtre o texto de entrada que tenha um identificador de idioma incompatível.

    Se houver poucas linhas de outros idiomas, você também poderá evitar o erro omitindo o identificador de idioma e analisando todo o texto usando uma única seleção de idioma. No entanto, quando você faz isso, os resultados são muito ruins, porque frases inteiras em outros idiomas podem ser saída como uma única frase-chave.

Exemplos

O exemplo a seguir demonstra como usar este módulo para extrair frases-chave e, em seguida, criar uma nuvem de palavras das frases: Extrair frases-chave e mostrar a nuvem de palavras

Consulte a Galeria de IA do Azure para obter mais exemplos de processamento de texto usando Machine Learning.

Observações técnicas

Atualmente, este módulo dá suporte aos seguintes idiomas:

  • Holandês
  • Inglês
  • Francês
  • Alemão
  • Italiano
  • Espanhol

Para idiomas adicionais, considere o uso da API Análise de Texto em Serviços Cognitivos do Azure. Para obter mais informações, consulte Como extrair frases-chave em Análise de Texto

Entradas esperadas

Nome Tipo Descrição
Dataset Tabela de Dados A tabela que contém o texto a ser processado.

Parâmetros do módulo

Nome Tipo Intervalo Opcional Padrão Descrição
Coluna de linguagem de cultura ColumnSelection language:Column contains language Nome ou índice baseado em um da coluna que contém as informações da linguagem de cultura
Coluna de texto ColumnSelection Obrigatório Nome ou índice baseado em um da coluna de texto.
Idioma T_Language Inglês, espanhol, francês, holandês, alemão, italiano, coluna contém idioma Obrigatório Inglês Selecione o idioma do texto a ser processado.

Saídas

Nome Tipo Descrição
Conjunto de dados de resultados Tabela de Dados As frases-chave extraídas

Exceções

Exceção Descrição
Erro 0003 Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia.
Erro 0010 Ocorrerá uma exceção se os conjuntos de dados da entrada tiverem nomes de colunas que deveriam corresponder, mas não correspondem.
Erro 0016 Ocorrerá uma exceção se os conjuntos de dados de entrada passados para o módulo devessem ter tipos de coluna compatíveis, o que não acontece.
Erro 0008 Ocorrerá uma exceção se o parâmetro não estiver no intervalo.

Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.

Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.

Confira também

Análise de Texto
Lista de Módulo A-Z