Extrair as frases-chave do texto
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Extrai frases-chave de determinado texto
Categoria: Análise de Texto
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
Este artigo explica como usar o módulo Extrair Frases-Chave de Texto no Machine Learning Studio (clássico) para pré-processar uma coluna de texto. Dado uma coluna de texto em idioma natural, o módulo extrai uma ou mais frases significativas. Uma frase pode ser uma única palavra, um substantivo composto ou um modificador mais um substantivo.
Este módulo é um wrapper para APIs de processamento de linguagem natural para extração de frase-chave. As frases são analisadas como potencialmente significativas no contexto da frase por vários motivos:
- A frase captura o tópico da frase.
- A frase contém uma combinação de modificador e substantivo que indica sentimento.
Por exemplo, suponha que a frase analisada seja: "Foi um hotel incrível permanecer, com uma equipe amigável e decoração exclusiva".
O módulo Extrair Frases-Chave de Texto pode retornar estas frases-chave:
- hotel incrível
- equipe amigável
- exclusivo
Como configurar a extração de frases-chave de texto
Para extrair frases-chave, você deve conectar um conjuntos de dados que tenha uma coluna de texto.
Adicione o módulo Extrair Frases-Chave de Texto ao seu experimento no Machine Learning Studio (clássico). Em seguida, conecte um conjuntos de dados que tenha pelo menos uma coluna de texto completo.
Use o Seletor de Coluna para selecionar uma coluna do tipo cadeia de caracteres, da qual extrair frases-chave.
Para Idioma, selecione um idioma a ser usado ao analisar frases. Se você especificar um idioma, somente frases no idioma de destino serão saída.
Se a coluna de texto contiver frases em vários idiomas, escolha a opção Idioma identificado em colunas. Um novo seletor de coluna é exibido que permite selecionar uma coluna no conjunto de dados que contém um identificador de idioma. O identificador de idioma pode ser o nome do idioma ou o identificador de cultura Iso6391. Por exemplo, "inglês" ou "en" são aceitáveis.
Dica
Antes de executar Extrair Frases-Chave de Texto, use o módulo Detectar Idiomas para identificar o idioma em cada linha e gerar o identificador para você. Um erro será gerado se a coluna do identificador de idioma contiver idiomas sem suporte em Extrair Frases-Chave de Texto.
Resultados
A saída do módulo é um conjuntos de dados que contém uma coluna de frases-chave separadas por vírgulas.
Por exemplo, os seguintes resultados de exemplo são para um conjuntos de dados de entrada que contém revisões em vários idiomas:
Frases-chave |
---|
novel, reserve, good book, adventure story, ltda de eventos, bons caracteres |
primer primerio,personajes, fan,áo, isla |
Todas as frases de saída estão contidas em uma única coluna; nenhuma outra coluna é passada e um identificador não é adicionado. No entanto, se você quiser alinhar as frases de saída com o texto de origem, poderá recombinar as frases de saída com a entrada usando o módulo Adicionar Colunas .
A saída da extração de frase-chave não sinaliza o idioma de frases individuais.
Se um idioma for incluído sem suporte no módulo Extrair Frases-Chave , um erro será gerado (0039). Para evitar erros, filtre o texto de entrada que tenha um identificador de idioma incompatível.
Se houver poucas linhas de outros idiomas, você também poderá evitar o erro omitindo o identificador de idioma e analisando todo o texto usando uma única seleção de idioma. No entanto, quando você faz isso, os resultados são muito ruins, porque frases inteiras em outros idiomas podem ser saída como uma única frase-chave.
Exemplos
O exemplo a seguir demonstra como usar este módulo para extrair frases-chave e, em seguida, criar uma nuvem de palavras das frases: Extrair frases-chave e mostrar a nuvem de palavras
Consulte a Galeria de IA do Azure para obter mais exemplos de processamento de texto usando Machine Learning.
Observações técnicas
Atualmente, este módulo dá suporte aos seguintes idiomas:
- Holandês
- Inglês
- Francês
- Alemão
- Italiano
- Espanhol
Para idiomas adicionais, considere o uso da API Análise de Texto em Serviços Cognitivos do Azure. Para obter mais informações, consulte Como extrair frases-chave em Análise de Texto
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Dataset | Tabela de Dados | A tabela que contém o texto a ser processado. |
Parâmetros do módulo
Nome | Tipo | Intervalo | Opcional | Padrão | Descrição |
---|---|---|---|---|---|
Coluna de linguagem de cultura | ColumnSelection | language:Column contains language | Nome ou índice baseado em um da coluna que contém as informações da linguagem de cultura | ||
Coluna de texto | ColumnSelection | Obrigatório | Nome ou índice baseado em um da coluna de texto. | ||
Idioma | T_Language | Inglês, espanhol, francês, holandês, alemão, italiano, coluna contém idioma | Obrigatório | Inglês | Selecione o idioma do texto a ser processado. |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Conjunto de dados de resultados | Tabela de Dados | As frases-chave extraídas |
Exceções
Exceção | Descrição |
---|---|
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia. |
Erro 0010 | Ocorrerá uma exceção se os conjuntos de dados da entrada tiverem nomes de colunas que deveriam corresponder, mas não correspondem. |
Erro 0016 | Ocorrerá uma exceção se os conjuntos de dados de entrada passados para o módulo devessem ter tipos de coluna compatíveis, o que não acontece. |
Erro 0008 | Ocorrerá uma exceção se o parâmetro não estiver no intervalo. |
Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.
Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.