Extrair frases-chave do texto
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Extrai frases-chave de texto dado
Categoria: Análise de Texto
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo explica como usar as Frases-Chave de Extração do módulo text in Machine Learning Studio (clássico), para pré-processar uma coluna de texto. Dada uma coluna de texto de linguagem natural, o módulo extrai uma ou mais frases significativas. Uma frase pode ser uma única palavra, um substantivo composto, ou um modificador mais um substantivo.
Este módulo é um invólucro para APIs de processamento de linguagem natural para extração de frase-chave. As frases são analisadas como potencialmente significativas no contexto da sentença por várias razões:
- A frase capta o tema da frase.
- A frase contém uma combinação de modificador e substantivo que indica sentimento.
Por exemplo, assumir que a sentença analisada é: "Foi um hotel maravilhoso para ficar, com decoração única e pessoal amigável."
As frases-chave de extração do módulo de texto podem devolver estas frases-chave:
- maravilhoso hotel
- pessoal amigável
- decoração única
Como configurar extrato de frases-chave do texto
Para extrair frases-chave, deve ligar um conjunto de dados que tenha uma coluna de texto.
Adicione as frases-chave de extração do módulo de texto à sua experiência no Machine Learning Studio (clássico). Em seguida, ligue um conjunto de dados que tenha pelo menos uma coluna de texto completo.
Utilize o Seletor de Colunas para selecionar uma coluna de tipo de cadeia, a partir da qual extrair frases-chave.
Para linguagem, selecione um idioma para usar ao analisar frases. Se especificar uma língua, apenas as frases na língua-alvo serão saídas.
Se a coluna de texto contiver frases em várias línguas, escolha a opção, Linguagem identificada em colunas. É apresentado um novo seletor de colunas que permite selecionar uma coluna no seu conjunto de dados que contém um identificador de idioma. O identificador de línguas pode ser o nome da língua ou o identificador de cultura Iso6391. Por exemplo, ou "Inglês" ou "en" são aceitáveis.
Dica
Antes de executar extrato frases-chave de texto, utilize o módulo Deteção de Línguas para identificar o idioma em cada linha e gerar o identificador para si. Um erro é levantado se a coluna do identificador de idiomas contiver quaisquer idiomas não suportados por Frases-chave de extração de texto.
Resultados
A saída do módulo é um conjunto de dados que contém uma coluna de frases-chave separadas por vírgula.
Por exemplo, os seguintes resultados de exemplo são para um conjunto de dados de entrada contendo revisões em vários idiomas:
Frases-chave |
---|
romance,submarino nuclear,bom livro,história de aventura, avalanche de eventos, bons personagens |
primer misterio,personajes,fã,aventura,isla |
Todas as frases de saída estão contidas numa única coluna; nenhuma outra coluna é passada, e um identificador não é adicionado. No entanto, se pretender alinhar as frases de saída com o texto de origem, pode recombinar as frases de saída com a entrada utilizando o módulo Add Columns .
A saída da extração de frases-chave não sinaliza a linguagem das frases individuais.
Se for incluído um idioma que não seja suportado pelo módulo Extract Key Phrases , é levantado um erro (0039). Para evitar erros, certifique-se de filtrar o texto de entrada que tem um identificador de linguagem incompatível.
Se houver muito poucas linhas de outras línguas, também pode evitar o erro omitindo o identificador de idiomas e analisando todo o texto usando uma única seleção linguística. No entanto, quando o fazes, os resultados são muito fracos, porque frases inteiras nas outras línguas podem ser saídas como uma única frase-chave.
Exemplos
O exemplo a seguir demonstra como usar este módulo para extrair frases-chave e, em seguida, construir uma nuvem de palavra a partir das frases: Extrair Frases-chave e Mostrar Nuvem de Palavra
Consulte a Galeria Azure AI para obter mais exemplos de processamento de texto utilizando Machine Learning.
Notas técnicas
Este módulo suporta atualmente os seguintes idiomas:
- Neerlandês
- Inglês
- Francês
- Alemão
- Italiano
- Espanhol
Para idiomas adicionais, considere usar a API text Analytics em Serviços Cognitivos Azure. Para mais informações, consulte Como extrair frases-chave em Text Analytics
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Conjunto de dados | Tabela de Dados | A tabela que contém o texto a ser processado. |
Parâmetros do módulo
Nome | Tipo | Intervalo | Opcional | Predefinição | Description |
---|---|---|---|---|---|
Coluna de cultura-língua | Seleção de Colunas | linguagem:Coluna contém linguagem | Nome ou índice de base da coluna que contém a informação cultura-língua | ||
Coluna de texto | Seleção de Colunas | Necessário | Nome ou índice de uma base da coluna de texto. | ||
Linguagem | T_Language | Inglês, Espanhol, Francês, Holandês, Alemão, Italiano, Coluna contém língua | Necessário | Inglês | Selecione a linguagem do texto a processar. |
Saídas
Nome | Tipo | Description |
---|---|---|
Conjunto de dados de resultados | Tabela de Dados | As frases-chave extraídas |
Exceções
Exceção | Description |
---|---|
Erro 0003 | A exceção ocorre se uma ou mais entradas forem nulas ou vazias. |
Erro 0010 | A exceção ocorre se os conjuntos de dados de entrada tiverem nomes de colunas que devem coincidir, mas não. |
Erro 0016 | A exceção ocorre se os conjuntos de dados de entrada passados para o módulo devem ter tipos de coluna compatíveis, mas não o fazem. |
Erro 0008 | A exceção ocorre se o parâmetro não estiver ao alcance. |
Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.
Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.