Análise de Texto
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
este artigo descreve os módulos de análise de texto incluídos no Machine Learning Studio (clássico). Esses módulos fornecem ferramentas computacionais especializadas para trabalhar com texto estruturado e não estruturado, incluindo:
- Várias opções para o pré-processamento de texto.
- Detecção de idioma.
- Criação de recursos de texto usando dicionários de n-Gram personalizáveis.
- Hash de recurso, para analisar com eficiência o texto sem pré-processamento ou análise linguística avançada.
- Vowpal Wabbit, para aprendizado de máquina muito rápido em texto. Vowpal Wabbit dá suporte a hash de recurso, modelagem de tópico (LDA) e classificação.
- Reconhecimento de entidade nomeada, para extrair os nomes de pessoas, lugares e organizações de texto não estruturado.
Observação
aplica-se a: somente Machine Learning Studio (clássico)
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Exemplos
para obter exemplos de análise de texto usando Machine Learning, consulte a Galeria de IA do Azure:
Categorização de notícias: usa o hash de recurso para classificar artigos em uma lista predefinida de categorias.
Encontre empresas semelhantes: usa o texto dos artigos da Wikipédia para categorizar empresas.
Classificação de texto: demonstra o processo de ponta a ponta do uso de texto de mensagens do Twitter em análise de sentimentos (exemplo de cinco partes).
Lista de módulos
a categoria de Análise de Texto no Machine Learning Studio (clássico) inclui estes módulos:
- Detectar idiomas: detecta o idioma de cada linha no arquivo de entrada.
- Extrair frases-chave do texto: extrai frases-chave de um determinado texto.
- Extrair recursos de n-Gram do texto: cria recursos de dicionário de n-Gram e executa a seleção de recursos neles.
- Hash de recurso: converte dados de texto em recursos codificados por inteiro usando a biblioteca Vowpal Wabbit.
- Alocação de Dirichlet latente: executa a modelagem de tópico usando a biblioteca Vowpal WABBIT para Lda.
- Reconhecimento de entidade nomeada: reconhece entidades nomeadas em uma coluna de texto.
- Pré-processar texto: executa operações de limpeza em texto.
- Classificação Vowpal Wabbit 7-4: classifica a entrada do Azure usando a versão 7-4 do sistema de aprendizado de máquina Vowpal Wabbit.
- Classificação Vowpal Wabbit 7-10: classifica a entrada do Azure usando a versão 7-10 do sistema de aprendizado de máquina Vowpal Wabbit.
- Pontuação Vowpal Wabbit 8 Model: classifica a entrada do Azure usando a versão 8 do sistema de aprendizado de máquina Vowpal Wabbit.
- Treinar modelo do Vowpal Wabbit 7-4: treina um modelo usando a versão 7-4 do sistema de aprendizado de máquina do Vowpal Wabbit.
- Treinar modelo do Vowpal Wabbit 7-10: treina um modelo usando a versão 7-10 do sistema de aprendizado de máquina do Vowpal Wabbit.
- Treinar modelo do Vowpal Wabbit 8: treina um modelo usando a versão 8 do sistema de aprendizado de máquina do Vowpal Wabbit.