Análise de Texto
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Este artigo descreve os módulos de análise de texto incluídos no Machine Learning Studio (clássico). Estes módulos fornecem ferramentas computacionais especializadas para trabalhar com textos estruturados e não estruturados, incluindo:
- Múltiplas opções para texto pré-processamento.
- Deteção de linguagem.
- Criação de funcionalidades a partir de texto usando dicionários n-gram personalizáveis.
- Recurso hashing, para analisar eficientemente o texto sem pré-processamento ou análise linguística avançada.
- Vowpal Wabbit, para aprendizagem automática muito rápida no texto. Vowpal Wabbit suporta hashing de recurso, modelação de tópicos (LDA) e classificação.
- Nomeou reconhecimento de entidades, para extrair os nomes de pessoas, lugares e organizações de textos não estruturados.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Exemplos
Para exemplos de análise de texto utilizando Machine Learning, consulte a Galeria Azure AI:
Categorização de notícias: Utiliza hashing de recurso para classificar os artigos numa lista de categorias predefinida.
Encontre empresas semelhantes: Utiliza o texto dos artigos da Wikipédia para categorizar empresas.
Classificação de texto: Demonstra o processo de utilização de texto a partir de mensagens do Twitter em análise de sentimento (amostra de cinco partes).
Lista de módulos
A categoria Text Analytics em Machine Learning Studio (clássico) inclui estes módulos:
- Detetar idiomas: Deteta a linguagem de cada linha no ficheiro de entrada.
- Extrair frases-chave do texto: Extrai frases-chave de texto dado.
- Extrair funcionalidades N-Gram de texto: Cria funcionalidades de dicionário N-Gram e apresenta seleção sobre elas.
- Hashing de recurso: Converte dados de texto para funcionalidades encodificadas por inteiros, utilizando a biblioteca Vowpal Wabbit.
- Alocação de Dirichlet Latent: Executa a modelação de tópicos utilizando a biblioteca Vowpal Wabbit para LDA.
- Reconhecimento de Entidades Nomeadas: Reconhece entidades nomeadas numa coluna de texto.
- Texto pré-processamento: Executa operações de limpeza por texto.
- Pontuação Vowpal Wabbit 7-4 Modelo: Pontuação entrada do Azure utilizando a versão 7-4 do sistema de aprendizagem automática Vowpal Wabbit.
- Pontuação Vowpal Wabbit 7-10 Modelo: Pontuações entrada do Azure utilizando a versão 7-10 do sistema de aprendizagem automática Vowpal Wabbit.
- Pontuação Vowpal Wabbit 8 Modelo: Pontuação entrada do Azure utilizando a versão 8 do sistema de aprendizagem automática Vowpal Wabbit.
- Modelo Vowpal Wabbit 7-4: Treina um modelo utilizando a versão 7-4 do sistema de aprendizagem automática Vowpal Wabbit.
- Modelo vowpal Wabbit 7-10: Treina um modelo utilizando a versão 7-10 do sistema de aprendizagem automática Vowpal Wabbit.
- Modelo Vowpal Wabbit 8: Treina um modelo utilizando a versão 8 do sistema de aprendizagem automática Vowpal Wabbit.