Text Analytics
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
En este artículo se describen los módulos de análisis de texto incluidos en Machine Learning Studio (clásico). Estos módulos proporcionan herramientas de cálculo especializadas para trabajar con texto estructurado y no estructurado, incluidos:
- Varias opciones para preprocesamiento de texto.
- Detección de idioma.
- Creación de características a partir de texto mediante diccionarios de n-gramas personalizables.
- Hash de características, para analizar texto de forma eficaz sin preprocesamiento ni análisis lingüístico avanzado.
- Vowpal Wabbit, para un aprendizaje automático muy rápido en texto. Vowpal Wabbit admite el hash de características, el modelado de temas (LDA) y la clasificación.
- Reconocimiento de entidades con nombre, para extraer los nombres de personas, lugares y organizaciones a partir de texto no estructurado.
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Ejemplos
Para obtener ejemplos de análisis de texto Machine Learning, consulte el Azure AI Gallery:
Categorización de noticias: usa el hash de características para clasificar artículos en una lista predefinida de categorías.
Buscar compañías similares: usa el texto de los artículos de Wikipedia para clasificar a las empresas.
Clasificación de texto: muestra el proceso completo de uso de texto de mensajes de Twitter en el análisis de sentimiento (ejemplo de cinco partes).
Lista de módulos
La Text Analytics categoría de Machine Learning Studio (clásico) incluye estos módulos:
- Detectar idiomas: detecta el idioma de cada línea del archivo de entrada.
- Extraer frases clave del texto: extrae frases clave del texto especificado.
- Extraer características de n-gramas del texto: crea características del diccionario de n-gramas y realiza la selección de características en ellas.
- Hash de características: convierte los datos de texto en características codificadas con enteros mediante la biblioteca Vowpal Wabbit.
- Asignación latente de Dirichlet: realiza el modelado de temas mediante la biblioteca Vowpal Wabbit para LDA.
- Reconocimiento de entidades con nombre: reconoce entidades con nombre en una columna de texto.
- Preprocesar texto: realiza operaciones de limpieza en el texto.
- Puntuación del modelo de Vowpal Wabbit 7-4: puntua la entrada de Azure mediante la versión 7-4 del sistema de aprendizaje automático Vowpal Wabbit.
- Puntuación del modelo de Vowpal Wabbit 7-10: puntua la entrada de Azure mediante la versión 7-10 del sistema de aprendizaje automático Vowpal Wabbit.
- Puntuación del modelo de Vowpal Wabbit 8: puntua la entrada de Azure mediante la versión 8 del sistema de aprendizaje automático Vowpal Wabbit.
- Entrenar el modelo de Vowpal Wabbit 7-4: entrena un modelo mediante la versión 7-4 del sistema de aprendizaje automático Vowpal Wabbit.
- Entrenar el modelo de Vowpal Wabbit 7-10: entrena un modelo mediante la versión 7-10 del sistema de aprendizaje automático Vowpal Wabbit.
- Entrenamiento del modelo de Vowpal Wabbit 8: entrena un modelo mediante la versión 8 del sistema de aprendizaje automático Vowpal Wabbit.