Extraer frases clave del texto
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Extrae frases clave del texto especificado
Categoría: Text Analytics
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se explica cómo usar el módulo Extraer frases clave del texto en Machine Learning Studio (clásico) para procesar previamente una columna de texto. Dada una columna de texto en lenguaje natural, el módulo extrae una o varias frases significativas. Una frase puede ser una sola palabra, un sustantivo compuesto o un modificador más un sustantivo.
Este módulo es un contenedor para las API de procesamiento de lenguaje natural para la extracción de frases clave. Las frases se analizan como potencialmente significativas en el contexto de la frase por diversos motivos:
- La frase captura el tema de la frase.
- La frase contiene una combinación de modificador y sustantivo que indica la opinión.
Por ejemplo, suponga que la frase analizada es: "Era un hotel fantástico en el que hospedarse, con personal único y personal descriptivo".
El módulo Extraer frases clave del texto podría devolver estas frases clave:
- hotel fantástico
- personal descriptivo
- exclusiva
Cómo configurar Extraer frases clave del texto
Para extraer frases clave, debe conectar un conjunto de datos que tenga una columna de texto.
Agregue el módulo Extract Key Phrases from Text (Extraer frases clave del texto) al experimento en Machine Learning Studio (clásico). A continuación, conecte un conjunto de datos que tenga al menos una columna de texto completo.
Use el selector de columnas para seleccionar una columna de tipo cadena, de la que extraer frases clave.
En Idioma, seleccione el idioma que se usará al analizar frases. Si especifica un idioma, solo se mostrarán las frases del idioma de destino.
Si la columna de texto contiene frases en varios idiomas, elija la opción Idioma identificado en columnas. Se muestra un nuevo selector de columnas que le permite seleccionar una columna en el conjunto de datos que contiene un identificador de idioma. El identificador de idioma puede ser el nombre de idioma o el identificador de referencia cultural Iso6391. Por ejemplo, "Inglés" o "en" son aceptables.
Sugerencia
Antes de ejecutar Extraer frases clave del texto, use el módulo Detectar idiomas para identificar el idioma de cada fila y generar el identificador automáticamente. Se produce un error si la columna de identificador de idioma contiene idiomas no admitidos por Extraer frases clave del texto.
Results
La salida del módulo es un conjunto de datos que contiene una columna de frases clave separadas por comas.
Por ejemplo, los resultados de ejemplo siguientes son para un conjunto de datos de entrada que contiene revisiones en varios idiomas:
Frases clave |
---|
narración, ensayo, buen libro, historia de la adventure, avalanche de eventos, buenos caracteres |
primería,personajes,fan,asíntra, isla |
Todas las frases de salida están contenidas en una sola columna; no se pasa ninguna otra columna y no se agrega un identificador. Sin embargo, si desea alinear las frases de salida con el texto de origen, puede volver a combinar las frases de salida con la entrada mediante el módulo Agregar columnas.
La salida de la extracción de frases clave no marca el idioma de las frases individuales.
Si se incluye un idioma que no es compatible con el módulo Extraer frases clave, se produce un error (0039). Para evitar errores, asegúrese de filtrar el texto de entrada que tiene un identificador de idioma incompatible.
Si hay muy pocas filas de otros idiomas, también puede evitar el error omitiendo el identificador de idioma y analizando todo el texto mediante una selección de idioma única. Sin embargo, al hacerlo, los resultados son muy deficientes, ya que las oraciones enteras de los otros idiomas pueden generarse como una sola frase clave.
Ejemplos
En el ejemplo siguiente se muestra cómo usar este módulo para extraer frases clave y, a continuación, crear una nube de palabras a partir de las frases: Extraer frases clave y Mostrar nube de palabras
Consulte el Azure AI Gallery para obtener más ejemplos de procesamiento de texto mediante Machine Learning.
Notas técnicas
Actualmente, este módulo admite los siguientes idiomas:
- Neerlandés
- Inglés
- Francés
- Alemán
- Italiano
- Español
Para otros lenguajes, considere la posibilidad de usar la API Text Analytics en Azure Cognitive Services. Para obtener más información, vea Cómo extraer frases clave en Text Analytics
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Dataset | Tabla de datos | Tabla que contiene el texto que se va a procesar. |
Parámetros del módulo
Nombre | Tipo | Intervalo | Opcional | Valor predeterminado | Descripción |
---|---|---|---|---|---|
Columna idioma de referencia cultural | ColumnSelection | language:Column contiene el idioma | Nombre o índice basado en uno de la columna que contiene la información del idioma de referencia cultural | ||
Columna de texto | ColumnSelection | Obligatorio | Nombre o índice basado en uno de la columna de texto. | ||
Language | T_Language | Inglés, español, francés, neerlandés, alemán, italiano, columna contiene idioma | Obligatorio | Inglés | Seleccione el idioma del texto que se va a procesar. |
Salidas
Nombre | Tipo | Descripción |
---|---|---|
Conjunto de datos de resultados | Tabla de datos | Frases clave extraídas |
Excepciones
Excepción | Descripción |
---|---|
Error 0003 | Se produce una excepción si una o varias de las entradas son NULL o están vacías. |
Error 0010 | Se produce una excepción si los conjuntos de datos de entrada tienen nombres de columna que deben coincidir, pero no coinciden. |
Error 0016 | Se produce una excepción si los conjuntos de datos de entrada que se pasan al módulo deben tener tipos de columna compatibles, pero no es así. |
Error 0008 | Se produce una excepción si el parámetro no se encuentra en el intervalo. |
Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.
Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.