Compartir a través de


Extraer frases clave del texto

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Extrae frases clave del texto especificado

Categoría: Text Analytics

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se explica cómo usar el módulo Extraer frases clave del texto en Machine Learning Studio (clásico) para procesar previamente una columna de texto. Dada una columna de texto en lenguaje natural, el módulo extrae una o varias frases significativas. Una frase puede ser una sola palabra, un sustantivo compuesto o un modificador más un sustantivo.

Este módulo es un contenedor para las API de procesamiento de lenguaje natural para la extracción de frases clave. Las frases se analizan como potencialmente significativas en el contexto de la frase por diversos motivos:

  • La frase captura el tema de la frase.
  • La frase contiene una combinación de modificador y sustantivo que indica la opinión.

Por ejemplo, suponga que la frase analizada es: "Era un hotel fantástico en el que hospedarse, con personal único y personal descriptivo".

El módulo Extraer frases clave del texto podría devolver estas frases clave:

  • hotel fantástico
  • personal descriptivo
  • exclusiva

Cómo configurar Extraer frases clave del texto

Para extraer frases clave, debe conectar un conjunto de datos que tenga una columna de texto.

  1. Agregue el módulo Extract Key Phrases from Text (Extraer frases clave del texto) al experimento en Machine Learning Studio (clásico). A continuación, conecte un conjunto de datos que tenga al menos una columna de texto completo.

  2. Use el selector de columnas para seleccionar una columna de tipo cadena, de la que extraer frases clave.

  3. En Idioma, seleccione el idioma que se usará al analizar frases. Si especifica un idioma, solo se mostrarán las frases del idioma de destino.

  4. Si la columna de texto contiene frases en varios idiomas, elija la opción Idioma identificado en columnas. Se muestra un nuevo selector de columnas que le permite seleccionar una columna en el conjunto de datos que contiene un identificador de idioma. El identificador de idioma puede ser el nombre de idioma o el identificador de referencia cultural Iso6391. Por ejemplo, "Inglés" o "en" son aceptables.

    Sugerencia

    Antes de ejecutar Extraer frases clave del texto, use el módulo Detectar idiomas para identificar el idioma de cada fila y generar el identificador automáticamente. Se produce un error si la columna de identificador de idioma contiene idiomas no admitidos por Extraer frases clave del texto.

Results

La salida del módulo es un conjunto de datos que contiene una columna de frases clave separadas por comas.

Por ejemplo, los resultados de ejemplo siguientes son para un conjunto de datos de entrada que contiene revisiones en varios idiomas:

Frases clave
narración, ensayo, buen libro, historia de la adventure, avalanche de eventos, buenos caracteres
primería,personajes,fan,asíntra, isla
  • Todas las frases de salida están contenidas en una sola columna; no se pasa ninguna otra columna y no se agrega un identificador. Sin embargo, si desea alinear las frases de salida con el texto de origen, puede volver a combinar las frases de salida con la entrada mediante el módulo Agregar columnas.

  • La salida de la extracción de frases clave no marca el idioma de las frases individuales.

  • Si se incluye un idioma que no es compatible con el módulo Extraer frases clave, se produce un error (0039). Para evitar errores, asegúrese de filtrar el texto de entrada que tiene un identificador de idioma incompatible.

    Si hay muy pocas filas de otros idiomas, también puede evitar el error omitiendo el identificador de idioma y analizando todo el texto mediante una selección de idioma única. Sin embargo, al hacerlo, los resultados son muy deficientes, ya que las oraciones enteras de los otros idiomas pueden generarse como una sola frase clave.

Ejemplos

En el ejemplo siguiente se muestra cómo usar este módulo para extraer frases clave y, a continuación, crear una nube de palabras a partir de las frases: Extraer frases clave y Mostrar nube de palabras

Consulte el Azure AI Gallery para obtener más ejemplos de procesamiento de texto mediante Machine Learning.

Notas técnicas

Actualmente, este módulo admite los siguientes idiomas:

  • Neerlandés
  • Inglés
  • Francés
  • Alemán
  • Italiano
  • Español

Para otros lenguajes, considere la posibilidad de usar la API Text Analytics en Azure Cognitive Services. Para obtener más información, vea Cómo extraer frases clave en Text Analytics

Entradas esperadas

Nombre Tipo Descripción
Dataset Tabla de datos Tabla que contiene el texto que se va a procesar.

Parámetros del módulo

Nombre Tipo Intervalo Opcional Valor predeterminado Descripción
Columna idioma de referencia cultural ColumnSelection language:Column contiene el idioma Nombre o índice basado en uno de la columna que contiene la información del idioma de referencia cultural
Columna de texto ColumnSelection Obligatorio Nombre o índice basado en uno de la columna de texto.
Language T_Language Inglés, español, francés, neerlandés, alemán, italiano, columna contiene idioma Obligatorio Inglés Seleccione el idioma del texto que se va a procesar.

Salidas

Nombre Tipo Descripción
Conjunto de datos de resultados Tabla de datos Frases clave extraídas

Excepciones

Excepción Descripción
Error 0003 Se produce una excepción si una o varias de las entradas son NULL o están vacías.
Error 0010 Se produce una excepción si los conjuntos de datos de entrada tienen nombres de columna que deben coincidir, pero no coinciden.
Error 0016 Se produce una excepción si los conjuntos de datos de entrada que se pasan al módulo deben tener tipos de columna compatibles, pero no es así.
Error 0008 Se produce una excepción si el parámetro no se encuentra en el intervalo.

Para obtener una lista de errores específicos de los módulos de Studio (clásico), consulte Machine Learning códigos de error.

Para obtener una lista de excepciones de API, consulte Machine Learning códigos de error de la API REST.

Consulte también

Text Analytics
Lista de módulos A-Z