Introducción al análisis de texto

Completado

Lenguaje de Azure AI forma parte de las ofertas de los servicios de Azure AI y puede realizar un procesamiento del lenguaje natural avanzado sobre texto no estructurado. Las características de análisis de texto del lenguaje de Azure AI incluyen:

  • El reconocimiento de entidades con nombre identifica personas, lugares, eventos y mucho más. Esta característica también se puede personalizar para extraer categorías personalizadas.
  • La vinculación de entidad identifica entidades conocidas junto con un vínculo a Wikipedia.
  • La detección de información de identificación personal (PII) identifica información personalmente confidencial, incluida la información personal relacionada con la salud.
  • La detección de idioma identifica el idioma del texto y devuelve un código de idioma como "en" para inglés.
  • El análisis de sentimiento y la minería de opiniones identifican si el texto es positivo o negativo.
  • El resumen resume el texto mediante la identificación de la información más importante.
  • La extracción de frases clave enumera los conceptos principales del texto no estructurado.

Reconocimiento y vinculación de entidades

Puede proporcionar a Lenguaje de Azure AI un texto no estructurado y le devolverá una lista de las entidades que reconozca en dicho texto. Una entidad es un elemento de un tipo o una categoría particular y en algunos casos, un subtipo, como los que se muestran en la tabla siguiente.

Tipo Subtipo Ejemplo
Persona "Bill Gates", "John"
Ubicación "París", "Nueva York"
Organización "Microsoft"
Cantidad Number "6" o "seis"
Cantidad Porcentaje "25 %" o "cincuenta por ciento"
Cantidad Ordinal "1.º" o "primero"
Cantidad Age "90 días de edad" o "30 años de edad"
Cantidad Moneda "10,99"
Cantidad Dimensión "10 millas", "40 cm"
Cantidad Temperatura "45 grados"
DateTime "4 de febrero de 2012, 6:30 p. m."
DateTime Date "2 de mayo de 2017" o "02/05/2017"
DateTime Time "8 a. m." u "8:00"
DateTime DateRange "Del 2 de mayo al 5 de mayo"
DateTime TimeRange "De 6 p. m. a 7 p. m."
DateTime Duration "1 minuto y 45 segundos"
DateTime Set "todos los martes"
Dirección URL "https://www.bing.com"
Correo electrónico "support@microsoft.com"
Número de teléfono de EE. UU. "(312) 555-0176"
Dirección IP "10.0.1.125"

Lenguaje de Azure AI también es compatible con la vinculación de entidades, lo que ayuda a desambiguar entidades al vincularlas a una referencia específica. Para las entidades reconocidas, el servicio devuelve una URL para un artículo de Wikipedia relevante.

Por ejemplo, suponga que usa Lenguaje de Azure AI para detectar entidades en el siguiente extracto de una reseña de un restaurante:

"Comí en el restaurante en Seattle la semana pasada."

Entidad Tipo Subtipo URL de Wikipedia
Seattle Ubicación https://en.wikipedia.org/wiki/Seattle
semana pasada DateTime DateRange

Detección de idioma

Use la capacidad de detección de idioma de Lenguaje de Azure AI para identificar el idioma en el que está escrito el texto. Puede enviar varios documentos a la vez para su análisis. Por cada documento que se envíe, el servicio detectará lo siguiente:

  • El nombre del idioma (por ejemplo, "inglés").
  • El código de idioma ISO 639-1 (por ejemplo, "en").
  • Una puntuación que indica un nivel de confianza en la detección de idioma.

Por ejemplo, considere un escenario en el que es propietario y administra un restaurante donde los clientes pueden completar encuestas y proporcionar comentarios sobre la comida, el servicio, el personal, etc. Supongamos que ha recibido las siguientes reseñas de clientes:

Reseña 1: "A fantastic place for lunch. The soup was delicious."

Reseña 2: "Comida maravillosa y gran servicio."

Reseña 3: "The croque monsieur avec frites was terrific. Bon appetit!"

Puede usar las funcionalidades de análisis de texto en Lenguaje de Azure AI para detectar el idioma de cada una de estas reseñas y el servicio podría responder con los siguientes resultados:

Documento Nombre del idioma Código ISO 6391 Puntuación
Reseña 1 Inglés en 1,0
Reseña 2 Español es 1,0
Reseña 3 Inglés en 0,9

Observe que el idioma detectado para la reseña 3 es el inglés, a pesar de que el texto contiene una mezcla de inglés y francés. El servicio de detección de idioma se centrará en el idioma predominante del texto. El servicio utiliza un algoritmo a fin de determinar el idioma predominante, como la longitud de las frases o la cantidad total de texto para el idioma en comparación con otros idiomas en el mismo texto. El idioma predominante será el valor devuelto junto con el código de idioma. La puntuación de confianza puede ser inferior a 1 dado que el texto tiene varios idiomas.

Es posible que haya textos que sean de naturaleza ambigua o que tengan contenido en idioma mixto. Estas situaciones pueden presentar un desafío. Un ejemplo de contenido ambiguo sería un caso en el que el documento contiene texto limitado o solo puntuación. Por ejemplo, el uso de Lenguaje de Azure AI a fin de analizar el texto ":-)" da como resultado un valor _desconocido para el nombre y el identificador de idioma y una puntuación NaN (que se usa con el fin de indicar que no es un número).

Análisis de opiniones y minería de opiniones

Las funcionalidades de análisis de texto de Lenguaje de Azure AI pueden evaluar texto y devolver puntuaciones de opinión y etiquetas para cada frase. Esta capacidad es útil para detectar opiniones positivas y negativas en las redes sociales, reseñas de clientes, foros de discusión y más.

Lenguaje de Azure AI usa un modelo de clasificación de aprendizaje automático precompilado para evaluar el texto. El servicio devuelve puntuaciones de opinión en tres categorías: positivo, neutral y negativo. En cada una de las categorías, se proporciona una puntuación entre 0 y 1. Las puntuaciones indican la probabilidad de que el texto proporcionado corresponda a un determinado sentimiento. También se proporciona un sentimiento de documento.

Por ejemplo, las siguientes dos reseñas de restaurantes podrían analizarse según la opinión:

Reseña 1: "Cenamos en este restaurante anoche y lo primero que noté fue lo cortés que era el personal. Nos recibieron de manera amistosa y nos llevaron a nuestra mesa de inmediato. La mesa estaba limpia, las sillas eran cómodas y la comida estuvo increíble."

y

Reseña 2: "Nuestra experiencia gastronómica en este restaurante fue una de las peores que he tenido. El servicio fue lento y la comida estuvo horrible. Nunca volveré a comer en este establecimiento."

La puntuación de sentimiento de la primera revisión puede ser: Sentimiento del documento: positivo Puntuación positiva: .90 Puntuación neutra: .10 Puntuación negativa: .00

La segunda revisión podría devolver una respuesta: Sentimiento del documento: negativo Puntuación positiva: .00 Puntuación neutra: .00 Puntuación negativa: .99

Extracción de la frase clave

La extracción de frases clave identifica los puntos principales del texto. Considere el escenario del restaurante analizado anteriormente. Si tiene un gran número de encuestas, puede tardar mucho tiempo en leer las reseñas. En lugar de eso, puede usar las capacidades de extracción de frases clave del servicio Language para resumir los puntos principales.

Es posible que reciba una reseña como la siguiente:

"Cenamos aquí para celebrar un cumpleaños y tuvimos una experiencia fantástica. Nos recibió una amable anfitriona y nos llevaron a nuestra mesa de inmediato. El ambiente era relajado, la comida fue increíble y el servicio, excelente. Si le gusta la buena comida y el servicio atento, debería probar este lugar."

La extracción de frases clave puede proporcionar algún contexto a esta revisión al extraer las siguientes frases:

  • celebración de cumpleaños
  • experiencia fantástica
  • anfitriona amable
  • buena comida
  • servicio atento
  • cena
  • table
  • ambiente
  • lugar

Además de utilizar el análisis de sentimiento para determinar que se trata de una reseña positiva, también puede utilizar el servicio de frases clave para identificar los elementos importantes de la reseña.

Creación de un recurso para el Lenguaje de Azure AI

Para usar Lenguaje de Azure AI en una aplicación, debe aprovisionar un recurso apropiado en su suscripción de Azure. Puede optar por cualquiera de los siguientes tipos de recursos:

  • Recurso de Language: elija este tipo de recurso si solo planea utilizar servicios de Lenguaje de Azure AI o si quiere administrar el acceso y la facturación del recurso por separado de otros servicios.
  • Recurso de servicios de Azure AI: elija este tipo de recurso si planea usar Lenguaje de Azure AI en combinación con otros servicios de Azure AI, y desea administrar juntos el acceso y la facturación de estos servicios.