Microsoft crea Inteligencia Artificial que puede leer un documento y responder preguntas sobre el tema como lo haría una persona
Por: Allison Linn, escritora senior de Microsoft.
Los investigadores de Microsoft han creado una tecnología que utiliza Inteligencia Artificial para leer un documento y responder preguntas sobre el tema como lo haría un ser humano.
Es un logro importante en cuanto al impulso de tener motores de búsqueda como Bing y asistentes digitales como Cortana que interactúen con las personas y brinden información en una manera más natural, tal como lo hace la gente para comunicarse.
Un equipo en Microsoft Research Asia consiguió el logro sobre la paridad humana al usar el Standford Question Answering Dataset, conocido entre los investigadores como SQuAD. Es un conjunto de datos de compresión de lectura automática que se crea a partir de preguntas sobre un conjunto de artículos de Wikipedia.
De acuerdo con la mesa directiva de SQuAD, el 3 de enero de 2018, Microsoft presentó un modelo que alcanzó una puntuación de 82,650 sobre la porción exacta de equivalencia. El desempeño de los seres humanos sobre el mismo conjunto de preguntas y respuestas es de 83,304. El 5 de enero de este mismo año, investigadores de Alibaba, la compañía china de comercio electrónico, presentaron una puntuación de 82,440, también muy cercana a la puntuación de los seres humanos.
Hoy en día las dos compañías están empatadas por el primer lugar en la “clasificación” SQuAD, la cual lista el resultado de los esfuerzos que han hecho las empresas en cuanto a investigaciones.
Microsoft ha realizado una significativa inversión en la compresión automática de lectura como parte de su esfuerzo por crear más tecnologías con las que las personas puedan interactuar de manera sencilla e intuitiva. Por ejemplo, en lugar de escribir una solicitud de búsqueda y obtener una lista de enlaces, Bing, el motor de búsqueda de Microsoft, va más allá de los esfuerzos para brindar a las personas más respuestas francas, o con múltiples fuentes de información sobre un tema que es más complejo o controversial.
Con la compresión automática de lectura, los investigadores comentan que las computadoras también podrían analizar de manera rápida a través la información encontrada en libros y documentos y brindar a la gente la información que más necesitan, de una manera sencilla y entendible.
Eso permitiría a los conductores encontrar de una manera más sencilla las respuestas que necesitan de un denso manual de automóvil, y ahorrar tiempo y esfuerzo en una situación tensa o difícil.
Esas herramientas también les permitirían a los doctores, abogados u otros expertos, superar el arduo trabajo de cosas como leer grandes documentos para encontrar detalles médicos específicos o precedentes legales ratificados. La tecnología mejoraría su trabajo y los dejaría con más tiempo para aplicar el conocimiento para enfocarse en atender pacientes o formular opiniones legales.
Microsoft ya ha comenzado a aplicar las primeras versiones de los modelos que fueron presentados para la clasificación de los datos de SQuAD dentro de su motor de búsqueda Bing, y la compañía ha comenzado a trabajar en aplicarla en problemas más complejos.
Por ejemplo, Microsoft ha comenzado a trabajar en maneras en las que una computadora pueda responder no sólo una pregunta original, sino también para responder una pregunta de seguimiento. Por ejemplo, digamos que le preguntaron a un sistema, “¿En qué año nació el primer ministro Alemán?” Es probable que también quisieran que la computadora entendiera cuando realizan una pregunta de seguimiento, “¿En qué ciudad nació?”
También busca maneras en las que las computadoras puedan generar preguntas naturales cuando se requiera información desde varias oraciones. Por ejemplo, si la computadora recibe la pregunta, “¿Es John Smith un ciudadano de los Estados Unidos?" esa información podría estar basada en un párrafo como, “John Smith nació en Hawái. Ese estado se encuentra en los Estados Unidos.”
Ming Zhou, Asistente de Dirección General de Microsoft Research Asia, dijo que los resultados del conjunto de datos de SQuAD son un logro importante, pero desatacó que, sobre todo, las personas aún son mejores que las máquinas para comprender la complejidad y el matiz del lenguaje.
“El procesamiento del lenguaje natural aún es un área con muchos retos que todos necesitamos investigar y avanzar,” dijo Zhou. “Este logro es sólo un comienzo. ”