Microsoft Cognitive Services
Continuando con la tendencia de dotar de inteligencia a los sistemas informáticos, se ha presentado durante el Build 2016 la evolución de lo que se conocía como Project Oxford, hoy renombrado a Microsoft Cognitive Services.
Consiste en poner a disposición del desarrollador un gran número de API’s para dotar de inteligencia a sus aplicaciones gracias a Machine Learning y a Deep Learning así como permitir realizar conversaciones naturales con el sistema. El número total de API’s asciende a 22, dando así la posibilidad de crear potentes aplicaciones inteligentes.
Se dividen en cinco grandes grupos:
Visión
Contiene API’s para la interacción mediante la vista, como son:
- Computer Vision API: obtiene información para procesarla mediante imágenes.
- Emotion API: realiza una detección de las emociones del usuario y genera información al respecto.
- Face API: gestiona la identificación y la información que se obtiene de las caras de la gente en las fotografías.
- Video API: permite analizar, procesar y editar videos en tus aplicaciones.
Habla
Contiene las API’s de reconocimiento de voz:
- Custom Recognition Intelligent Service (CRIS) : Ajusta el reconocimiento de voz para todo tipo de usuarios.
- Speaker Recognition API: permite a la aplicación saber quién está hablando.
- Speech API: recoge la voz y la convierte a texto y viceversa.
Lenguaje
Contiene las API’s relativas al lenguaje del usuario:
- Bing Spell Check API: Detecta y corrige errores del lenguaje en tus aplicaciones.
- Language Understanding Intelligent Service (LUIS) : Crea modelos de lenguaje para poder entender ordenes que den los usuarios de la aplicación.
- Linguistic Analysis API: Analiza el lenguaje a partir de texto para identificar conceptos y acciones o encontrar frases.
- Text Analytics API: Analiza el texto para detectar todo tipo de sentimientos, palabras clave, temas o idiomas.
- Web Language Model API: Procesa el lenguaje natural humano para realizar tareas concretas.
Conocimiento
Contiene las API’s que profundizan en el contexto de la información y el conocimiento:
- Academic Knowledge API: Da acceso a contenido académico como generación de gráficos o interprete del lenguaje.
- Entity Linking Intelligence Service: Obtiene enlaces a datos mediante el reconocimiento de entidades en los textos.
- Knowledge Exploration Service: Permite realizar consultas en bases de datos estructuradas mediante lenguaje natural.
- Recommendations API: Realiza recomendaciones de productos para los clientes según sus preferencias.
Búsqueda
Contiene las API’s de búsqueda de información:
- Bing Autosuggest API: Da a tus aplicaciones la capacidad de sugerir opciones de búsqueda de información.
- Bing Image Search API: Proporciona un buscador de imágenes e información detallada.
- Bing News Search API: Permite buscar noticias y enlazarlas con tus aplicaciones.
- Bing Video Search API: Permite buscar videos y obtener información detallada.
- Bing Web Search API: Permite realizar búsquedas dentro de las aplicaciones.
Durante el Build 2016, hemos podido ver una demo realizada con un desarrollador invidente que utiliza unas gafas que llevan diferentes sensores y le permite conocer e interactuar con su entorno de una manera natural, facilitándole, por ejemplo, la lectura del menú de un restaurante, gracias a dichas gafas, que son capaces de leerla y comunicarle lo que está escrito. Todo ello hace uso de sistemas cognitivos que analizan los datos recogidos por los sensores y los interpretan gracias a los diferentes servicios.
Toda la documentación se encuentra disponible en la web de Microsoft Cognitive Service.
Rubén Asensio García
@butcher086
Intern Technical Evangelist