Note
Access to this page requires authorization. You can try signing in or changing directories.
Access to this page requires authorization. You can try changing directories.
Continuando con la tendencia de dotar de inteligencia a los sistemas informáticos, se ha presentado durante el Build 2016 la evolución de lo que se conocía como Project Oxford, hoy renombrado a Microsoft Cognitive Services.
Consiste en poner a disposición del desarrollador un gran número de API’s para dotar de inteligencia a sus aplicaciones gracias a Machine Learning y a Deep Learning así como permitir realizar conversaciones naturales con el sistema. El número total de API’s asciende a 22, dando así la posibilidad de crear potentes aplicaciones inteligentes.
Se dividen en cinco grandes grupos:
Visión 
Contiene API’s para la interacción mediante la vista, como son:
- Computer Vision API: obtiene información para procesarla mediante imágenes.
- Emotion API: realiza una detección de las emociones del usuario y genera información al respecto.
- Face API: gestiona la identificación y la información que se obtiene de las caras de la gente en las fotografías.
- Video API: permite analizar, procesar y editar videos en tus aplicaciones.
Habla 
Contiene las API’s de reconocimiento de voz:
- Custom Recognition Intelligent Service (CRIS) : Ajusta el reconocimiento de voz para todo tipo de usuarios.
- Speaker Recognition API: permite a la aplicación saber quién está hablando.
- Speech API: recoge la voz y la convierte a texto y viceversa.
Lenguaje 
Contiene las API’s relativas al lenguaje del usuario:
- Bing Spell Check API: Detecta y corrige errores del lenguaje en tus aplicaciones.
- Language Understanding Intelligent Service (LUIS) : Crea modelos de lenguaje para poder entender ordenes que den los usuarios de la aplicación.
- Linguistic Analysis API: Analiza el lenguaje a partir de texto para identificar conceptos y acciones o encontrar frases.
- Text Analytics API: Analiza el texto para detectar todo tipo de sentimientos, palabras clave, temas o idiomas.
- Web Language Model API: Procesa el lenguaje natural humano para realizar tareas concretas.
Conocimiento 
Contiene las API’s que profundizan en el contexto de la información y el conocimiento:
- Academic Knowledge API: Da acceso a contenido académico como generación de gráficos o interprete del lenguaje.
- Entity Linking Intelligence Service: Obtiene enlaces a datos mediante el reconocimiento de entidades en los textos.
- Knowledge Exploration Service: Permite realizar consultas en bases de datos estructuradas mediante lenguaje natural.
- Recommendations API: Realiza recomendaciones de productos para los clientes según sus preferencias.
Búsqueda 
Contiene las API’s de búsqueda de información:
- Bing Autosuggest API: Da a tus aplicaciones la capacidad de sugerir opciones de búsqueda de información.
- Bing Image Search API: Proporciona un buscador de imágenes e información detallada.
- Bing News Search API: Permite buscar noticias y enlazarlas con tus aplicaciones.
- Bing Video Search API: Permite buscar videos y obtener información detallada.
- Bing Web Search API: Permite realizar búsquedas dentro de las aplicaciones.
Durante el Build 2016, hemos podido ver una demo realizada con un desarrollador invidente que utiliza unas gafas que llevan diferentes sensores y le permite conocer e interactuar con su entorno de una manera natural, facilitándole, por ejemplo, la lectura del menú de un restaurante, gracias a dichas gafas, que son capaces de leerla y comunicarle lo que está escrito. Todo ello hace uso de sistemas cognitivos que analizan los datos recogidos por los sensores y los interpretan gracias a los diferentes servicios.
Toda la documentación se encuentra disponible en la web de Microsoft Cognitive Service.
Rubén Asensio García
@butcher086
Intern Technical Evangelist