Pasar al contenido principal

Los asistentes virtuales capaces de interpretar la voz del usuario y de ejecutar un conjunto de acciones en consecuencia son un tópico anteriormente asociado a la ciencia ficción que se han introducido progresivamente en nuestras vidas. En los últimos años se ha popularizado un conjunto de aplicaciones comerciales que cumplen esta premisa, integrando una inteligencia artificial basada en la nube que interpreta los comandos de voz capturados por el micrófono instalado en el dispositivo del usuario (teléfono móvil, altavoz inteligente...).

Principales asistentes virtuales comerciales

Principales asistentes virtuales comerciales

Estos asistentes virtuales se encuentran en prácticamente cualquier teléfono móvil, ordenador, tablet o incluso electrodomésticos. El dispositivo físico es un simple encargado de capturar el comando de voz del usuario (normalmente precedido de una wake word que activa la escucha como “Alexa” o “Ok Google”) y de reproducir la respuesta generada por la inteligencia artificial remota. Es esta inteligencia artificial la encargada de interpretar el comando de voz mediante técnicas de reconocimiento de lenguaje natural y de ejecutar un conjunto de acciones asociado al comando. Estas acciones pueden tener un carácter informativo (“¿Qué tiempo hace en Gijón?”) o interactuar a su vez con otros dispositivos remotos conectados a internet, lo que nos permitiría crear un sistema integral de domótica en el que múltiples dispositivos conectados son gestionados con comandos de voz.

 

Además de la ejecución de acciones concretas mediante comandos de voz, los asistentes virtuales permiten definir rutinas automatizadas en las que se definen los horarios específicos en los que ejecutar cada acción (“Bajar persianas al atardecer”). Otras rutinas similares podrían definir la interacción con un termostato inteligente cuando la temperatura sale de un umbral o la interacción con la iluminación del hogar.

 

El mercado de los asistentes virtuales de reconocimiento de voz está formado principalmente por: Alexa (Amazon), Cortana (Microsoft), Siri (Apple) y Google Assistant (Google). Todas las alternativas anteriores son soluciones comerciales que se apoyan en servicios en la nube. Como alternativa open source se podría mencionar Home Assistant, con un enfoque centrado en la privacidad, que puede ser instalado en una Raspberry Pi para gestionar la domótica de una vivienda.

Interfaz de Home Assistant para la gestión de dispositivos

Interfaz de Home Assistant para la gestión de dispositivos

La funcionalidad de los asistentes virtuales no se limita al ámbito de la reproducción de música o la consulta de información. Todos ellos ofrecen integración con múltiples productos inteligentes de otros fabricantes, lo que permite ampliar notablemente las capacidades del asistente virtual. Esto permite que usuarios que hasta ahora eran ajenos a la domótica o a ámbitos como el Internet of Things (IoT) sean capaces de experimentarlo en sus propias casas de manera sencilla y transparente.

 

Alexa Voice Service (AVS)

Todos los asistentes virtuales tienen algún tipo de integración con dispositivos externos, pero nos centraremos en Alexa para explicar cómo es capaz de integrarse con miles de dispositivos y controlarlos, ya que posee una documentación extensa al respecto.

 

La inteligencia de Alexa se encuentra mayoritariamente en la nube. Aunque los dispositivos de Amazon poseen una cierta capacidad para trabajar offline, las funcionalidades completas sólo se consiguen a través de la conexión a los servidores de Amazon. Los dispositivos oficiales de Alexa (Amazon Echo, Amazon Dot...) poseen un conjunto de micrófonos, altavoces, un microcontrolador y una conexión WiFi. Estos dispositivos utilizan la conexión inalámbrica a la red para conectarse con los servicios de voz de Alexa, enviar el comando grabado, recibir una respuesta y actuar en consecuencia. Todo esto se realiza a través de una API HTTP/2 que recibe grabaciones y un código de autenticación.

 

Por otro lado, AVS permite registrar dispositivos adicionales compatibles, como puede ser una bombilla inteligente, un enchufe, otros Amazon Echo… Esto permite la integración de múltiples dispositivos y la creación de rutinas que con un solo comando de voz ejecuten múltiples tareas secuenciales. Estos dispositivos se añaden de manera sencilla, pero distinta en función del fabricante.

 

Por otro lado un usuario puede crear un dispositivo compatible utilizando las herramientas aportadas por amazon AVS Software Development Kit (SDK). Estas herramientas permiten integrar un dispositivo genérico como una Raspberry Pi con las funcionalidades en la nube de Alexa. Para ello está disponible el servicio llamado Alexa Skills, en el que se registran utilizando un fichero JSON que lista sus propiedades y capacidades, se les da un alias que reconocerá el software de reconocimiento de voz y se asocian a la cuenta de Amazon. Con este servicio es posible crear prácticamente cualquier tipo de sensor o actuador ligado al asistente virtual.

 

El avance en este tipo de tecnologías acerca el mundo de la domótica y el acceso a la información a muchos más usuarios sin la necesidad de invertir en complejas y caras instalaciones. Con una sencilla orden a tu asistente virtual se puede actuar sobre la iluminación, la temperatura o cualquier enchufe de nuestra casa, así como escuchar tu emisora de radio favorita o conocer el tiempo en tu ciudad. Los asistentes virtuales han llegado para quedarse, y es cuestión de tiempo ver qué nuevas soluciones pueden aportar a nuestra vida diaria.

 

Daniel Ibaseta e Ivan Gallego

CTIC Centro Tecnológico

TAGS