Percepción Razonamiento Acción como base de la electrónica de consumo

deep learning

Hasta ahora, y salvando intentos más o menos logrados, los dispositivos ofrecían unas prestaciones genéricas, que el usuario adaptaba a sus necesidades.

Pero algo está cambiando en la electrónica de consumo, influenciada principalmente por la feroz evolución de la inteligencia artificial, la miniaturización/rendimiento de componentes y las brechas cada vez más bajas del hardware/software.

Un escenario en el que los dispositivos son capaces de recopilar, analizar y aprender de cualquier estímulo al que tengan acceso. De actuar, a fin de cuentas, como un organismo vivo, con las propias restricciones de una ciencia creada por seres humanos que acaba prácticamente de nacer.

Aprendizaje Profundo en dispositivos comerciales

Hablamos del inicio del Deep Learning (Aprendizaje Profundo) en entornos donde el consumidor final juega un papel protagonista, frente a sectores de alto rendimiento, donde este tipo de tecnologías llevan presentes varios años.

Un conjunto de tecnologías basadas en los tres principios que comentaba en el título:

  • Percepción: la capacidad de una máquina para obtener información y almacenarla de forma lógica en algún soporte (físico o virtual). Y el principal escollo con el que históricamente nos hemos encontrado es la dificultad de hacerle “entender” a una máquina cómo debe modelar las abstracciones de un estímulo externo (por ejemplo, la información de un paisaje) para obtener un modelo de información que sea razonable informáticamente hablando. En el caso antes mencionado, quizás un archivo jpg con el paisaje no ofrezca a priori un modelado razonable para procesar la información que ese paisaje nos da. Por contra, un vector de pixeles, o un archivo con modelados tridimensionales quizás arroje más inmediatez en el proceso de razonamiento informático. Esto es algo en lo que los humanos, y en general, la mayoría de seres vivos, somos muy buenos (aunque no entendamos del todo cómo lo hacemos). Discriminamos información de forma casi instantánea, quedándonos con lo básico y uniendo magistralmente los puntos para que a efectos prácticos nuestro cerebro no se de cuenta que trabaja con muy poca información. Pero trasladarlo a un entorno informático, y que para colmo este lo trabaje de forma automática, es otro cantar.
  • Razonamiento: Recopilada la información, toca procesarla. Obtener conocimiento, basándose tanto en la nueva información como en el historial de información ya analizada. Categorizar esa entrada además para que la próxima vez tengamos un recurso desde el que basarnos. Y siempre y cuando tenga claro qué va a recibir y qué debe devolver, una máquina nos da mil vueltas. Pero no es ni adaptativa ni hemos sabido aún programar un sentimiento subjetivo que sea capaz de llevarle la contraria a la objetividad pura y dura (otro mantra de nuestra especie), y aquí se encuentra el segundo handicap. Cuando las entradas son a priori desconocidas, se precisa llegar a un nivel de abstracción informativo que es complicado de materializar informáticamente.
  • Acción: Procesada la información, responder según el criterio adecuado. El más cercano al objetivo prefijado, basado en nuestra experiencia. De ahí que cualquier animal se aparte del fuego porque sabe que eso quema, o que conforme más sabemos sobre un tema más complejidades somos capaces de afrontar.

Las ventajas sociales y evolutivas de un Aprendizaje Profundo

Y esto es de por sí trascendental, ya que es ahora y no hace unos años cuando tenemos la capacidad para llevar la electrónica de consumo un paso más allá. Unos dispositivos repletos de sensores, capaces de recopilar muchísima información del entorno inmediato. Con una capacidad de procesamiento que rivaliza en según qué aspectos con la que encontramos en un escritorio, y unos outputs regidos por la flexibilidad de lenguajes de programación cada vez más abstractos, más cercanos a la forma de comunicación de nuestra especie.

Pienso en ello, y se me iluminan los ojos al ver las inmensas posibilidades que ofrece tremendo procesamiento en un dispositivo tan asequible, que todos portamos en nuestro día a día.

Ya no hablamos únicamente de que sea el producto quien se adapte a nuestras necesidades, quien aprenda de nuestros gustos, sino enfocado a posibles situaciones de asistencia que podrían sentar precedentes.

Se me viene a la mente personas con movilidad o sentidos reducidos, con problemas mentales, que podrían de esta manera delegar parte de aquellas tareas diarias que por su afección se vuelven complejas en la tecnología que llevan en el bolsillo, en sus muñecas.

Es innegable también, y pensando a nivel de sociedad, las implicaciones de una recolección inteligente de grandes volúmenes de información. De aprendizaje automático, con vistas a descubrir correlaciones que posiblemente para el ser humano sean prácticamente imposibles de relacionar.

Y cómo no, ese paso esperable a una tecnología invisible, que ayuda sin ser percibida como molesta. Una asistencia virtual adaptativa, que interrumpe justo cuando es necesario hacerlo.

Las repercusiones de una inteligencia masiva y omnipresente

Ya no solo en aquel mundo distópico en el que la máquina acabara por entender que la mejor manera de ayudar al ser humano es destruyéndolo, sino por los usos nocivos que tendría esta tecnología en malas manos.

A nivel de Percepción, tecnologías que empiezan a sentar precedentes en la industria como el Ambient Location o el Ambient Listenning and Seeing atentan contra la privacidad del usuario. De un usuario que habitualmente desconoce estos mecanismos, y las implicaciones que conllevan en su día a día.

El Razonamiento en electrónica de consumo parece que empieza a estar a la altura para dejar de depender de la nube, y gestionarlo de forma local, sin comunicación externa. Lo veíamos con la gestión de identidades del TouchID de Apple, y quizás sea el germen de un futuro esperanzador para la paulatina adopción del Aprendizaje Profundo sin repercusiones nocivas al cliente.

Es quizás, en la Acción, donde más ojos hay puestos. Porque ser capaces de identificar un posible futuro riesgo cardíaco en un cliente podría, como veíamos a principios de la semana, aumentar el precio de un seguro. O quizás señalarnos como posibles sujetos peligrosos para el sistema. No por hechos que haya ocurrido, sino por el propio análisis masivo de información.

Y pienso todo esto después de conocer que los nuevos chips Snapdragon 820 de Qualcomm que veremos dentro de poco en la mayoría de terminales top del mercado vienen con lo que ellos han llamado Qualcomm Zeroth (EN), una plataforma de computación cognitiva que aprenderá de nuestro entorno y de nuestros hábitos para “adaptarse” a nuestras necesidades.

Para monitorizar todo lo que ocurre a nuestro alrededor, siendo potencialmente explotable con fines tanto beneficiosos (extender la duración de la batería, adaptar el menú o escritorio principal según el lugar y hora a la que estemos) como perjudiciales (espionaje gubernamental masivo, abuso de privacidad, fugas de información personal) para el usuario.

 

Decía Linus Tolvards, a la pregunta de por qué no había más gente evolucionando el kernel de Linux:

“El tiempo de las soluciones sencillas a problemas sencillos hace mucho que pasó”

Saque entonces sus propias conclusiones :).