facebook data

Hace ya unos cuantos meses escribía por estos lares una pieza de la que estoy bastante orgulloso: «La importancia de la seguridad del flujo de datos en un entorno abierto«.

En ella, explicaba de la mano de un caso (por aquel entonces) reciente cómo era posible identificar usuarios supuestamente anónimos mediante la tergiversación de uso de algunas de las herramientas que plataformas como Facebook e Instagram nos ofrecen. En particular, hablaba de la investigación de una periodista que había conseguido identificar las cuentas personales de nada menos que el director del FBI.

Para ello, se valió de una corazonada (Google Hacking para llegar a diferentes contenidos presumiblemente relacionados con James Comey y su familia), y tirando del hilo (comentarios, reshares, retweets, likes…) acabar sacando la cuenta de Instagram de su hijo. La propia red social, una vez entendió que quizás conocía al hijo del director, le sugirió que siguiera a otra cuenta con la que al parecer tenía bastante relación, que daba la casualidad que se trataba de la de su padre.

Es un ejemplo más de los muchos que me encuentro en mi día a día en los emails que me enviáis. El caso es que el flujo de información no es seguro, y segurizarlo se plantea una verdadera odisea en el momento en el que somos conscientes de que esto restaría muchísimas funcionalidades a unas plataformas cuya principal funcionalidad es… ofrecer relaciones.

Los algoritmos detrás de sistemas como el de sugerencia de perfiles a los que seguir se basan precisamente en la buena praxis que tengan los usuarios a la hora de utilizarlos. Ni Facebook, ni Instagram, ni Twitter, ni en definitiva ninguna de estas grandes plataformas sociales está cediendo proactivamente datos a usuarios, pero es que por la propia manera que tienen de funcionar, y a poco que quien las utilice sepa realmente qué está haciendo, se vuelven de facto herramientas profundamente interesantes para segmentar y hasta identificar ciudadanos.

Lo he comentado, de hecho, por activa y por pasiva por estos lares. ¿Cuántos ejemplos he puesto por aquí de sistemas de segmentación publicitaria utilizados para segmentar usuarios con fines que van bastante más allá de los que dicta el negocio? Desde discriminar ciudadanos por raza, cultura, religión o edad, pasando, por supuesto, con la identificación de colectivos minoritarios específicos.

¿Y tiene entonces culpa la plataforma de ello? El problema es ese, que tampoco podemos criminalizarlos. Para Facebook, Google y el resto de grandes gigantes de Internet erradicar este tipo de tergiversaciones es hoy en día una de sus principales máximas. Su negocio se basa en la confianza que los usuarios depositen en su plataforma, y cada vez que salen noticias como la que vamos a hablar hoy, hay más usuarios que caen en la consideración del problema y un porcentaje de ellos deciden abandonarlas.

Toca volver a hablar de política

Y para colmo, otra vez de política estadounidense.

El caso es que este fin de semana The Guardian (EN) publicaba un extenso informe en el que demostraba cómo en la campaña presidencial de Donald Trump se habían utilizado 50 millones de perfiles «robados» a Facebook. En el artículo hablan de una filtración masiva de información de potenciales votantes, pero en las últimas horas han tenido que editarla para explicar que realmente no se trata de un filtrado, sino, siguiendo con la terminología que a mi forma de entender es más correcta, otro ejemplo más de fallo en la seguridad del flujo de información.

¿Que los republicanos han utilizado los datos de millones de cuentas de Facebook para ganar las elecciones? Menos lobos, Caperucita, que ni mucho menos son los primeros. Sin ir más lejos, Obama llegó al poder y se mantuvo durante los dos últimos mandatos precisamente gracias a una labor titánica en eso de sacar oro del petróleo del siglo XXI, financiado por supuesto por el partido demócrata. Y aquí en España Rajoy y el PP contrataron precisamente al mismo equipo de los demócratas estadounidenses para que les ayudara a entender a qué puertas tenían que picar (ES):

¿O piensa que es casualidad que nuestro presi no apareciese en ningún debate público con el resto de potenciales candidatos (en base a los datos registrados, se dieron cuenta que el porcentaje mayoritario de potenciales votantes del PP no estaban interesados en este tipo de debates) y sí lo hizo, por ejemplo, en un popular programa de fútbol? 

Pues eso :).

Pero vamos al grano. En el centro de toda esta operación está Cambridge Analytica, una empresa dedicada a la analítica científica, que al parecer utilizó de forma irregular la información proveniente de 50 millones de usuarios de Facebook en EEUU.

¿Que cómo lo hizo? No explotó ningún fallo de seguridad en los sistemas de la californiana, sino que simplemente se los pidió a Facebook y ellos les dieron acceso.

Por supuesto, aquí hay gato encerrado, y es que el uso de esa información estaba únicamente permitido para fines académicos, ni de lejos para uso civil o empresarial, como fue el caso.

Hasta aquí era hasta donde quería llegar. Realmente la compañía tenía derecho a utilizar esos datos para fines puramente estadísticos, pero no para una campaña política. Con ellos, construyeron un sistema capaz de perfilar votantes estadounidenses de forma individual, para luego dirigirse a ellos con publicidad política personalizada.

Obtuvieron mediante una app para psicólogos llamada ThisIsYourDigitalLife los datos, pagando, de unos 270.000 usuarios, y a partir de ahí, obtuvieron los de sus amigos, hasta llegar a esos 50 millones.

Sobra decir que Facebook ha suspendido las cuentas de todos los relacionados con la trama (EN), pero el mal ya está hecho.

¿Quién es el culpable y qué se puede hacer para minimizar futuras campañas semejantes?

Y aquí es donde viene el problema. Hay poco que se pueda hacer para remediar situaciones parecidas en el futuro. El enemigo aquí no es la tecnología, sino las aspiraciones (y tergiversaciones) del humano.

El riesgo a que la herramienta sea utilizada para causar el mal, como ya expliqué en su día. Un censo que incluya intereses religiosos no es, per sé, algo dañino, y además puede tener asociado acciones verdaderamente positivas para la sociedad (por ejemplo, optimizar los presupuestos nacionales en función de las necesidades religiosas de cada colectivo). Pero en manos de los nazis de la Segunda Guerra Mundial se convirtió en un arma capaz de identificar y erradicar hasta el 90% de los judíos holandeses.

Con Facebook, Instagram, WhatsApp, Twitter, Google, Amazon… pasa exactamente lo mismo. Son herramientas verdaderamente valiosas para nuestra civilización. Han conseguido tejer un ecosistema informativo capaz de unir prácticamente cualquier persona, indistintamente del lugar en el que esté.

Pero a la vez, esa democratización informativa puede ser aprovechada por colectivos interesados en radicalizar a un porcentaje significativo de la sociedad. Solo hace falta tener la información adecuada del target y crear un copy específicamente diseñado para ello, que estas herramientas ya nos ofrecen el canal para llegar a las potenciales víctimas.

Este finde, por cierto, un familiar cercano me enviaba por WhatsApp un audio de un «periodista» de radio que demostraba con hasta 15 «hechos» cómo los inmigrantes se estaban aprovechando de las ayudas sociales pagadas por todos los españoles. Por supuesto, yo le pasé otros enlaces, escritos esta vez no por cualquiera, sino por dos autoridades en materia (Amnistía Internacional (ES) y el Ayuntamiento de Barcelona (ES), las dos que me salieron primero tras una búsqueda en Google que me llevó unos 20 segundos).

Pero claro, mis dos enlaces eran «sesgados». El suyo no…

Con lo que quiero que se quede es con esto:

Necesitamos hacer comprender al usuario de a pié la necesidad de labrarse una capacidad crítica a la hora de consumir información, venga de quien venga.

La gente solo quiere que le digan lo que piensa, y con este escenario, es normal que un personaje como Donald Trump salga elegido presidente de EEUU. Es normal que la tercera fuerza política en Alemania (¡en Alemania!) sea la extrema derecha.

La realidad es muchísimo más compleja, y no se presta habitualmente a razonamientos de «blanco o negro». Justo los que mejor funcionan en plataformas sociales. Justo a lo que estamos constantemente impactados en nuestros timelines. Justo en lo que mejor son los algoritmos de recomendación que rigen cada vez más lo que vemos y lo que dejamos de ver.

¿Es un problema de las plataformas digitales? No. Ellas están haciendo todo lo posible para mejorar. Es un problema de los humanos, la mayoría porque somos incapaces de ver más allá, y unos pocos listillos por ser conscientes de ello y aprovecharse, esgrimiendo la supuesta y falaz neutralidad informativa que desde el principio nos han vendido como real.

 

Edit una semana más tarde: Actualizo para incluir el enlace a la entrevista que me hacían los chicos de LNE sobre el impacto de la crisis reputacional que está experimentando Facebook.