En el mundo digital hay dos frentes que llevan abiertos casi desde su inicio, y que podrían romper el equilibrio donde se asienta la red de redes si uno acaba por anteponerse al otro: Hablamos del duopolio privacidad/identidad, un tema que he tratado (y seguramente, seguiré tratando) hasta la saciedad en esta humilde morada, y que plantea una de las guerras más peliagudas en el tercer entorno.
Por un lado, estamos los defensores de un Internet donde el usuario sea quien gestione los datos que quiere exponer. Un Internet que permitiría el anonimato, y donde las herramientas de rastreo, como la que hablaremos a continuación, estarían únicamente diseñadas para prevenir el uso malintencionado de la red.
Por otro lado, están las empresas que ofrecen los servicios que todos consumimos. Unos servicios que, cada vez con más frecuencia, pagamos con datos y no con dinero, lo que permite a la herramienta una vertiginosa expansión a costa de la poca cultura digital que tenemos, a costa de apoyarse en la falacia de la gratuidad.
Hay que entender también que este corral no es sino la evolución de aquello que en su día demandamos. El servicio tiene que seguir viviendo de algo, y si el cliente prefiere hacer oídos sordos y pagar con un intangible como son los datos, adelante. Pero pagar hay que pagar, de una u otra forma.
Así es como llegamos a realidad en la que buena parte de los servicios se monetizan gracias a la publicidad. Como el índice de acierto de la publicidad es verdaderamente bajo, hemos vivido una paulatina sofisticación de su metodología, desde aquel disparo de cañón con la esperanza de que acertase en la mosca adecuada, a la hipersegmentación que tenemos en herramientas como Facebook o servicios de búsqueda como Google. Una segmentación que se hace ya no solo estudiando el historial de uso del propio cliente en el servicio, sino sus hábitos y la contextualidad de ellos.
Para esto, se recurrió en su momento a las Cookies, piezas fundamentales todavía hoy del entramado de monitorización y paralelización de Internet. Y su aparición permitió ya no solo segmentar con mayor acierto la publicidad mostrada, sino adaptar los servicios al uso que el cliente les daba, lo cual es bueno.
El problema viene, una vez más, del propio sistema en el que está basado la economía digital. La evolución del precio de la publicidad tiende a cero, lo que obliga a las herramientas de contextualización a sofisticarse y recopilar cada vez más datos, rozando cada vez más lo que es socialmente aceptable y aquello que atenta contra los derechos humanos.
Las cookies, hoy en día, permiten tener un registro bastante completo del uso que un cliente le da a un servicio, pero también, y puesto que son documentos públicos, permite a otros servicios recopilar esa información, lo que en la práctica, dota a quien está detrás de un sistema de rastreo sistematizado, ya no únicamente en sus dominios, sino en cualquier otro ámbito de la red.
Para prevenir esto, surgen herramientas de limpieza de cookies, que acaban por hacer pagar justos por pecadores tanto los que utilizaban esta técnica para aportar valor al cliente, como aquellos que la usaban para mostrar publicidad de forma legítima, como aquellos que se aprovechaban de la misma para otros ámbitos de dudosa moralidad.
¿Cuál es la respuesta de la industria? Sofisticar la técnica, apoyándose en la capacidad actual de los ordenadores de analizar grandes volúmenes de datos y sacar valor de ellos. Así surge el Canvas fingerprinting, que no es más que una recopilación de técnicas entre las que las cookies serían una más. Cuando un cliente visita un servicio, se analiza su huella digital, que estaría formada por las cookies, por el tamaño de la pantalla, por el tipo de anti-aliasing, por las cabeceras que envías (navegador, sistema operativo,…), por los plugins instalados, por las tipografías instaladas en el SO y así un largo etcétera.
Se recopila todo lo que el servidor puede recopilar, y con ello se genera una huella digital que a efectos prácticos podemos considerar individual. Y de nuevo, esto se aplica para bien (mejora del propio servicio adaptándolo a los usuarios) o para mal (rastreo sistematizado de hábitos para aplicarlo por ejemplo al control de lo que el usuario acaba consumiendo).
¿Hay algo que podamos hacer para evitarlo? Por Genbeta (ES) publicaban un artículo sobre las posibles salidas, que bajo mi punto de vista, es bastante acertado. No hay una herramienta anti canvas fingerprinting, puesto que canvas fingerprinting no es una técnica, sino la unión de muchas. De entre todo lo disponible, lo más cercano (sin volverse un paranoico y desactivar todas las tecnologías que hoy en día nos permiten disfrutar de una web dinámica y enriquecida) quizás sea el uso de TOR, ya que de base es una suite que implementa varias herramientas con un nivel bastante ajustado de privacidad/usabilidad, descontando que el propio navegador (una versión modificada de firefox) es para todos igual (algo que no pasa con el resto de navegadores).
Pero claro, hablamos de utilizar un servicio que vuelve la navegación a como era hace unos diez o quince años, e incluso obviando esto, seguiríamos corriendo el riesgo de que el porcentaje de uso de TOR sea incluso más bajo que la información que canvas fingerprinting es capaz de obtener de nuestro uso directo en un navegador comercial.
La respuesta, por tanto, no es algo trivial, y cada uno debe decidir hasta qué punto quiere ser anónimo, y hasta qué precio quiere pagar por disfrutar de una red actual.
Imagen de Maxkavakcov, Fingerprint on digital screen (EN) cedida por Depositphotos.com.
Este tema hace dos dias que lo leí por primera vez (seguro que hace tiempo que ronda pero no estoy muy al dia) y encontré una extension de chrome que promete bloquear algo, bastante, este tema, se llama chameleon y hay que bajarla desde GitHub, de momento va bien, no me ha dado problemas.
Sí Leo, Chameleon lo que hace es bloquear parte de la información que el navegador entrega, como el listado de fuentes, las reglas de ventanas, sus medidas, y alguna más.
El resultado final es que, sin perder muchas prestaciones de la web, estás entregando menos información, y por tanto, es de esperar que la ID que se te asocie sea lo menos exacta posible.
Pero aun así no es la panacea. Se deja fuera (como es normal) decenas de parámetros que pueden ser consultados por javascript y que podrían dar una huella bastante exacta. Pero claro, si quieres controlarlo todo, al final lo que obtienes es una usabilidad en la mayoría de las webs terriblemente mala.
Igualmente, muchas gracias por la recomendación. Dejo el enlace para cualquier interesado: Chameleon (EN).