Este es un ejemplo de los artículos que semanalmente escribo de forma exclusiva para los mecenas de la Comunidad.
Si quieres recibir contenido exclusivo como éste directamente en tu bandeja de correo, revisa las opciones de mecenazgo de esta página.
*******
No me cansaré de repetirlo:
Con un universo de información suficientemente completo a analizar, no hay bases de datos que estén realmente anonimizadas.
Y esto aplica a todo soporte digital.
Ya expliqué en su día cómo es posible incluso crear huellas maestras de sistemas de verificación de identidad a priori tan únicos como son los biométricos, sencilla y llanamente porque todo sistema informático tiene que tener un margen de error (si no sería en la práctica inutilizable), y ese mismo margen abre la vía a falsos positivos/negativos.
La New York University (NYU), en conjunto con la Tandon School of Engineering y el colegio de ingeniería de Michigan State University, han publicado un estudio (EN) en el que demuestran que esta medida de seguridad podría ser burlada sin recurrir a los dos escenarios anteriores (complejos de materializar en la vida real) con una suerte de «huella maestra».
Para ello partieron de una muestra de 8.200 registros parciales de dedos de distintos usuarios. De ahí obtuvieron 92 potenciales huellas maestras (una por cada 800 impresiones parciales), cada una capaz de bypasear los controles estándares en un 4% de los bloqueos.
Con éstas, buscaron los puntos en común, generando una suerte de patrón maestro que sirvió para bypasear los controles en un entre 26 y 65% de los casos. Casi uno de cada dos dispositivos protegidos por huella podrían ser atacados eficazmente bajo una técnica semejante.
Este estudio tiene ya tres años, y sigue tan vigente como si hubiera sido publicado ayer.
Falacia datos anonimizados
¿Quieres más?
Pues lo comentábamos el mes pasado en otro artículo exclusivo para mecenas.
En la batalla entre reconocimiento facial y sistemas de desidentificación facial, sencilla y llanamente los segundos tienen las de perder, por el simple hecho de que por sus propias particularidades la industria de la inteligencia artificial funciona mejor a mayor músculo.
A mayores recursos, más avances y en menor tiempo. De ahí que China, un país donde sistemáticamente se saltan los derechos civiles, sea ya la potencia mundial en machine learning. No es casualidad, es simplemente que el caldo de cultivo (millones y millones de ciudadanos 24/7 siendo espiados) es más rico.
¿Y dónde hay puestos más recursos? ¿En mejorar los sistemas de identificación, o en ofuscarlos?
No hace falta que respondas. Ya sabemos cómo funciona el mundo (tanto geopolítica como económicamente).
Hoy vuelvo con otro estudio, esta vez de Mozilla, que ha querido reproducir y ampliar la investigación del 2012 del investigador experto en privacidad Lukasz Olejnik, con un nuevo paper (EN) titulado “Por qué seguimos sin poder navegar en paz: sobre la singularidad y la identificabilidad de los historiales de navegación web“.
¿Resultado? De 52.000 perfiles de navegación de usuarios de Firefox, los investigadores pudieron identificar 48.919, una cifra que apenas se reducía incluso cuando sólo se tenían en cuenta los 100 sitios web más relevantes de cada historial.
Y cojo de él algunos apuntes que me parecen dignos de mención:
La tasa de exclusividad del historial de navegación web, calculada utilizando métodos similares al de nuestro estudio, resultó ser del 99%. [La investigación] indica también que los usuarios pueden ser reidentificados mediante técnicas de fingerprinting en el 80% de los casos. Tales cifras resultan sorprendentemente altas.
En resumidas cuentas: que tu historial de navegación es identificativo de tu persona en un 99%. Por mucho que utilicemos HTTPs para conectarnos, por mucho que ofusquemos nuestra IP, por muchos que marquemos que no queremos ser traceados, por mucho que usemos el modo incógnito, etc etc etc.
Que por mucho que Google modifique sus sistemas para proteger nuestra privacidad, y por mucho que retoquemos la política de cookies, la realidad es que todo esto no tiene ningún impacto mientras el historial de navegación pueda ser rastreado.
Los grandes agentes, esos que tienen músculo tecnológico o financiero suficiente, van a poder seguir rastreándonos e identificándonos en cualquier conexión, por mucha anonimización que pongamos entre medias.
Y mientras no ataquemos de frente esta problemática, no hay mucho más que hablar al respecto.
________
Este es un ejemplo de los artículos que semanalmente escribo de forma exclusiva para los mecenas de la Comunidad.
Si quieres recibir contenido exclusivo como éste directamente en tu bandeja de correo, revisa las opciones de mecenazgo de esta página.