Este es una de las newsletters antiguas que se enviaron de forma exclusiva a los miembros del Club Negocios Seguros, y que se liberan públicamente un mes más tarde.

Si quieres recibir las actuales cada martes y jueves en tu bandeja de correo, hazte miembro ahora.

*******

Negocios Seguros

scraping osint

Quien escribe estas palabras ha creado su negocio alrededor del paradigma del OSINT, del análisis de los datos públicos que podemos obtener de cualquiera en Internet.

Gracias a ello, por ejemplo, puedo establecer una estrategia que ayude a un cliente a vender más por Internet (Presencia Digital), o puedo encontrar la manera de minimizar el impacto reputacional de una crisis, ya sea presente o futura (Reputación Online).

Los propios sistemas de monitorización (Escucha Activa) que usamos en CyberBrainers se dedican a hacer scraping web y análisis de social intelligence en redes sociales, es decir, a aprovecharse de las APIS que nos dan estas herramientas de búsqueda para obtener inteligencia de ese big data desestructurado que pulula, de forma pública, por la Red.

EliminamosContenido se basa, precisamente, en la premisa de que la ley cubre qué se puede difundir públicamente en soportes digitales sobre una persona o compañía, y qué no.

Hasta EdicionesPY, si me apuras, nace gracias al hecho de que ahora es posible acceder desde nuestro navegador a la práctica totalidad de obras escritas por el ser humano, y la necesidad de todos esos creadores de contenido de tener un soporte profesional que les permita posicionar su obra en ese océano de publicaciones.

Dejo esto claro desde el principio para remarcar que soy ferviente creyente de que el OSINT cumple un cometido más que necesario en la sociedad.

Ahora bien, como todo en esta vida, quizás debiéramos marcar unos límites.

Porque por un lado, como decía, hay negocios como el mío, que intentan aportar a la sociedad. Solucionar problema que afectan de verdad a personas y compañías.

Y en el otro lado tenemos empresas como Clearview AI, que han construido un negocio alrededor del scraping masivo en Internet, y cuyo impacto se me antoja que solo repercute positivamente a unos pocos.

Los límites del scraping masivo

A priori, lo que hace Clearview AI es totalmente legítimo.

Ellos screapean todo Internet en busca de pares de información, que en este caso se trata de fotos y de nombres, para crear una base de datos identificativa.

Dicho así no suena del todo mal. El problema es que:

  • Por un lado, parecen no tener reparo en utilizar tanto aquel contenido expuesto públicamente… como aquel otro que no es público, pero sí accesible por sus arañas, utilizando para ello argucias tecnológicas que explotan vulnerabilidades de acceso a las APIs.
  • Por otro lado, toda esa inteligencia es revendida a terceros, compañías privadas, públicas y organizaciones gubernamentales, para los fines que estimen estas oportuno.

Y ojo, que no hablamos de una base de datos pequeña precisamente. Clearview AI se jacta de tener más de veinte mil millones de retratos identificados con el nombre de quien aparece en ellos. Es más, probablemente si alguna vez has publicado una foto tuya asociada a un identificador (por ejemplo, en tus perfiles en redes sociales), lo más seguro es que Clearview AI ya tenga al menos un retrato tuyo almacenado en sus servidores.

Plataformas como Twitter (EN), Facebook o LinkedIn (EN) llevan años denunciando estas prácticas sin mayor éxito. Y si hablamos hoy de esta empresa en particular ha sido porque por primera vez, y de la mano de la American Civil Liberties Union, se ha conseguido llegar a un acuerdo EXTRAJUDICIAL (EN) que evitará que vendan su información únicamente a empresas privadas (al resto de organizaciones seguirán pudiendo vender nuestros datos).

Lo peor de todo es que países como Australia (EN)Francia (EN)Italia (IT) y el Reino Unido (EN) han multado a Clearview y exigido la retirada de las imágenes de sus ciudadanos de su base de datos, pero la compañía y su CEO, Hoan Ton-That, afirman que «Clearview AI no tiene sede en la UE, no tiene clientes en la UE, y no realiza ninguna actividad que implique que está sujeta a la GDPR». Algo claramente falso, ya que sí están almacenando información de ciudadanos de todas las partes del mundo, europeos incluidos, y por tanto protegidos por la GDPR.

Eso y que habría que ver si en efecto no cuenta con clientes en la zona, que torres más altas han caído en el pasado…

El caso, y es aquí donde quería llegar, es si situaciones como esta, amparadas bajo el principio de que cualquier contenido expuesto públicamente en Internet es susceptible de ser explotado, no deberían estar limitadas por algo que a todas luces parece de sentido común.

Hay una diferencia más que sustancial en lo que puede hacerse con fines locales y marginales, y lo que atenta contra la integridad identitaria global.

Ya en el mismo momento en el que esa información, que pudo o no ser obtenida de un dominio público, es revendida a terceros, debería ser motivo más que suficiente como para imponer unas severas restricciones.

Otra cosa es que casualmente, quienes son los encargados de llevar a cabo estas regulaciones, estén o no interesados en que empresas como Clearview AI, NSO Group (del cual ya hablamos largo y tendido no hace mucho) o Palantir (otra que tal baila…) sigan operando en una aparente alegalidad…

A fin de cuentas, ¿qué gobierno no querría tener bien a mano una manera sencilla y estructura de identificar a cualquier ciudadano?

________

Si quieres recibir contenido exclusivo como éste el día uno y directamente en tu bandeja de correo cada martes y jueves, hazte miembro del Club «NEGOCIOS SEGUROS».

Banner negocios seguros