filtrados dall-e mini stable diffusion

Estos últimos días ha habido bastante revuelo en el sector tech/creativo con la llegada de Stable Diffusion, una herramienta de dibujado automático mediante redes de inteligencia artificial generativa antagónica (GANs por sus siglas) que genera imágenes bastante realistas a partir de texto.

Por supuesto, no es la primera. Por ahí tenemos Dall-E Mini, que hace exactamente lo mismo pero con menor calidad, o Dall-E, que es probablemente la más potente de todas.

El uso de este tipo de sistemas, como decía, no es ni mucho menos nuevo, pero lo que sí es es que en lo que llevamos de año los recursos necesarios para hacer correr estos sistemas se han reducido lo suficiente como para que ahora mismo cualquiera de nosotros con un ordenador actual pueda trastear con ellas desde casa.

Es más, estos días surgían proyectos web que permitían hacer lo mismo tanto con Stable Diffusion, como con Dall-E Mini, GRATIS y de forma directa en UNA PÁGINA WEB.

Por supuesto, el que de pronto miles de entusiastas puedan poner a prueba estos sistemas hace que se les empiece a ver las vestiduras, y en este artículo quería hablar, principalmente, de su uso como potencial producción de deepfake y contenido pornográfico.

Cómo puedo utilizar estos sistemas para hacer mis propias pruebas

Lo primero de todo es decir que hoy en día en el mercado hay varias herramientas de generación de imágenes por texto.

La más potente de todas las conocidas, como decía, es Dall-E, pero es de pago.

Si lo que quieres es trastear rápidamente con alguna de ellas y sin tener que instalar nada, lo más cómodo es utilizar los servicios online que terceros han creado para la ocasión. A saber:

  • Stable Diffusionclick aquí (EN) y mete un texto (en inglés).
  • DALL-E miniclick aquí (EN), mete el texto, y dale a crear.

En ambos casos, por cierto, tendrás que esperar un ratito a que se procese. Hay mucha gente poniéndolas a prueba, así que por ejemplo, en mi caso, con Stable Diffusion he tenido que esperar de media alrededor de 3 minutos, cuando con Dall-E Mini, al ser ya más antigua, el proceso ha sido mucho más rápido (sobre minuto y medio por petición).

ejemplo pornografia stable diffusion
Ejemplo de una foto cortada con contenido que podemos considerar pornográfico creada mediante Stable Diffusion

Tan débil a sesgos y tergiversaciones como cualquier búsqueda en Internet

El eje central de esta prueba de concepto radicaba en el hecho de ver si era posible generar contenido pseudo-pornográfico, cuando no directamente deep-fakes, utilizando estas redes.

Y la respuesta rápida es que, como cabría esperar, es posible.

Por foros como 4Chan ya pululan varios hilos con las creaciones de estas redes, poniendo caras de famosos a escenas sexuales (deep fakes) cuando no generando contenido de tinte pornográfico aleatorio.

Algunas de estas herramientas cuentan con sistemas de protección, como es el caso de Stable Diffusion y su Safety Classifier, que intenta detectar y bloquear imágenes ofensivas o indeseables.

Sin embargo, el clasificador de seguridad, aunque está activado por defecto, puede desactivarse. Cosa que están haciendo por supuesto los interesados en generar este tipo de contenido.

El problema se junta al hecho de que algunas redes, como la de Dall-E, son capaces de generar contenido en base a las imágenes de cualquier persona, por lo que se transforma en una herramienta perfecta para generar automáticamente deep fakes.

De nada sirve que la política de uso prohíba expresamente este tipo de actuaciones, si al final hablamos de software instalado en tu propio ordenador, y por tanto, con control directo tuyo.

Un servidor ha estado, no obstante, poniendo a prueba las versiones web de algunas de estas herramientas, y estos han sido los resultados que he obtenido:

Por el texto «Gay Fucking» en Stable Diffusion no he podido generar nada
En Dall-e Mini, sin embargo, si me ha generado algún que otro contenido controvertido
Stable Diffusion en la versión web tiene un sistema de filtrado que me evita poder generar contenido de «nudes»
Con Dall-E Mini, sin embargo, no hay problema alguno. Y por cierto, fíjate que aquí se ve un claro sesgo sexista, ya que todo lo que aparece son imágenes de supuestas chicas creadas por la IA
Stable Diffusion dangerous girl
Intentando no ser tan directo con los textos, sí he conseguido algunas fotos de desnudos con Stable Diffusion, todas de mujeres, por cierto
Con Dall-e Mini, por cierto, algunas veces se dedicaba a darme supuestos cuadros y pinturas sobre lo pedido

He generado bastantes más consultas, obteniendo resultados parecidos.

La versión web de Stable Diffusion cuenta con sistemas de filtrado que o bien no me dejan generar contenido (como el primer ejemplo), o lo genera y a posteriori el sistema me lo bloquea por considerarlo potencialmente sensible. Sobra decir que basta jugar un poco más tus cartas no siendo tan explícito en la petición para que al final acabe generando de una u otra manera desnudos.

Sin embargo, con Dall-E Mini no parece haber control alguno.

Y mención aparte al hecho de que, como podemos ver el segundo caso de Dall-E Mini, el sistema reproduce los sesgos sexistas esperables de cualquiera búsqueda en Internet (al texto «porn», lo que muestra son todo fotos de supuestas mujeres semi-desnudas).

A fin de cuentas, el principal handicap que encontramos en estas herramientas es que han sido entrenadas con millones de búsquedas de Internet, y por tanto, reproducen los mismos sesgos humanos presentes en la red… y en nuestro día a día.

Recalco, eso sí, que he utilizado para ello las versiones web CAPADAS de estas herramientas. Basta navegar por foros de 4Chan para darse cuenta que es posible obtener con la versión completa de estas IAs, sobre todo de redes como la de Stable Diffusion que es mucho más realista, resultados considerablemente decentes, como sería este caso:

Stable diffusion porn

________

¿Quieres conocer cuáles son mis dispositivos de trabajo y juego preferidos?

Revisa mi setup de trabajo, viaje y juego (ES).

Y si te gustaría ver más de estos análisis por aquí. Si el contenido que realizo te sirve en tu día a día, piénsate si merece la pena invitarme a lo que vale un café, aunque sea digitalmente.