youtube-dl

Corría el año 2006, y en un pueblo asturiano «a 5-10kms de Avilés» vivía el bueno de Ricardo García (ES), un amante de la programación y el mundillo Linux.

Ese mismo año, Google compraría una «pequeña» startup llamada Youtube, que había crecido como la espuma en su corta vida en el ciberespacio, y que acabaría por ser una de las mejores compras jamás hecha en la industria tecnológica.

La premisa de Youtube por aquel entonces era muy sencilla: Democratizar la publicación de vídeos amateurs, en un entorno en el que hasta el momento la generación de contenido en vídeo parecía cosa únicamente de los grandes media.

Que ahora puede parecernos baladí, pero nada más lejos de la realidad.

De la mano de un software «quizás no muy conocido» llamado Flash (que, por cierto, el 31 de diciembre pasará ya a ser oficialmente erradicado de Internet, y que precisamente llegó a ser lo que fue gracias a su capacidad para ejecutar vídeos y gráficos vectoriales), gracias a Youtube, miles, y más tarde millones de usuarios tenían acceso a una plataforma GRATUITA donde colgar sus vídeos, permitiendo al resto visionarlos, e incluso embeberlos en otras páginas.

Pero recordemos que estábamos en 2006, y si bien la tecnología ya estaba presente, lo que no siempre se daba eran las condiciones e infrasestructura adecuadas para ello.

Ese era el caso de Ricardo, que por aquel entonces contaba únicamente con un acceso a internet por cable ADSL…. que funcionaba de aquella manera.

En teoría, y como muchos recordaremos, a Ricardo le llegaban los ya clásicos 56kb de los cables de cobre de aquel entonces. Pero con cortes continuos (hablamos de un pueblo en Asturias en 2006, pero muchos seguimos viviendo situaciones semejantes hoy en día), por lo que para mantener la estabilidad necesaria para reproducir un vídeo, necesitaba bajar esos 56kb a la mitad, y esto, en descarga bruta, pasaba a ser 4kb/s.

¿En qué se traducía esto? Pues que para intentar visionar un vídeo de tan solo 10MB, tenía que dejarlo cargando casi una hora. Eso para cada vídeo. Y ya ni hablemos si quería volver a reproducirlo…

El escenario perfecto para que surja la innovación.

El hambre agudiza el ingenio

Fue entonces cuando, para suplir esas ansias de consumir contenido de la plataforma, se le ocurrió estudiar cómo funcionaba Youtube. Mediante el antiguo Wireshark esnifó (joder, qué mal suena en español…) el tráfico que Firefox hacía para acceder a Youtube (recordemos que por aquel entonces el HTTPs era aún cosa del futuro), y lo emuló paso por paso mediante un script creado en python de 143 líneas de código.

¿El resultado? Youtube-dl, que fue lanzado en SourceForge (GitHub por aquel entonces aún no existía) bajo licencia MIT el día 8 de agosto de 2006.

Básicamente el programita lo que hacía era hacerse pasar mediante el User-Agent de Firefox por el propio navegador, y descargaba con ello el vídeo. La única diferencia es que en vez de descargarlo para reproducirlo, lo descargaba y lo almacenaba en el disco duro, de forma que el usuario podía consumir ese contenido las veces que quisiese ya en local, sin tener que recargar la página nuevamente.

El proyecto pronto generó una comunidad alrededor de él. A fin de cuentas, la situación de García no era ni de lejos extraña (un servidor por aquel entonces tenía la misma velocidad en la casa de mi madre, también en Asturias), hasta el punto que ese mismo año Linux.com le dedicó un artículo (ES) en su página.

Dos años más tarde, Youtube-dl pasaría de ser un pequeño script para descargar vídeos de Youtube, a una librería que permitía descargar contenido en local de múltiples portales, usada además en múltiples proyectos de terceros. Es más, es bastante probable que alguna vez hayas usado algún software que incluye de alguna manera esta librería.

La popularidad de Youtube-dl es tal que hasta marcó un formato de naming (lo de poner «-dl» al final del nombre) para todas esas herramientas que permiten descargar algo.

Ricardo se desvincularía de la administración activa del proyecto en 2011, dejándolo en manos de otro colaborador habitual, y este acabaría abandonando el barco en favor del grupo actual de administradores del programa, disponible de forma gratuita en GitHub (EN), y que está formado por varios desarrolladores a lo largo y ancho del mundo.

Hasta este año.

Con la iglesia las discográficas hemos topado

Hace un par de meses, la RIAA, lo que viene a siendo la asociación de discográficas estadounidenses (algo así como la SGAE española) denunciaba e instaba a GitHub a eliminar la librería de sus repositorios (EN) achacando, principalmente, dos infracciones graves:

  • El software tenía como finalidad principal y documentada descargar vídeos musicales protegidos por derechos de autor.
  • Para hacerlo, se saltaba el sistema de seguridad creado por Youtube que evita que esto pueda realizarse.

GitHub, al recibir la petición, bloqueó el repositorio como medida cautelar mientras esperaba que los actuales administradores se defendieran.

Pasaron así un par de semanas, hasta que por fin sería la Electronic Frontier Foundation quien lideraría la respuesta con un documento hecho público (EN/PDF) en el que directamente destroza los argumentos de la RIAA.

  • Youtube-dl no insta en su documentación a descargar vídeos musicales: Lo único que hay referente a ello en la librería (y que de hecho ni forma parte de la documentación), son tres test unitarios creados, como por su propio nombre indica, para que el desarrollador que implemente algún cambio sepa que la herramienta, tras agregarle la nueva funcionalidad, sigue siendo operativa, y que casualmente se comprueban mediante tres vídeos musicales elegidos al azar.
  • Youtube-dl no rompe la firma de protección de Youtube: Ese supuesto hackeo a la firma que Youtube, supuestamente, utiliza para proteger los vídeos musicales, de nuevo, tampoco existe. La EFF explica que lo que la RIAA llama «signature code» no es más que un script visible (ni siquiera va cifrado) que Youtube envía públicamente cuando alguien quiere consumir un contenido musical, ya que dentro del código está la URL del propio vídeo. Youtube-dl simplemente lee ese script sin hacer ningún tipo de ingeniería inversa ni nada por el estilo, por el simple hecho de que no existe firma ninguna. Es más, cualquier programa (navegadores incluidos) capaces de leer código JavaScript, pueden leer esa «firma» sin pedir una clave privada o nada por el estilo (si no no podrían reproducir los vídeos).

Por supuesto, tras las explicaciones de un organismo mundial como la EFF, GitHub ha vuelto a reactivar el repositorio (EN), y solo queda esperar que la RIAA saque como ya es habitual con el resto de asociaciones discográficas la artillería legal.

El caso de Youtube-dl es, de nuevo, un ejemplo más del intento de los grandes lobbies por prohibir cosas que ni entienden ni quieren entender.

Y como en tantas otras ocasiones, la RIAA intenta jugar a dos bandas, ya que se excusa en una regulación (la Digital Millenium Copyright Act (EN)) que permite a cualquier software reproducir públicamente un contenido protegido por derechos de autor, monetizándolo de paso (como ocurre con Youtube, como ocurre con el navegador desde el que cualquier usuario accede a la plataforma, como ocurre con el programa de partners publicitarios de Google), pero parece que se quiere reservar el derecho de bloquear ese acuerdo cuando se utiliza bajo algunos softwares y usos específicos (como puede ser el caso de Youtube-dl).

Vamos, la típica de: hacemos una ley, pero que se cumpla solo cuando a nosotros nos interese...

Y sobra decir que el resultado será el esperable: No hay razón técnica o legal para bloquear una librería como Youtube-dl, sin que esto suponga también bloquear la ejecución de vídeos en navegadores o plataformas online como es la propia Youtube.

Sencilla y llanamente porque su funcionamiento es exactamente el mismo.

Otra batalla perdida para los dinosaurios, que solo buscan entorpecer, ya sea en base a presionar a sus creadores y/o usuarios, ya sea en base a asfixiar en procesos judiciales largos y costosos, proyectos que democratizan el acceso al contenido.

Pasó en su día con Napster, pasó en su día con la figura de los torrents, y seguimos hoy en día lidiando con ello.

Es en estos escenarios donde cobra verdadera importancia organizaciones como la EFF, que más allá de intereses puramente económicos, vela por el futuro del acceso libre a la información.

Poco se habla de este tipo de batallas.

Mucho menos, en todo caso, de lo que se debiera.

Newsletter nuevas tecnologias seguridad

Imagínate recibir en tu correo semanalmente historias como esta

Suscríbete ahora a «Las 7 de la Semana», la newsletter sobre Nuevas Tecnologías y Seguridad de la Información. Cada lunes a las 7AM horario español un resumen con todo lo importante de estos últimos días.