#MundoHacker: Cómo proteger de la copia el contenido que publicamos en nuestra web

no right click

Recientemente un miembro de la Comunidad me pedía que le informase sobre qué maneras existen para evitar que alguien copie el contenido de nuestra web. Y el tema me ha parecido lo suficientemente profundo e interesante como para trasladarlo a un artículo.

Algo que lamentablemente es muy habitual. Sin ir más lejos a un servidor le están continuamente plagiando artículos publicados por aquí, y el problema de eso no es solo que terceros están haciendo negocio con tu trabajo, sino que además, y dependiendo de cómo Google se lo tome, puede que acabe pensando que el contenido plagiado es el tuyo, penalizando a nivel de SEO a ti en vez de a quien realmente está haciendo las cosas mal.

De ahí que en todas las aportaciones que hago en otros medios y que también tienen por estos lares una respuesta, apueste siempre por dejar claro desde el principio de esa pieza que se trata de una pieza publicada en X lugar, convenientemente enlazada (ya sabes, piérdele el miedo a enlazar a contenido de otras webs), y además incluyo un resumen de lo comentado. De esta manera, si Google ve que hay contenido duplicado, como puede ser en el caso de entrevistas que me hacen, verá también que la fuente original es una de ellas, ya que desde una se enlaza a la otra.

Pero claro, esto lo hago yo ya que como es normal no me interesa plagiarme a mi mismo. El problema es cuando lo hacen terceros sin pedir permiso, apropiándose en su nombre de tu contenido.

Vamos a ver qué podemos hacer en tal caso tanto para evitarlo como para, llegados a tal punto, tomar las medidas adecuadas.

creative commons

Proteger nuestro contenido mediante una licencia

La primera parada debería ser obvia. Todo el contenido que publiquemos, sea donde sea, debería ir marcado con una licencia que deje claro qué permisos y qué condiciones hay que cumplir para hacer uso de dicho contenido.

Y tipos de licencias hay a patadas. Eso sí, tratándose de contenido que publicamos en la red, lo normal es apostar por licencias de copyleft, que son algo más permisivas y a diferencia de las de copyright, pueden salir gratis :).

Un servidor, por ejemplo, publica todo bajo una licencia Creative Commons de atribución. Es decir, doy permiso a cualquiera a que me copie el contenido (incluso para fines económicos) siempre y cuando mencione y enlace a la fuente de donde lo ha sacado.

Al final de cada página verás que aparece el logotipo de CC con el icono de la atribución, y si pinchas en él, te llevará a la página donde explican qué condiciones pongo.

Por supuesto, Creative Commons es gratuito y tiene múltiples licencias. Ya dediqué en su día un artículo en profundidad para hablar sobre todas las licencias copy-left más usadas, así que no me voy a repetir.

Simplemente:

  • Entras en la web de CC (ES).
  • Eliges la licencia.
  • Pegas ese icono con el enlace en una parte visible de cada página donde esté el contenido, normalmente el footer.

Si alguien te copia, estará incumpliendo una licencia, y por tanto podrías denunciar a esa página. Como tú lo has escrito antes, seguramente servicios como WayBack Machine (EN) tendrán un registro anterior de ese mismo contenido, lo que demostrará la autoría de tu web. Y si no siempre se puede tirar de los logs del CMS que utilicemos.

Reivindicar la autoría de un contenido copiado

Además, es posible mediante código hacer que todo el contenido que se copie de tu web incluya además un texto con el enlace a la página donde ha sido copiado.

No es algo infalible, ya que por supuesto el que lo ha copiado puede eliminar esa parte y listo. Pero sirve de recordatorio para el interesado, y hasta puede resultar útil para el resto de lectores (la mayoría querrán copiar un trozo de tu texto para, por ejemplo, compartirlo en un tweet o una actualización en RRSS, y así ya incluyen de paso el enlace).

También, ten en cuenta que por cómo se gestiona este tipo de scripts, el texto copiado perderá el formato que tenía, apareciendo todo junto (nada de espacios, negritas, enlaces…), así que también complica que alguien copie el contenido (tiene que repasarlo para ir metiéndole los espacios, las imágenes y tal).

Para incluirlo en WordPress bastaría con pegar este código en el archivo functions.php de tu instalación (está en la carpeta del tema que tengas en uso), cambiando, en cada caso, el tipo de licencia que tenemos:

//Función autoria de contenido
function hide_copyright() { ?>
    <script type='text/javascript'>
    function addLink() {
    var body_element = document.getElementsByTagName('body')[0];
    var selection;
    selection = window.getSelection();
    var pagelink = "<br /><br /> Contenido publicado originalmente bajo licencia CC de atribución en: <a href='"+document.location.href+"'>"+document.location.href+"</a>"; 
    var copy_text = selection + pagelink;
    var new_div = document.createElement('div');
    new_div.style.left='-99999px';
    new_div.style.position='absolute';
    
    body_element.appendChild(new_div );
    new_div.innerHTML = copy_text ;
    selection.selectAllChildren(new_div );
    window.setTimeout(function() {
    body_element.removeChild(new_div );
    },0);
    }
    document.oncopy = addLink;
    </script>
    <?php
    }
    add_action( 'wp_head', 'hide_copyright');
// eof

Utilizar plugins que bloquean la opción de copiar y/o el click derecho

Lo habitual a la hora de hacer una copia de un contenido en la red es seleccionar todo el texto, darle a botón derecho del ratón y copiar. Algunos plugins lo que hacen es evitar que un tercero pueda seleccionar texto en nuestra web, o en caso de que pueda hacerlo, evita que el botón derecho funcione, mostrando bien nada, bien una alerta de que eso está prohibido.

Un servidor no es partidario de estas opciones, ya que realmente también penalizan al resto de usuarios. Hay mucha gente que, por ejemplo, mientras lee va subrayando con el cursor la última línea. Si le bloqueamos la opción de seleccionar, no podrá hacerlo, complicándole la lectura.

Y lo mismo, aunque más limitado, ocurre con el menú del botón derecho, ya que en algunos casos también puede ser utilizado como acceso directo para alguna funcionalidad extra del navegador o del sistema.

Sin olvidar, por supuesto, que no todos los que están copiando el contenido quieren hacerlo de manera maliciosa. Puede ser simplemente que alguien quiere compartir tu reflexión en su página dejando claro que eres tú el autor.

De esta manera minimizas el riesgo a posibles malos usos de tu obra… a cambio también de minimizar las posibilidades de que terceros de forma legítima den a conocer tu trabajo.

Aún así, si prefieres hacer esto, por aquí tienes dos opciones:

Activas uno de ellos, y lo configuras según el nivel de control que quieres ofrecer al usuario.

Y pese a todo lo que hagas, seguirá siendo posible copiarte

Por más que tengas el contenido protegido con una licencia, que alertes cuando alguien lo copia, y que incluso bloquees elementos de interacción con la página, alguien con las ganas, el tiempo y los recursos adecuados va a poder plagiarte deshonestamente.

Y se me ocurren algunas maneras que tienen difícil control por nuestra parte:

  • Por ejemplo, podría utilizar tu RSS para automatizar la publicación de tu contenido en otro lugar, o simplemente estructurar de una manera pseudo-automatizada la copia.
  • Que sí, que puedes bloquear el RSS, o dejarlo solo para que únicamente se vea de cada entrada de tu página un extracto, pero hecha la ley, hecha la trampa (es posible con algunas herramientas obtener el RSS completo de un RSS que solo muestra el extracto).
  • Además, con la consola de desarrollador del navegador siempre van a poder ver el código de la página, y desde él, copiar el texto que aparece, saltándose así las posibles medidas que hayas implementado.

Sin olvidar que, una vez cazado el ladrón, por supuesto podemos denunciarlo ante las autoridades, pero llevar a juicio a estas personas a veces es muy complicado (entra en juego la legislación de varias regiones, ya que muy probablemente los servidores no estén tan siquiera en el mismo país), y sobre todo, sale caro en tiempo y en dinero.

Quería dejar para terminar esto bien claro, ya que no hay nada que podamos hacer para evitar un uso indebido de un contenido que, recuerdo, hemos publicado en Internet, y que por tanto estará visible por cualquiera.

Está en nuestro derecho (y deber) tomar las medias oportunas, pero por más que busques por la Red no vas a encontrar ninguna opción extra a las ya comentadas por aquí que en efecto proteja por completo un contenido.

¿La única? Que si de verdad ese contenido es tan importante y no quieres que nadie te lo copie, no lo publiques.

Nada que no me hayas oído ya decir más de una vez por estos lares y por las charlas y formaciones que doy, ¿verdad?

________

Puedes ver más artículos de esta serie en #MundoHacker, donde tratamos en varios tutoriales las medidas para atacar y/o defenderse en el mundo digital.

Y si el contenido que realizo te sirve para estar actualizado en tu día a día, piensa si merece la pena invitarme a lo que vale un café, aunque sea digitalmente.

hazme patrono pabloyglesias