Saltar al contenido →

El robo de contenidos web (Content scrapping) no es un buen negocio

Copy & PasteNo es la primera vez que hablo de ello, aunque es una de las cosas que más me enerva como editor web. Como sabréis, el término anglosajón es Content Scrapping, del que se pueden encontrar infinidad de entradas, y en castellano se ha traducido, de forma muy directa, como robo de contenidos. La sindicación de contenidos (RSS), un tanto denostada últimamente gracias a la irrupción del Social Media, fue una de las principales innovaciones que trajo la Blogosfera. La difusión de una nueva forma de recuperar la información de los sitios web sin tener que estar consultándolas constantemente, un buen ejemplo del concepto pull & push, fue una buena oportunidad para mejorar la fidelización de lectores para pequeñas publicaciones electrónicas.

Aparentemente, los grandes medios nunca acabaron de apostar por esta tecnología y prefirieron ofrecer sus RSS capadas con el titular y un pequeño extracto del texto, fundamentalmente, el primer párrafo. Podríamos discutir si se trata realmente de una componente mercantilista, una necesidad para aumentar el número de visitantes de la página web; o de uso, si generas mucho contenido y de diversa índole es mejor ofrecerlo resumido y que el lector decida qué le interesa leer realmente. Pero imagino que se conjugan distintos factores.

Sin embargo, desde aquí siempre invitamos a ofrecer los feeds completos como un premio a la fidelización a los lectores, a pesar de que la tentación de que otras webs “enchufen” nuestros contenidos a través de nuestros feeds sea irrefrenable y los republiquen. Personalmente, aunque es probable que discrepéis, que una web duplique mi contenido no es un halago. Lo fuese si me preguntase y yo le diese mi visto bueno. No me malinterpretéis, está bien que se republique una información, un texto (nosotros lo hacemos), al menos demuestra interés; que se reconvierta y se reelabore, aumenta la difusión de la información, pero redifundir contenidos de forma completa sin ni siquiera consultar, no me parece correcto. No me está bien que el editor web tenga que descubrirlo, que deba solicitar al webmaster o al administrador del sitio que redistribuye los contenidos a que cese su actividad. Esto no debería funcionar así, pero desgraciadamente en la mayoría de los casos lo hace.

Recientemente, El Mundo publicaba una nota muy interesante en la que se afirmaba que se podía redistribuir (Copiar y pegar) un artículo periodístico completo respetando el derecho de cita, pero que si se hacía con todos los contenidos y de una forma constante, si ambas partes buscaban un beneficio económico, la frontera de lo legal era claramente traspasada. Por otra parte, desde el punto de vista tecnológico y de difusión, Google lo tiene claro, no es una buena idea alimentar un sitio web con contenido copiado, así que los afectados que no se preocupen demasiado, que sitúen un enlace hacia el contenido original y el tiempo (en términos de posicionamiento y visitas) les dará la razón.

Sin embargo, para aquellos que no pueda refrenar su indignación sobre el robo de contenidos que puedan sufrir a través de sus feeds pueden hacer varias cosas:

  1. Como señalamos anteriormente, solicitar al webmaster que redifunde los contenidos que cese su actividad.
  2. Situar varios enlaces en sus feeds hacia el contenido original, así como un pequeño aviso de no redistribución de contenidos (Esto ahuyentará a la mayoría y en WordPress tenemos a nuestra disposición algunos buenos plugins para ello).
  3. Acciones tecnológicas concretas para los usuarios más avanzados, como bloqueo de las IPs o dominios de los Scrappers (Aunque hay que meterse en el fichero .htaccess del servidor donde tienes alojada la publicación), aunque para que esto sea efectivo habrá que dejar de utilizar, en la mayoría de los casos, el servicio de Feedburner.

Publicado en Enredando

10 comentarios

  1. Si algo tenemos los blogs «menores» es que se nos copia poco, jajaja.

    Un saludo

  2. Hace algún tiempo escribí un post (http://www.doygestion.com/281/proyecto-biscaytik-un-paso-adelante/) sobre un proyecto de la diputación de Bizkaia, no era nada del otro jueves pero hubo un blogger que lo enlazó (http://www.elblogsalmon.com/economia-domestica/cuentas-de-correo-regaladas-depende) , hasta aquí todo correcto. Siguiendo el enlace y leyendo a esta persona llegué a otro post (http://guardian-el.blogspot.com/2009/08/administracion-estatal-20.html) de un blogger (peruano creo) que era “terriblemente similar al anterior” con el agravante de que algo originalmente situado en Bizkaia quedaba fuera de lugar en el contexto geográfico de este último blog. Es decir yo no le encontraba mayor sentido al post que llenar página. Aquí lo dejo a modo de curiosidad.

  3. Fx Fx

    Opino que depende del fin que tenga el «copy-paste». Me explico: copiar por copiar, para llenar de contenido una web, no tiene sentido y si que debería estar penalizado. Ahora bien, que una web proporcione un servicio de información recopilando documentos (noticias, informes, etc.) de una temática en concreto como hacen los sistemas de vigilancia tecnológica, me parece correcto y lícito. De esta manera llega información a usuarios que de otra forma nunca haría y todos salen beneficiados.

  4. Los sistemas de vigilancia tecnológica disponen sistemas de filtrado. Como he dicho antes, republicar de forma selectiva me parece bien, otra cosa es publicar «enchufando» contenidos y sin solicitar permisos y con fines meramente comerciales.

    En cualquier caso, esta es una discusión que se puede llevar a muchos niveles. Desde el press clipping que afecta a los medios de comunicación y este content scrapping que nos afecta a los blogs.

    Por otro lado, los content scrapers lo que tratan es de obtener rédito económico, tráfico y posicionamiento mediante el menor esfuerzo posible. Eso es lo censurable.

    Lo correcto sería redirigir el tráfico, es decir, apuntando hacia la página web que ha publicado el contenido no vampirizándolo.

    En fin, en cualquier caso, esto siempre son puntos de vista sobre lo que es más beneficioso para unos u otros.

    Gracias FX!

  5. Infoesfera era un blog colega, no? Estaba dentro de eso que llamamos la biblioblogosfera…

  6. @álvaro sí, lo era, por eso me resulta más molesto. Por cierto, tú también estás, aunque tus feed funcionan de distinta manera.

    😉

  7. Duele mucho ver como te roban contenido, por lo menos que solo sea un trocito y pongan la fuente de origen, he visto mucho cara duras y me sienta muy mal.

  8. Social comments and analytics for this post…

    This post was mentioned on Twitter by vicesparza: El robo de contenidos web (Content scrapping) no es un buen negocio http://bit.ly/5aIih

Los comentarios están cerrados.