Inicio » Enredando » Actualmente leyendo:


El robo de contenidos web (Content scrapping) no es un buen negocio

Martes, 29 de Septiembre de 2009 Marcos Ros-Martín Enredando 10 comentarios | Versión Imprimible

Copy & PasteNo es la primera vez que hablo de ello, aunque es una de las cosas que más me enerva como editor web. Como sabréis, el término anglosajón es Content Scrapping, del que se pueden encontrar infinidad de entradas, y en castellano se ha traducido, de forma muy directa, como robo de contenidos. La sindicación de contenidos (RSS), un tanto denostada últimamente gracias a la irrupción del Social Media, fue una de las principales innovaciones que trajo la Blogosfera. La difusión de una nueva forma de recuperar la información de los sitios web sin tener que estar consultándolas constantemente, un buen ejemplo del concepto pull & push, fue una buena oportunidad para mejorar la fidelización de lectores para pequeñas publicaciones electrónicas.

Aparentemente, los grandes medios nunca acabaron de apostar por esta tecnología y prefirieron ofrecer sus RSS capadas con el titular y un pequeño extracto del texto, fundamentalmente, el primer párrafo. Podríamos discutir si se trata realmente de una componente mercantilista, una necesidad para aumentar el número de visitantes de la página web; o de uso, si generas mucho contenido y de diversa índole es mejor ofrecerlo resumido y que el lector decida qué le interesa leer realmente. Pero imagino que se conjugan distintos factores.

Sin embargo, desde aquí siempre invitamos a ofrecer los feeds completos como un premio a la fidelización a los lectores, a pesar de que la tentación de que otras webs “enchufen” nuestros contenidos a través de nuestros feeds sea irrefrenable y los republiquen. Personalmente, aunque es probable que discrepéis, que una web duplique mi contenido no es un halago. Lo fuese si me preguntase y yo le diese mi visto bueno. No me malinterpretéis, está bien que se republique una información, un texto (nosotros lo hacemos), al menos demuestra interés; que se reconvierta y se reelabore, aumenta la difusión de la información, pero redifundir contenidos de forma completa sin ni siquiera consultar, no me parece correcto. No me está bien que el editor web tenga que descubrirlo, que deba solicitar al webmaster o al administrador del sitio que redistribuye los contenidos a que cese su actividad. Esto no debería funcionar así, pero desgraciadamente en la mayoría de los casos lo hace.

Recientemente, El Mundo publicaba una nota muy interesante en la que se afirmaba que se podía redistribuir (Copiar y pegar) un artículo periodístico completo respetando el derecho de cita, pero que si se hacía con todos los contenidos y de una forma constante, si ambas partes buscaban un beneficio económico, la frontera de lo legal era claramente traspasada. Por otra parte, desde el punto de vista tecnológico y de difusión, Google lo tiene claro, no es una buena idea alimentar un sitio web con contenido copiado, así que los afectados que no se preocupen demasiado, que sitúen un enlace hacia el contenido original y el tiempo (en términos de posicionamiento y visitas) les dará la razón.

Sin embargo, para aquellos que no pueda refrenar su indignación sobre el robo de contenidos que puedan sufrir a través de sus feeds pueden hacer varias cosas:

  1. Como señalamos anteriormente, solicitar al webmaster que redifunde los contenidos que cese su actividad.
  2. Situar varios enlaces en sus feeds hacia el contenido original, así como un pequeño aviso de no redistribución de contenidos (Esto ahuyentará a la mayoría y en Wordpress tenemos a nuestra disposición algunos buenos plugins para ello).
  3. Acciones tecnológicas concretas para los usuarios más avanzados, como bloqueo de las IPs o dominios de los Scrappers (Aunque hay que meterse en el fichero .htaccess del servidor donde tienes alojada la publicación), aunque para que esto sea efectivo habrá que dejar de utilizar, en la mayoría de los casos, el servicio de Feedburner.


Actualmente hay "10 comentarios" en este texto:

  1. Javier dice:

    Si algo tenemos los blogs “menores” es que se nos copia poco, jajaja.

    Un saludo

  2. Hace algún tiempo escribí un post (http://www.doygestion.com/281/proyecto-biscaytik-un-paso-adelante/) sobre un proyecto de la diputación de Bizkaia, no era nada del otro jueves pero hubo un blogger que lo enlazó (http://www.elblogsalmon.com/economia-domestica/cuentas-de-correo-regaladas-depende) , hasta aquí todo correcto. Siguiendo el enlace y leyendo a esta persona llegué a otro post (http://guardian-el.blogspot.com/2009/08/administracion-estatal-20.html) de un blogger (peruano creo) que era “terriblemente similar al anterior” con el agravante de que algo originalmente situado en Bizkaia quedaba fuera de lugar en el contexto geográfico de este último blog. Es decir yo no le encontraba mayor sentido al post que llenar página. Aquí lo dejo a modo de curiosidad.

  3. Fx dice:

    Opino que depende del fin que tenga el “copy-paste”. Me explico: copiar por copiar, para llenar de contenido una web, no tiene sentido y si que debería estar penalizado. Ahora bien, que una web proporcione un servicio de información recopilando documentos (noticias, informes, etc.) de una temática en concreto como hacen los sistemas de vigilancia tecnológica, me parece correcto y lícito. De esta manera llega información a usuarios que de otra forma nunca haría y todos salen beneficiados.

  4. Los sistemas de vigilancia tecnológica disponen sistemas de filtrado. Como he dicho antes, republicar de forma selectiva me parece bien, otra cosa es publicar “enchufando” contenidos y sin solicitar permisos y con fines meramente comerciales.

    En cualquier caso, esta es una discusión que se puede llevar a muchos niveles. Desde el press clipping que afecta a los medios de comunicación y este content scrapping que nos afecta a los blogs.

    Por otro lado, los content scrapers lo que tratan es de obtener rédito económico, tráfico y posicionamiento mediante el menor esfuerzo posible. Eso es lo censurable.

    Lo correcto sería redirigir el tráfico, es decir, apuntando hacia la página web que ha publicado el contenido no vampirizándolo.

    En fin, en cualquier caso, esto siempre son puntos de vista sobre lo que es más beneficioso para unos u otros.

    Gracias FX!

  5. Infoesfera era un blog colega, no? Estaba dentro de eso que llamamos la biblioblogosfera…

  6. @álvaro sí, lo era, por eso me resulta más molesto. Por cierto, tú también estás, aunque tus feed funcionan de distinta manera.

    ;-)

  7. Duele mucho ver como te roban contenido, por lo menos que solo sea un trocito y pongan la fuente de origen, he visto mucho cara duras y me sienta muy mal.

  8. Social comments and analytics for this post…

    This post was mentioned on Twitter by vicesparza: El robo de contenidos web (Content scrapping) no es un buen negocio http://bit.ly/5aIih...

Comenta este texto:







ATENCION - En ocasiones, los comentarios se moderan, lo que significa que si tu comentario no se publica inmediatamente, aunque lo normal es que sí que lo haga, es que es sospechoso de ser Spam. Pero no te preocupes, no hace falta que lo reenvíes, ni que escribas desconsolado por la pérdida de tu texto, seguramente aparecerá publicado en breve, en cuanto hayamos tenido tiempo de revisarlo.

Los autores de este blog no se responsabilizan de las opiniones y comentarios vertidos por los usuarios. Cualquier sugerencia será bien recibida.


También en Facebook - El Documentalista Enredado en Facebook

Artículos relacionados:

Los tres pilares de las acciones de marketing en Internet

Miércoles, 16 de Diciembre de 2009

Berta Martínez, responsable del área de Marketing de Aidico, me invitó a escribir un texto para el Boletín que publica el Instituto Tecnológico de la Construcción. El resultado ha sido este “Los tres pilares de las acciones de marketing en Internet” que confío que os agrade.
Es probable que su organización disponga de un sitio web [...]

¿Caída en Adsense? No va más…

Viernes, 17 de Julio de 2009

Cuando decidimos incluir publicidad en este blog, lo cierto es que hubieron ciertas resistencias que vencer previamente. Partiendo de la visión romántica de la Blogosfera de aquello que “este blog no se vende”, consideramos que la inclusión de la publicidad podría ser una vía más para acercarnos a otros temas que no tenían porqué ser [...]

Las folksonomías en los blogs de Biblioteconomía y Documentación

Martes, 21 de Abril de 2009

Las folksonomías, además de convertirse en una de las palabras más odiadas por los internautas, disponen de distintos puntos débiles bien conocidos. Así esta forma de clasificar la información hereda todos los problemas bien conocidos por los documentalistas de los vocabularios no controlados. De esta manera, al utilizar el tagging nos enfrentamos a la ambigüedad, [...]

EE UU se dispone a regular a los blogs y el Social Media

Sábado, 18 de Abril de 2009

No es la primera vez que se realizan intentos para tratar de legislar lo que se publica dentro de la blogosfera o de la Web Social. En su momento, la Unión Europea ya propuso la creación de un registro de blogs, aunque finalmente desechó la idea ante el gran revuelo que supuso aquella idea. [...]

En tiempos de crisis, crecen los agujeros negros en la Web 2.0

Miércoles, 15 de Abril de 2009

Una de las principales críticas que siempre se han realizado a los medios de comunicación que se desplazaron a la Web desde sus productos impresos consistía en que tendían a no realizar enlaces. De hecho, siguen mostrándose incómodos a la hora de hacerlo, temiendo quizás que los lectores se marchasen al encontrar un sitio [...]

[X] Cerrar
Powered by ShareThis