Home » Blogs » Artículos recientes:

El robo de contenidos web (Content scrapping) no es un buen negocio

Martes, 29 de Septiembre de 2009 Marcos Ros-Martín Enredando 10 Comentarios

Copy & PasteNo es la primera vez que hablo de ello, aunque es una de las cosas que más me enerva como editor web. Como sabréis, el término anglosajón es Content Scrapping, del que se pueden encontrar infinidad de entradas, y en castellano se ha traducido, de forma muy directa, como robo de contenidos. La sindicación de contenidos (RSS), un tanto denostada últimamente gracias a la irrupción del Social Media, fue una de las principales innovaciones que trajo la Blogosfera. La difusión de una nueva forma de recuperar la información de los sitios web sin tener que estar consultándolas constantemente, un buen ejemplo del concepto pull & push, fue una buena oportunidad para mejorar la fidelización de lectores para pequeñas publicaciones electrónicas.

Aparentemente, los grandes medios nunca acabaron de apostar por esta tecnología y prefirieron ofrecer sus RSS capadas con el titular y un pequeño extracto del texto, fundamentalmente, el primer párrafo. Podríamos discutir si se trata realmente de una componente mercantilista, una necesidad para aumentar el número de visitantes de la página web; o de uso, si generas mucho contenido y de diversa índole es mejor ofrecerlo resumido y que el lector decida qué le interesa leer realmente. Pero imagino que se conjugan distintos factores.

Sin embargo, desde aquí siempre invitamos a ofrecer los feeds completos como un premio a la fidelización a los lectores, a pesar de que la tentación de que otras webs “enchufen” nuestros contenidos a través de nuestros feeds sea irrefrenable y los republiquen. Personalmente, aunque es probable que discrepéis, que una web duplique mi contenido no es un halago. Lo fuese si me preguntase y yo le diese mi visto bueno. No me malinterpretéis, está bien que se republique una información, un texto (nosotros lo hacemos), al menos demuestra interés; que se reconvierta y se reelabore, aumenta la difusión de la información, pero redifundir contenidos de forma completa sin ni siquiera consultar, no me parece correcto. No me está bien que el editor web tenga que descubrirlo, que deba solicitar al webmaster o al administrador del sitio que redistribuye los contenidos a que cese su actividad. Esto no debería funcionar así, pero desgraciadamente en la mayoría de los casos lo hace.

Recientemente, El Mundo publicaba una nota muy interesante en la que se afirmaba que se podía redistribuir (Copiar y pegar) un artículo periodístico completo respetando el derecho de cita, pero que si se hacía con todos los contenidos y de una forma constante, si ambas partes buscaban un beneficio económico, la frontera de lo legal era claramente traspasada. Por otra parte, desde el punto de vista tecnológico y de difusión, Google lo tiene claro, no es una buena idea alimentar un sitio web con contenido copiado, así que los afectados que no se preocupen demasiado, que sitúen un enlace hacia el contenido original y el tiempo (en términos de posicionamiento y visitas) les dará la razón.

Sin embargo, para aquellos que no pueda refrenar su indignación sobre el robo de contenidos que puedan sufrir a través de sus feeds pueden hacer varias cosas:

  1. Como señalamos anteriormente, solicitar al webmaster que redifunde los contenidos que cese su actividad.
  2. Situar varios enlaces en sus feeds hacia el contenido original, así como un pequeño aviso de no redistribución de contenidos (Esto ahuyentará a la mayoría y en Wordpress tenemos a nuestra disposición algunos buenos plugins para ello).
  3. Acciones tecnológicas concretas para los usuarios más avanzados, como bloqueo de las IPs o dominios de los Scrappers (Aunque hay que meterse en el fichero .htaccess del servidor donde tienes alojada la publicación), aunque para que esto sea efectivo habrá que dejar de utilizar, en la mayoría de los casos, el servicio de Feedburner.

¿Caída en Adsense? No va más…

Viernes, 17 de Julio de 2009 Marcos Ros-Martín Enredando 2 Comentarios

Cuando decidimos incluir publicidad en este blog, lo cierto es que hubieron ciertas resistencias que vencer previamente. Partiendo de la visión romántica de la Blogosfera de aquello que “este blog no se vende”, consideramos que la inclusión de la publicidad podría ser una vía más para acercarnos a otros temas que no tenían porqué ser de nuestro ámbito, pero que nos parecían interesantes puesto que éramos “enredados”.

Obviamente, nos buscamos la plataforma más sencilla en su gestión y la más difundida, Adsense, y ello nos ha permitido publicar una serie de textos sobre nuestra experiencia con ella. Desde la inhabilitación de nuestra cuenta a la caída dramática de las ganancias en febrero, la publicidad nos ha permitido sufragar el hosting y el coste del dominio, pero poco más.

Sin embargo, durante este mes, nos estamos planteando el abandono de los soportes publicitarios durante un tiempo. Los ingresos son bastante escasos habiendo caído desde el 50% de febrero a un 50% desde entonces (los foros de Adsense echan humo) y la verdad es que el retorno es tan escaso que tal vez sea el momento de recoger el velamen y seguir con nuestro trabajo en la blogosfera prescindiendo de la mancha de la publicidad en nuestra web. Ya sabéis, cosas de la crisis.

Las gráficas no engañan, y aunque esta evolución depende mucho del tipo de página y su temática; os dejamos un gráfico comparativo de la evolución de nuestras páginas vistas frente a los ingresos por publicidad para vuestra curiosidad. Las dos tendencias son bastante claras y las expectativas para este verano son bastante malas porque los últimos datos se refieren a junio de 2009. Tened en cuenta que no podemos publicar nuestros ingresos por lo que las gráficas sólo pueden ser utilizadas de manera referencial.

Las folksonomías en los blogs de Biblioteconomía y Documentación

Martes, 21 de Abril de 2009 El Documentalista Enredado Internet 1 Comentario

Las folksonomías, además de convertirse en una de las palabras más odiadas por los internautas, disponen de distintos puntos débiles bien conocidos. Así esta forma de clasificar la información hereda todos los problemas bien conocidos por los documentalistas de los vocabularios no controlados. De esta manera, al utilizar el tagging nos enfrentamos a la ambigüedad, polisemias, sinonimias y falta de control a la hora de describir de forma específica o más general las mismas cosas.

Concretamente, tenemos ambigüedad porque diferentes usuarios aplican términos a las mismas informaciones de forma completamente distinta, polisemia ante la utilización de las mismas palabras para designar objetos o conceptos distintos, sinonimia porque distintas palabras pueden ser utilizadas para definir las mismas cosas y, finalmente, sobre la especificidad de los términos, porque un usuario experto puede definir una información como AJAX o javascript, olvidándose de indicar lenguajes de programación que un usuario no-experto puede utilizar a la hora de recuperar información sobre esta temática.

Además, la utilización del tagging es tan abierta que no otorga una guía de uso a la hora de aplicarlas, cómo deben usarse, la puntuación a utilizar, el orden de las palabras, si se deben usar plurales en vez de singulares, si se deben usar palabras compuestas sobre las simples, si se deben añadir sinónimos, etc.

Recientemente, se han publicado dos textos científicos que hacen referencia al uso que se hace de las folksonomías en los blogs de Biblioteconomía y Documentación a los que os recomendamos echarles un vistazo. En el primero de ellos, Etiquetado libre frente a lenguajes documentales. Aportaciones en el ámbito de Biblioteconomía y Documentación, su autor Luis Rodríguez Yunta realiza una reflexión muy interesante sobre el uso de las folksonomías dentro de distintas herramientas de la denominada Web 2.0 por parte de los profesionales de la información:

Los profesionales de la Documentación han sido tradicionalmente valedores del empleo de lenguajes controlados, por su consistencia en la representación sistemática del análisis documental de contenido y su capacidad para combinar búsquedas genéricas y específicas. Sin embargo, a partir de las herramientas de la web social, el etiquetado también está siendo aplicado por los propios documentalistas y bibliotecarios. Parece oportuno reflexionar sobre este hecho ¿Se trata de una renuncia a valores tradicionales de la disciplina? ¿O es una adaptación a las demandas de nuevas generaciones de usuarios? ¿Hay un cambio de paradigma en la percepción de las herramientas de recuperación?

Por otro lado, en la revista Library & Information Science Research se publica el artículo Librarians and information scientists in the blogosphere: An exploratory analysis en el que se realiza un análisis de las etiquetas más utilizadas en los 30 blogs de Biblioteconomía y Documentación dentro del ámbito anglosajón para determinar los temas que más se abordan dentro de la biblioblogosfera inglesa.

EE UU se dispone a regular a los blogs y el Social Media

Sábado, 18 de Abril de 2009 Marcos Ros-Martín Internet 5 Comentarios

No es la primera vez que se realizan intentos para tratar de legislar lo que se publica dentro de la blogosfera o de la Web Social. En su momento, la Unión Europea ya propuso la creación de un registro de blogs, aunque finalmente desechó la idea ante el gran revuelo que supuso aquella idea. Incluso Tim O’Reilly trató de que se estableciese un código de conducta para la blogosfera que fue muy comentado y contestado que finalmente quedó en nada ante la imposibilidad de alcanzar algún tipo de acuerdo. En esta ocasión, la polémica nos llega desde los Estados Unidos donde la FTC (Federal Trade Commission) se plantea comenzar a regular los blogs y el Social Media (Facebook o Twitter) al considerar que estos son, en realidad, más una herramienta de marketing que un medio de comunicación y que promete en acabar de la misma forma que las dos circunstancias señaladas anteriormente. Desde la FTC, se argumenta que se está tratando de actualizar las directrices para la defensa de los consumidores aprobadas hace treinta años, de modo que se ajusten a la realidad actual donde los consumidores acuden cada vez más a la Red para informarse.

Concretamente, el punto de mira de la FTC se centra en aquellos blogs que aceptan la publicación de lo que se denomina posts patrocinados, que son textos donde el bloguer recibe una compensación, en especie o monetaria, por comentar sus experiencias con determinado producto o servicio. Dentro de este tipo de informaciones, existen distintas variantes que van desde la total libertad del bloguer para comentar su experiencia basándose en su opinión personal y otras donde el fabricante especifica las recomendaciones que el bloguer debería de plasmar en el su texto. De este modo, el regulador estadounidense abre la puerta para que las webs dedicadas al Social Media puedan ser denunciadas por los consumidores si publican o alojan informaciones falsas sobre los productos que se reseñen.

Por supuesto que la polémica ha saltado a la blogosfera americana que ya se pregunta si las autoridades estadounidenses comenzarán a considerar a los bloguers como criminales por escribir este tipo de textos o qué harán con el resto de blogs que no se encuentran alojados dentro del territorio de su jurisdicción. En definitiva, la conclusión es que se tiene la impresión de que la FTC está intentando regular estos medios como si se tratase de publicaciones impresas sin contemplar otras consideraciones que obviamente les sobrepasan y que no son posibles de controlar dentro de un mundo interconectado.

¿Cuántos lectores de RSS podrías tener hoy?

Miércoles, 4 de Marzo de 2009 Marcos Ros-Martín Cajón de sastre 3 Comentarios

Una de las cosas que más me sorprende de Feedburner es que no ha habido ningún servicio capaz de hacerle sombra. Sí, existen innumerables webs que son capaces de gestionar feeds, desde agregadores a generadores, pero el servicio que ofrece Feedburner – normalizar el formato del fichero RSS, dar una versión legible para las personas en su caso, ofrecer estadísticas sobre los suscritos, servicios añadidos como la suscripción al mismo por correo electrónico y, la más importante, bajar el estrés de nuestro servidor a la hora de servir información a los bots – no ha sido igualado hasta ahora. La popularidad del mismo llegó a ser tan importante que Google se fijó en él y decidió su adquisición en mayo de 2007 por 100 millones de dólares tras muchos rumores.

Desde entonces, el proceso de innovación y de mejora dentro del servicio ha permanecido bastante plano llegando a considerarse que simplemente Google lo estaba dejando morir. Este hecho puede ser que sea achacable a la nunca sencilla integración dentro de la macroestructura de Google, como bien les ha sucedido a muchas compañías adquiridas por el gigante, y en ocasiones contradictorias, puesto que una de las últimas propuestas por parte de Feedburner fue la de ofrecer un sistema de estadísticas para páginas web que, obviamente, se enfrentaba con el superior producto Google Analytics. En cualquier caso, de lo que no cabe duda, es que Google adquirió este servicio para rentabilizar los contenidos que gestiona insertando su popular programa publicitario, Adsense, dentro de los textos servidos por infinidad de pequeños sitios web.

De hecho, el blog oficial de Feedburner, Burning Questions, fue cerrado junto la apertura de uno sustitutivo con la denominación Adsense for Feeds, toda una declaración de principios. Dos años después, Google nos urge en migrar las cuentas de acceso de Feedburner hacia una Google Account para poder seguir utilizándolo. Sin embargo, aunque el proceso es bastante sencillo, no deja de ser en ciertos aspectos traumático. Así, por ejemplo, a la hora de mostrar las estadísticas de suscriptores, el servicio sufre fluctuaciones dramáticas (en ocasiones de un día para otro se puede llegar a perder un 40% de tus suscriptores), más allá de los “apagones” que de vez en cuando Feedburner sufre por los principales agregadores RSS disponibles on-line, fundamentalmente Google Reader (!) y Bloglines.

Lo cierto es que más allá de las situaciones puntuales antes señaladas, la excepción se está convirtiendo en una constante, siendo casi imposible saber a ciencia cierta cuántos suscriptores disponemos en cada momento, por lo que el servicio comienza a no aportar el valor añadido del que en su momento disponía. Por otro lado, al gestionar los contenidos a través de Feedburner perdemos cierto control sobre los contenidos de los feeds, porque si bien Feedburner nos advierte de los Unfrequent uses, no nos permite bloquearlos, por lo que nos impide, por ejemplo, restringir los abusos que realizan los Content Scrappers, por poner un ejemplo.

Sin embargo, el abandono de este servicio a otro plantea ciertas dificultades. Por un lado, debemos encontrar un sistema de estadísticas fiable, que en el caso de los blogs gestionados con Wordpress bien podría servirnos el plugin oficial Wordpress Stats, sin embargo la redirección de los feeds si no se ha sido cuidadoso desde un principio -señalando una URL dentro de nuestro dominio que finalmente redireccionase al servicio de Feedburner-, puede llegar a ser confusa para nuestros lectores y para nosotros mismos que debemos advertirles y sugerirles el esfuerzo del cambio. Lo que nunca llega a ser suficiente para que permanezcan junto a nosotros.

¿Batacazo en los ingresos Adsense?

Martes, 17 de Febrero de 2009 Marcos Ros-Martín Internet 8 Comentarios

Cuando decidimos incluir publicidad en nuestro blog, lo hicimos en primer lugar para curiosear, para probar cosas nuevas y , como dijimos entonces, para disponer de una estadística más; y segundo, cómo no, quitarnos de encima el coste de mantenimiento de nuestro blog. Entonces, al igual del 90% de los pequeños editores de Internet, nos decantamos por Google y su Adsense por tratarse de uno de los servicios más confiables disponibles en el mundo publicitario en Web y lo cierto es que la experiencia ha sido al menos divertida (con la cancelación de nuestra cuenta y todo).

El hecho es que disponer de una cuenta en Adsense, ha abierto un poco la temática de nuestro blog, vigilantes sobre la publicidad y los modelos de financiación de los bloguers y pequeños editores, preocupados por el mundo SEO y SEM, pero lo que no me esperaba comprobar era la tremenda caída de los ingresos que se iban a dar. Porque no nos podemos llevar a engaño, somos un blog muy modesto, no esperamos grandes retribuciones, pero la denunciada caída del 60% del CTR parece que se va a quedar pequeña. Sólo tendríamos que echarle un vistazo a la evolución de las cifras del eCPM (Acrónimo de coste efectivo por cada mil impresiones y se usa para medir el rendimiento de los bloques de anuncios) en gráficos comparativos de distintos países.

En el caso español (que os recojo), aunque podéis consultar otros, es significativo y puede desembocar hacia que los usuarios de Adsense apuesten por otros modelos publicitarios huyendo de la cierta opacidad de Google (Qué es lo que el anunciante paga, qué es lo que Google se queda y qué es lo que le toca al editor nunca ha estado muy claro) y sus extrañas políticas de uso. En nuestro caso, hemos contemplado la posibilidad de eliminar la publicidad porque realmente, a pesar de que los clics puedan incrementarse o mantenerse, obviamente no percibimos el retorno como compensatorio o también podemos decantarnos por probar otros modelos publicitarios como el de TradeDoubler que nos recomendaron.

Ante las denuncias de caídas, Google se ha defendido, por supuesto, asegurando que las fluctuaciones en los ingresos son normales, pero que en los tiempos de incertidumbre económica, mucho más dramáticas, que no a todos los sectores o segmentos les afectan igual ni durante el mismo tiempo, por lo que no a todos los sitios web se encontrarán afectados en igual medida.

De momento, en nuestro caso, esperaremos y comprobaremos cuál es la evolución, cómo les va afectando esta situación a los blogs y lo que van comentado sobre este asunto. Pero no es descartable que volvamos a ser un blog limpio de publicidad a lo largo de estos meses. Para ello aprovisionamos hace poco.


También en Facebook - El Documentalista Enredado en Facebook

Recién comentado:

  • Orfebre Martin: Un seis % de tráfico para google es demasiado!...
  • Marcos Ros-Martín: Sí, a mi también me gusta de vez en cuando pararme y reflexionar un poco sobre lo que voy viendo, en cualquier sitio, y me sorprende. Porque todavía m...
  • JesusC: Hola: me gustan mucho las reflexiones que nos cuentas de vez en cuando en tu blog. No sólo en el contenido sino en la forma, realmente sabes expres...
  • Marcos Ros-Martín: De nada Encarna, me alegro que lo encontrases de utilidad. ;-)...
  • Encarna: Seguí la recomendación de usar Adblock PLus y menuda maravilla, esta harta de tanto anuncio abusivo. Un gran descubrimiento, gracias!...
[X] Cerrar
Powered by ShareThis