Saltar al contenido →

Etiqueta: La Larga Cola (Long Tail)

Las Power Laws de la Bibliometría

En este blog, no vamos a negarlo, no somos expertos en Bibliometría (parte de la cienciometría que aplica métodos matemáticos y estadísticos a toda la literatura de carácter científico y a los autores que la producen, con el objetivo de estudiar y analizar la actividad científica), para eso ya está la troupe de Álvaro Roldán, sin embargo queremos señalaros, como curiosidad nada más, las leyes bibliométricas que reflejan, de nuevo, la existencia de leyes de potencia dentro de esta área de conocimiento. Las leyes de las que vamos a hablar son las leyes de Bradford y la de Lotka, bien conocidas por los bibliómetras pero que pueden pasar desapercibidas para el resto de los bibliotecarios e incluso para los documentalistas.

La ley de Lotka o de la productividad de los autores (1926) afirma que en una determinada especialidad unos pocos autores publican un gran número de artículos mientras que el gran número de autores restantes publica muy poco. Lotka comprobó que el 50% de los trabajos de un área sean publicados por cerca del 10% de los autores totales, un 25% por un 15% de autores y el restante 25% de textos por un 75% de autores.

Mientras que la Ley de Bradford o de dispersión de la literatura científica (1934) exponía que un pequeño número de revista sobre una determinada disciplina reunía la mayor parte de los artículos. De esta manera, una pequeña parte de las publicaciones aunarían la mayor parte del prestigio, concentrando una gran parte de los trabajos más interesantes, mientras que el resto de textos se encontrarían dispersos en publicaciones de diversa índole.

Finalmente, como apunte y cerrar este texto, señalaros  la tercera ley sobre la que se fundamenta la bibliometría es la Ley de Price o del crecimiento exponencial. Según esta ley, el número de publicaciones científicas que hay en el mundo crece de manera exponencial. Dicho crecimiento es tal, que cada 10-15 años la información existente se duplica con un crecimiento exponencial, aunque esto depende en gran medida del área de conocimiento de la que se trate.  Sin embargo, no sólo la literatura científica crece de forma exponencial, sino también lo hace el número de investigadores, por lo que la primera conclusión que obtuvo Price del crecimiento exponencial fue la contemporaneidad de la ciencia. Esto es un porcentaje que nos dice cómo se encuentra la ciencia actual respecto del conjunto de las demás épocas.

Un comentario

«La economía Long Tail» de Chris Anderson

No vamos a poder negar que la lectura de "La economía Long Tail" no nos ha resultado interesante. De hecho, a partir de él, hemos reflexionado y analizado en este mismo lugar sobre lo que se ha denominado Larga Cola o Long Tail. De su contenido, se puede desprender que el mundo está completamente regido por las leyes de potencia y que el concepto de la Larga Cola tan sólo es una prueba más de que Internet también se rige por ellas. No importa si se les denomina Ley de Pareto, Zipf o del 98, estas distribuciones estadísticas pueden ser encontradas si analizamos cualquier aspecto de cualquier muestra. Por ejemplo y sin riesgo a equivocarnos, podemos afirmar que el 20% de las entradas de este blog producen el 80% de las visitas.

Este es un texto para analizar y descubrir cómo Internet está alargando la Larga Cola gracias a la accesibilidad por distintos puntos a un catálogo comercial y a la recomendación de productos por los gustos del cliente tal y como hace Amazon. Internet es un lugar donde se puede hacer negocios a la vez que se pueden llegar a crear nuevos, como hizo Google con su publicidad contextual, Adsense. Llegamos a la conclusión de que cada nicho de la sociedad tiene su público y puede vivir o convivir con éxito dentro de su ámbito y dentro de sus propias limitaciones. Sin duda, la diversidad fomenta y potencia el desarrollo de la Larga Cola.

14 comentarios

Blogs y Power Laws (2): Un pequeño estudio

Decíamos en el texto anterior, Blogs y Power Laws: Bienvenido a la Larga Cola, que la Larga Cola tenía un comportamiento fractal, lo que significaba que si escogíamos una pequeña sección de ésta y la estudiásemos, lo que obtendríamos sería, invariablemente, una pequeña Larga Cola. Tratando de comprobar si esto era así, lo que hemos querido realizar ha sido un experimento, localizando una Larga Cola y analizando una de sus características.

Lo analizado: El número de suscriptores de un feed de un blog

Sinceramente, nos lo hemos puesto un poco difícil porque hemos escogido como valor a estudiar el número de suscriptores que tiene un blog. Anteriormente, era bastante complicado estudiar el número de personas que podía estar apuntada a un feed, puesto que los gestores de contenido de las bitácoras generaban el código correspondiente de forma automática y no había forma de saber el número de lectores que un blog disponía a través de sus feeds ni siquiera para los autores de un blog. Sin embargo, la aparición del servicio Feedburner permitió, además de personalizar los feeds de los weblogs, añadir nuevas posibilidades a estos como las estadísticas de uso. De este modo, Feedburner permite que conozcamos el número de suscriptores mediante un pequeño código, tal como os señalamos en nuestra página de estadísticas.

Obviamente, para poder analizar el comportamiento fractal de una Larga Cola, debemos disponer de una y poder estudiar una sección de ésta. Nuestra elección ha sido el Ranking de blogs en español que es, obviamente, una Larga Cola de bitácoras – No son todas las que son, por supuesto -. El siguiente paso ha sido escoger la cabeza de la cola, los 100 primeros blogs de su ranking confiando que el resultado fuese positivo.

Debemos señalar que el cómo estructura esta página su ranking no se debe tan sólo a una sola variable, el cómo otorga los distintos pesos a las distintas variables para el establecimiento de las posiciones dentro del ranking está explicado en su FAQ, pero el valor que nosotros buscábamos el número de suscriptores a través de Feedburner se encuentra publicado en cada página personalizada de cada bitácora. Así, por ejemplo, hoy, este blog se encuentra en la posición 210 sobre un total de 4806 blogs hispanos disponiendo de distintos rankings y valores. Todos son consultables como nuestro Pagerank, los enlaces que ha detectado Technorati, el número de suscriptores de FeedBurner, así cómo el número de enlaces que el bot del sitio web ha detectado, como los datos de Google, Google Blog Search y Yahoo! Search.

Por otro lado, es cierto que no todos los blogs utilizan este servicio para ofrecer un feed estandarizado y universal, pero de las 100 bitácoras estudiadas sólo 14 no utilizaban este servicio, y algunas muy veteranas como MiniD. Nuestro interés sobre el número de suscriptores se debe a que los datos no son manipulables, es decir, en general, son personas las que deciden suscribirse a un feed, por lo que se asegura cierto número de lectores fijos sin que el autor de un blog pueda hacer mucho por aumentar o disminuir sus lectores. Es obvio que un suscriptor puede suscribirse en varias ocasiones a un mismo feed utilizando sistemas distintos, por ejemplo a través de dos lectores RSS basados en web, pero consideramos que los datos se refieren en su mayor parte a un lector por suscripción.

5 comentarios

Blogs y Power Laws: Bienvenido a la Larga Cola

Yo acepté el caos, pero no estoy seguro
de que él me acepte a mí.
Bob Dylan

Una de las curiosidades de la Larga Cola (Long Tail) es que tiene un comportamiento fractal, es decir, si cogemos una sección de ella y la observamos, nos percataremos que es invariablemente una pequeña Larga Cola. Tomemos un ejemplo cercano: La Biblioblogosfera. Si dispusiésemos todas las bitácoras que se publican en la blogosfera y las agrupásemos por temáticas, descubriríamos sin lugar a dudas que hay una mayor cantidad de weblogs que se dedican a un tema específico muy popular, mientras que le seguirían las distintas temáticas que se distribuirían en forma de larga cola. Así, si escogiésemos una pequeña sección de esa cola, por ejemplo, las bitácoras dedicadas a la biblioteconomía y documentación, y mirásemos su temática, también descubriríamos que se organizan siguiendo una larga cola.

La Larga Cola

La Larga Cola en la Biblioblogosfera

Cuando la Biblioblogosfera estaba en su fase incipiente, todavía no había sido ni bautizada, Bárbara Flores y Elisa Legerén realizaron y publicaron un estudio que llevaba por título: El Fenómeno Weblog como nuevo medio de comunicación y su incidencia en Biblioteconomía y Documentación que analizaba la distribución de la comunidad de weblogs con temática relativa a la Biblioteconomía; de forma que establecieron un ranking de bitácoras más influyentes. Para establecer la ordenación de los sitios web, lo que sus autoras hicieron fue analizar el número de enlaces que los distintos blogs de esta temática se realizaban entre sí conformando una comunidad.

De este modo, si nos detuviésemos en analizar los gráficos que se derivaron de ese estudio descubriríamos que las cinco primeras posiciones congregan el 80% de los enlaces entrantes que se producían dentro de la comunidad de bitácoras. Siendo menos científicos, por otro lado, si consultásemos los textos y gráficos que redactamos en este mismo blog para el análisis de la biblioblogosfera también podríamos comprobar que, aproximadamente, el 20% de las bitácoras analizadas congregaban el 80% de los enlaces entrantes entre ellas (Ley de Pareto).

La ley de potencias se cumplía de una forma exacta a pesar de que, como siempre, hubo controversias de cómo se había establecido un ranking y cómo se había valorado los enlaces. Además de enfrentarnos con la realidad de que si en una pequeña comunidad de vecinos sucede que se discute sobre cómo se valora y se da peso a un blog, podemos imaginar lo que sucede a una mayor escala y de una forma más global: La blogosfera.

5 comentarios

La Larga Cola (Long Tail) está llena de basura

La Larga Cola (The Long Tail) es un concepto acuñado por Chris Anderson, editor de la revista Wired, basado en las conocidas distribuciones estadísticas como, por ejemplo, la de Pareto o la ley de Zipf. En el artículo The Long Tail, publicado en Wired octubre de 2004, Anderson afirmaba, tras el análisis de datos y tendencias en los comercios digitales, que Internet y el entorno digital han cambiado las leyes de distribución y las reglas del mercado. La reducción en el coste de almacenamiento y distribución que permiten las nuevas tecnologías, hace que no sea ya necesario focalizar el negocio en unos pocos productos de éxito, en los superventas. Por lo tanto, proseguía, ahora existen dos mercados: uno centrado en el alto rendimiento de pocos productos y otro, nuevo y todavía no familiar, basado en la suma o acumulación de todas las pequeñas ventas de muchos productos, que puede igualar o superar al primero. Son el antiguo mercado de masas y el nuevo nicho de mercados, representados por la cabeza y la cola de la conocida gráfica de distribución estadística.

[…] Hace una década, la gente se quejaba de que había demasiada basura en Internet y, en efecto, una navegación al azar rápidamente lo confirmaba. Luego llegaron los motores de búsqueda para permitir que algunas señales sobresalieran del ruido, y por fin llegó Google, que utilizaba la inteligencia colectiva y ha convertido una masa incoherente en lo más parecido a un oráculo.

Esto no es exclusivo de la web, ocurre en todas partes. La ley de Sturgeon (llamada así por el autor de ciencia ficción Theodor Sturgeon) establece que "el 90 por ciento de cualquier cosa es basura". Pensemos en el arte, no desde la perspectiva de una galería sino de un mercadillo. El 90 por ciento (por lo menos) es basura. Y lo mismo se puede decir de la música, de los libros y de todo lo demás. El motivo por el cual no lo vemos así es porque la mayoría de esos bienes son filtrados por el cedazo de la distribución comercial minorista.

3 comentarios