Saltar al contenido →

Etiqueta: Bases de datos

Catalogar vs. indexar

Uno de los mayores pecados que puede realizar un documentalista o un bibliotecario es pronunciar la palabra tabú: NO. «No está, no existe o no se puede hacer» son frases que en algunas ocasiones lanzamos casi de forma automática casi sin percatarnos bajo la presión de una consulta de información de un usuario urgido por la necesidad, casi sin tiempo para realizar una segunda reflexión. Tal vez deberíamos adoptar una actitud mucho más positiva, o idealista según se mire, como hacen los informáticos, siempre dispuestos a decir que sí y para posteriormente convertirlo en un «ya veremos». Es posible que esa negatividad manifiesta surja de los documentalistas porque somos capaces de situarnos en el lado del usuario, conscientes de la problemática que éste se va a encontrar cuando comience a utilizar una aplicación, una página web, una interfaz que ataca una base de datos. Es por ello que siempre estamos dispuestos a situar un «pero», cuando consideramos que el bosque es mucho más extenso de lo que creen nuestros amigos, los informáticos, en un momento. Así pues, deberíamos cambiar nuestra actitud, colocar siempre el SÍ ante cualquier otra consideración y luego ya nos preocuparemos de cómo salimos del entuerto, simplemente a modo de supervivencia.

Digo esto porque recientemente, revisando una de las revistas informáticas más populares de España, me encontraba con una columna de opinión de un informático que atacaba la catalogación, las folksonomías y por extensión la documentación en un entorno donde Google podía hallarlo todo. Concretamente, a modo ilustrativo, nuestro informático consideraba que no necesitaba clasificar los correos que le llegaban, puesto que utilizando una serie de palabras clave podía localizar el email perdido en la avalancha de su buzón. Al mismo tiempo, creía que el etiquetado social, el tagging, era una actividad prescindible puesto que el superalgoritmo googleliano bien podría resolvernos la papeleta sin necesidad de andar perdiendo el tiempo en la gestión de la información personal.

Qué crueldad. En diez años, Google nos ha jubilado. Nos hemos convertido en prescindibles, en una figura cómica al lado de la compleja programación desarrollada desde Mountain View, creo que es el momento de acabar con esta farsa… En realidad, somos unos tecnófobos redomados, realicémonos un harakiri colectivo y entonemos un mea culpa. Somos unos obsoletos digitales

Sin embargo, no estamos más lejos de la realidad. Por ejemplo, seguramente nuestros lectores dispondrán de una cantidad mayor de ejemplos, me pregunto, ¿ha intentado recuperar información de una base de datos de un medio de comunicación? ¿Ha utilizado los sistemas de búsqueda en los archivos que los medios de comunicación disponen en sus webs? ¿Ha utilizado a Google para ello? ¿Cuáles han sido los resultados? Yo se lo diré, la experiencia manda: O sabe lo que busca, colocando específicamente las palabras mágicas publicadas en el texto que busca o difícilmente va a encontrar lo que desea. O lo ha leído previamente, o va a ser complicado encontrar nada y simplemente el silencio será estruendoso.

Hay que tener en cuenta que el trabajo que se realiza desde la parte humana en la descripción de la información, ya se trate de palabras clave, pequeños resúmenes o el control del vocabulario, es valor añadido a la información. Es relativamente sencillo perderse dentro de una base de datos documental en la que se vuelcan diariamente informaciones sin el menor control del vocabulario. Si se trabaja dentro de un medio de comunicación, lo primero que se aprende es que los propios periodistas utilzan conceptos y palabras distintas enfocados en un mismo tema, que una noticia seguimiento de una información anterior no tiene porqué necesariamente hacer referencia directa a la previa y a la hora de recuperar ambas la desambiguación es completamente necesaria.

Porque el informático podrá considerar que es posible indexar toda la información que se produce diariamente en un medio de comunicación impreso, sin embargo lo que los documentalistas ponemos sobre la mesa son las dificultades a la hora de recuperación, ordenación de resultados y pertinencia de los mismos. Sin embargo, a veces nos quedamos en un NO y una sonrisa, lo que no es suficientemente significativo para nuestro interlocutor y no aportamos valor añadido a la discusión. Sí, es cierto, el motor de búsqueda recuperará información si colocamos las palabras mágicas, las que conocemos que el texto contenía, aunque no siempre las conoceremos de antemano. Dispondremos en nuestra cabeza de conceptos y sinónimos, el rico lenguaje natural, sin embargo no siempre podremos atacar una base de datos con ellos y recuperar información, no recuperaríamos nada y será entonces cuando algo realmente no exista, a pesar de que realmente no lo habremos recuperado.

5 comentarios

INVENES: el «contradiseño» de una bases de datos

La dependencia de la profesión bibliotecaria/documentalista de la informática es un hecho, desde los primeros catálogos informatizados, individualizados para cada biblioteca, a los catálogos en línea y los colectivos; y desde las bases de datos bibliográficas en CD-ROM, a las ahora también en línea. De esta forma, la eficiencia y eficacia de nuestro trabajo se ven condicionadas en gran medida por el diseño de estos instrumentos imprescindibles para cualquier profesional; desde luego, no quito, ni la responsabilidad de cada cuál, ni su mérito, a la hora de lidiar con semejantes instrumentos.

Sin embargo, tal parece que la importancia de esta herramienta y su incuestionable interacción con sus usuarios -sin entrar en detalles de si se trata de un usuario "profesional", un bibliotecario o documentalista, o un "consultor", lector o investigador-, han pasado totalmente desapercibidas para la gran mayoría de diseñadores. Al menos, a esa conclusión he llegado tras intentar consultar la nueva base de datos de la Oficina Española de Patentes y Marcas sobre invenciones y diseños en español: INVENES.

Cada cierto tiempo, las instituciones públicas (principalmente, en el caso de catálogos de bibliotecas) y las privadas, dan un lavado de cara a su imagen y, por ende, a su catálogo, implementando lo que todos esperaríamos fueran mejoras. Estas "mejoras", en la mayoría de las ocasiones, no suelen ser tales, o al menos no suelen ser demasiado aceptadas y la nueva versión tiene muchas veces más detractores que la precedente. Aquí tengo que reconocer que a nuestros profesionales no suele gustarles demasiado los cambios.

En el caso de la Oficina Española de Patentes y Marcas, el cambio no ha sido de imagen, sino exclusivamente de su base de datos de patentes españolas; pero para el cambio que han hecho ¡que me quedo como estoy!

La nueva base de datos INVENES, viene a sustituir a la anterior, OEPMPAT, que tampoco brillaba por la usabilidad de su diseño. Aquella presentaba una imagen bastante anticuada y una búsqueda en la que la consulta continua de la ayuda era casi imprescindible, pero, claro, para eso está la ayuda. A pesar de ésta, que nos aleccionaba sobre qué buscar y cómo, la vieja OEPMPAT respondía el 50% de las veces con incomprensibles mensajes de error en la estrategia de búsqueda, que ninguna ayuda podía solucionar. O, tal vez, torpe que es una.

Pero ahora la nueva base de datos de patentes INVENES -que muy amablemente nos invita la Oficina de Patentes a "consultar por nosotros mismos"-, ha hecho que añore la anterior, con sus errores de búsqueda y sus deficiencias. Desde el primer momento en que hay que intuir que la manera de entrar en la base de datos es pinchar en la "V" del final de la página, en vez de en el enlace que hay justo al lado, ya podemos deducir que la usabilidad no era una de las prioridades de su diseñador. A partir de aquí, la odisea se prolonga durante todo el proceso de búsqueda: qué pasos hay que dar para realizar la búsqueda, qué quiere decir cada icono (¡gracias por los textos que los acompañan!), cómo obtener los documentos en pdf, cómo obtener un listado de documentos con su referencia y su resumen… Y claro, en esta ocasión la ayuda te descubre funcionalidades e iconos que, al menos en mi pantalla, jamás se ven reflejados.

Resultado de búsqueda en la web de Invenes

Es posible que el rechazo en mis primeros contactos con esta base de datos se deba a que, siguiendo la tónica profesional, tampoco me gusten los cambios. O que mi conocida actitud crítica me predisponga contra este nuevo diseño. Pero creo que los problemas que plantea su uso para cualquiera que no sea experto en la consulta de bases de datos y sus intríngulis, hará que más de uno decida desistir del intento y patentar lo patentado.

Mi lucha con esta base de datos, me ha recordado un artículo de Carina Farreras, publicado en el diario La Vanguardia en 1994, titulado "Las empresas europeas pierden unos 3,4 billones en investigar innovaciones ya patentadas". Farreras llamaba la atención en su artículo sobre las pérdidas en tiempo, dinero y recursos humanos que se producían por investigaciones que no eran novedosas, y cómo la Oficina Europea de Patentes intentaba minimizar estas pérdidas con su entonces nueva base de datos de patentes en CD-ROM, entre otros servicios. Este artículo citado por P. Escorsa y R. Maspons en su libro De la Vigilancia Tecnológica a la Inteligencia Competitiva, dejaba muy claro el concepto de Vigilancia Tecnológica y su importancia en el desarrollo tecnológico de una empresa, de una industria o incluso de un país.

Evidentemente, estas cuestiones nimias no se tienen en cuenta en ciertos ambientes. Pero no voy a echar más leña al fuego, que cada cual vea y opine. Lo que está claro, es que esta situación nos beneficia a los documentalistas: si hacen el proceso de búsqueda incomprensible, los profesionales tendremos campo para desplegar nuestras habilidades y no nos quedaremos sin trabajo.

También podría hablar largo y tendido sobre el diseño de las Intranets, pero ¿para qué deprimirnos?

17 comentarios