Vía Google.dirson, descubro un interesante artículo publicado en el New York Times (At I.B.M., That Google Thing Is So Yesterday). En él, un periodista del diario nos relata la interesante visita que realizó al Centro de Investigación de IBM que posee cerca de Nueva Cork, el Watson Research Center, y los avances que el centro estaba realizando sobre las arquitecturas para los motores de búsquedas.
En este artículo, se nos presenta el concepto de Búsquedas de Tercera Generación que consistirían en el siguiente paso a realizar por los buscadores. De una forma breve, la primera generación de búsquedas consistiría en la técnica de localizar documentos que contengan exactamente unas determinadas palabras dadas. Por ejemplo, es la utilizada por las búsquedas que realizan los Sistemas Operativos para localizar documentos en el disco duro y sobre las que se basaron los primeros buscadores de Internet. Por otro lado, la segunda generación de búsqueda sería la que en estos momentos lleva a cabo Google junto con otros buscadores, basándose en palabras clave y otros indicadores. De esta manera, los buscadores devolverían una serie de enlaces sitios web en función de unas palabras de búsqueda y los pesos que les asignarían mediante una serie de variables.
Las búsquedas de tercera generación irían más allá, puesto que podrían extraer el significado implícito de cualquier material incluso si no se encuentra estructurado de alguna manera (bases de datos, ficheros de e-mail, grabaciones, imágenes o vídeos) o se encuentra en varios idiomas. Además, el sistema podría contestar a cualquier pregunta que se le formulase, incluso si se realizase en lenguaje natural.
Las primeras pruebas de esta nueva generación de buscadores se están realizando con un sistema denominado Piquant (Practical Intelligent QUestion ANswering Technology) que puede analizar estructuras semánticas de un documento y posteriormente exponer el conocimiento que no estaba explícitamente en él. Por ejemplo, a la pregunta: ¿Quién es el Primer Ministro de Canadá? Y después de haber escaneado diversos artículos sobre política canadiense, podía responder a la pregunta correctamente a pesar de que en los textos no aparecían las palabras exactas de la cuestión formulada.
¿Cuándo podremos probar esta nueva generación de tecnologías para la búsqueda? Arthur Ciccolo de IBM considera que puede que dentro de dos años, ahí es nada.
Parece muy interesante la idea en la que se basan estas búsquedas de tercera generación, pero si funcionan igual de bien que algunos traductores, los resultados van a ser muy divertidos 🙂
Bueno, de momento el salto de la primera (Altavista en sus tiempos) a la segunda (Google) generación ha ido bastante bien, con la obtención de resultados relevantes y a pesar de las trampas que se han intentado desarrollar hacia el buscador.
¿La Tercera Generación? Ya veremos.
Puede ser interesante, no olvidemos que al principio nada es perfecto, seguramente se desarrollará 😀
primero que nada quiero decirles que me gusta la Informatica