Saltar al contenido →

Etiqueta: motores de búsqueda

Google evoluciona su búsqueda apoyado en la IA

Cómo se han concebido las búsquedas de información en la web no han variado en exceso desde hace años. Ni siquiera Google, que destronó en su momento a Yahoo y Altavista, modificó de forma importante cómo se representaban los resultados de las búsquedas. Es cierto que, al contrario de su competidores de entonces, ofreció una página limpia a la hora de realizar las búsquedas que fue revolucionaria en su época, pero cómo se mostraban los enlaces que daban acceso a las fuentes relevantes a una búsqueda determinada no suponía un gran cambio. Al final, usase un buscador u otro, el usuario siempre se encontraba con un listado de enlaces web que seguían una prioridad determinada por un algoritmo sobre los que el usuario debería ir saltando confiando encontrar la información deseada.

Lo interesante en este punto es que el usuario tendía a conformarse con los primeros resultados que los buscadores mostraban, no tendía a profundizar en las respuesto y esto derivó en dos situaciones: Google comenzó a monetizar ese espacio prioritario (llegando en ocasiones al ridículo) y los generadores de contenido trataban de que el algoritmo les situase en los primeros puestos tratando de entender sus reglas de priorización.

Esta situación derivada desde los años 90 del siglo XX, va a cambiar con la consolidación de la tendencia de la Inteligencia Artificial (IA). Google presentó recientemente su nuevo AI Mode que viene a modificar cómo vamos a interactuar con su buscador. Pero es importante puntualizar que no lo hace por gusto, se ve empujado porque la competencia ha comenzado a robarle protagonismo a la gran G en el sector de las búsquedas de Internet.

Las implicaciones del cambio de la búsqueda hacia un listado de documentos a una conversación es un movimiento de las placas tectónicas de la web tal y como la hemos conocido. Lo primero, Google ve cómo empieza a ser desplazado en este mercado dentro de una competencia liderada por OpenAI con su ya ubicuo ChatGPT principalmente, pero emergiendo otras propuestas muy interesantes como Perplexity o Anthropic. Los modelos de IA generativa comienzan a erosionar la línea de flotación sobre la que se sustenta Google en su página principal, la publicidad contextual.

Esta percepción de cambio también comienza a involucrar a otros actores que tenían acuerdos con Google y que se comienzan a replantear cuál va a ser el futuro de la búsqueda en Internet e incluso en su integración con los dispositivos móviles. Uno de los más relevante es Apple que comienza a valorar el cambio de la opción de búsqueda por defecto de su navegador Safari preponderante en los iPhones hacia otra solución conversacional.

De momento, Google comienza a apalancarse en su liderazgo en Internet con el navegador Chrome para tratar de contener a sus competidores dentro del ámbito de las búsquedas de internet con AI, lo que puede reforzar la percepción de que es un monopolio bajo el que ya está siendo investigado.

Deja un comentario

Qué es el Google Dorking

Las técnicas de Google Dorking, también denominadas Google Hacking, consisten en utilizar comandos de búsqueda avanzados de Google para obtener información que no se obtienen mediante técnicas normales de búsqueda. Estos comandos de búsqueda van desde el conocido “site” o “title”, sin embargo pueden ser usados como técnicas de hackeo de páginas web o servidores.

El término de Google Hacking fue utilizado por primera vez en 2002 por Johnny Long. Long comenzó a recopilar comandos de búsqueda en Google que dejaban al descubierto sistemas vulnerables o información sensible (números de la seguridad social o incluso números de tarjetas de crédito) y comenzó a etiquetarlos como GoogleDorks. Finalmente, debido al interés por su iniciativa creó la Google Hacking Database donde se recopilan todas estas ecuaciones de búsqueda.

El objetivo de esta recopilación es que los responsables de los sitios web realicen las búsquedas por ellos mismos como método preventivo y que sean capaces de detectar esos errores y fugas de información.

Estas técnicas de hackeo hacia servidores y sitios web se han extendido tanto hacia otros buscadores como Bing y hacia otros dispositivos conectados en la Web como dispositivos IoT.

Comentarios cerrados

La explotación estadística de textos a través de Ngram Viewer

Google Ngram Viewer es un motor de búsqueda que muestra las frecuencias de un conjunto de cadenas de búsqueda delimitadas por comas, utilizando un recuento anual de n-gramas de fuentes impresas entre 1500 y 2008. Liberado en 2010, la fuente principal de donde se nutre este programa es Google Books. El programa puede buscar una sola palabra, un conjunto de ellas o frases completas, incluyendo errores ortográficos. Esto permitiría a historiadores y lingüistas trazar la trayectoria de palabras y frases a través del tiempo sobre la base de una enorme cantidad de datos lo que permite observar el auge y la caída de ciertas expresiones, giros y palabras. Incluso algunos historiadores denominaron a este nuevo campo abierto por Google como culturomics. Sin embargo, aunque el fondo puede llegar a ser interesante, el Ngram Viewer dispone de varios problemas.

El más evidente son los errores en el reconocimiento de caracteres, que nunca es un proceso perfecto y que empeora cuando las tipografías utilizadas son antiguas. Uno de los mejores ejemplos, es la confusión que tiene el sistema con las letras f y s. El segundo es que existe una preponderancia de literatura científica. El tercero los errores en la introducción de los metadatos de los libros escaneados que pueden dar representaciones de términos en épocas que no existían.

En el gráfico siguiente, podemos ver la evolución comparativa de los términos disruptive y disruption a modo de ejemplo.

ngram

Comentarios cerrados