Saltar al contenido →

Categoría: Tecnología

Qué es el Google Dorking

Las técnicas de Google Dorking, también denominadas Google Hacking, consisten en utilizar comandos de búsqueda avanzados de Google para obtener información que no se obtienen mediante técnicas normales de búsqueda. Estos comandos de búsqueda van desde el conocido “site” o “title”, sin embargo pueden ser usados como técnicas de hackeo de páginas web o servidores.

El término de Google Hacking fue utilizado por primera vez en 2002 por Johnny Long. Long comenzó a recopilar comandos de búsqueda en Google que dejaban al descubierto sistemas vulnerables o información sensible (números de la seguridad social o incluso números de tarjetas de crédito) y comenzó a etiquetarlos como GoogleDorks. Finalmente, debido al interés por su iniciativa creó la Google Hacking Database donde se recopilan todas estas ecuaciones de búsqueda.

El objetivo de esta recopilación es que los responsables de los sitios web realicen las búsquedas por ellos mismos como método preventivo y que sean capaces de detectar esos errores y fugas de información.

Estas técnicas de hackeo hacia servidores y sitios web se han extendido tanto hacia otros buscadores como Bing y hacia otros dispositivos conectados en la Web como dispositivos IoT.

Deja un comentario

Cuando el tagging se convierte en nocivo (en el MundoReal™)

Una de las cosas que la Web 2.0 trajo consigo es el etiquetado tanto de artículos, fotografías como de otro tipo de documentos. Estas etiquetas, asignadas en muchas ocasiones libremente por los usuarios de este tipo de servicios, son palabras clave cuyo fin es permitir a otros usuarios del mismo servicio localizar información y artículos relacionados.

Este sistema de clasificación de información de los que se sirve servicios bien conocidos como Twitter o Instagram es una buena idea en un principio. Por ejemplo, en el caso de Twitter sirve para la detección de las tendencias en distintos ámbitos de clasificación de la información, ya se geográficamente como temáticamente. Y a pesar de que esta acción parezca ser superflua en primera instancia, tiene un impacto en el MundoReal™.

Algo tan inocente como un turista o un vecino añadiendo una etiqueta a una fotografía que se acaba de hacer de un elemento natural que le resulta bonito o simplemente interesante puede llegar a convertirse en un problema precisamente para la conservación de aquello que acabamos de inmortalizar. De hecho, ya hay Parques Naturales como Keep Jackson Hole Wild que están pidiendo a sus visitantes que no Geo-localicen sus fotos en un intento de preservar los espacios naturales del parque.

Un ejemplo a pequeña escala es el Broccoli Tree que acabó siendo vandalizado y finalmente talado precisamente por su popularidad en Instagram. El árbol fue popularizado por Patrik Svedberg que realizó durante meses de un árbol situado en Suecia. Poco a poco, el árbol fue adquiriendo popularidad convirtiéndose en una pequeña atracción turística y ganándose un hueco como celebridad en Instagram con 30.000 seguidores. Sin embargo, en 2017, alguien cortó una de sus ramas y posteriormente alguna autoridad local decidió que había que cortar el árbol entero poniendo fin a este pequeño rincón natural.

De esta forma, un sistema que sirvió para destacar un elemento natural y que personas de todo el mundo lo conociesen y apreciasen, sirvió también para acabar con él. Algo que también se puede comprobar a mayor escala en espacios naturales como Maya Bay que tuvo que ser cerrada para tratar de recuperar su ecosistema ante la gran afluencia de turistas.

Deja un comentario

Tú en tu burbuja (de información)

2018 fue el año que se le cayó la careta de Facebook definitivamente. Detrás de la imagen, un tanto amable de Mark Zuckerberg, ya puesta en duda en la película de David Fincher La Red Social, en la que se mostraba al CEO de Facebook como una persona ambiciosa y sin apenas escrúpulos (aunque se le trataba de edulcorar hacia el final de la cinta); descubrimos una realidad en la que lo sencillo es traficar con nuestros datos casi con total impunidad. Así, tras disculpa tras disculpa, Facebook ha ido escurriendo el bulto durante todo el año.

Sin embargo, hace ya bastante tiempo que se nos advirtió que cuando algo era gratis, el producto éramos nosotros. En definitiva, que alguien estaba explotando esa información que desinteresadamente, casi sin darnos cuenta, estábamos dándoles un pozo de información de la cual se podía extraer un beneficio económico.

No nos llevemos a engaño. Cada vez que conectamos un servicio adicional (Spotify, iVoox, etcétera) a Facebook o a Google, le estamos dando una llave a acceder a una gran cantidad de información a una y a otra empresa. Una información que nos descubre quiénes somos a terceros hasta extremos que como usuarios no podemos imaginar. Os invito a que os paseéis por la web de Google My Activity o vuestro historial de localizaciones para descubrir qué sabe Google de vosotros. Por supuesto que esto es sólo una pequeña parte de lo que la empresa de la gran G sabe de nosotros.

Esta información no sólo sirve para saber qué nos ha interesado, si no también qué nos puede llegar a interesar. En el caso de Google, en diciembre de 2009, implementó un algoritmo para ajustar los resultados al usuario. De esta manera, buscásemos lo que buscásemos, Google trataría de acomodar la información que nos proveyese atendiendo a nuestros gustos. Por ejemplo, dependiendo de la información que tuviese la empresa de Mountain View, cuando buscásemos “partido político” podría preponderar información sobre partidos de la izquierda o de la derecha partiendo de nuestras búsquedas previas y nuestras preferencias.

Este filtro burbuja ya establecido provoca que nos veamos limitados a la hora de obtener la información más relevante ante una búsqueda. Realmente Google nos ofrece lo que queremos leer, no la información más completa y mejor. Esto puede derivar hacia que la próxima batalla se va a establecer respecto a qué datos pueden ser usados y cómo en cuanto usamos la red. La privacidad se está convirtiendo en una característica de los productos de Apple sin ir más lejos.

En España, tenemos un ejemplo respecto a la ley que permite recopilar datos a los partidos políticos para definirnos ideológicamente. Este movimiento legislativo ya ha sido contestado por la Agencia de Protección de Datos española afirmando que es ilegal recopilar información sobre la ideología de las personas, aunque obviamente parezca que esa información ya se encuentra recopilada y disponible para quien quiera usar de ella.

Ya se ha demostrado que en Twitter (y por supuesto en cualquier red social) seguimos a personas que tienen nuestros mismos puntos de vista, que no seguimos a personas del signo contrario. El riesgo es que se nos intente manipular de cierta manera para que cambiemos nuestro punto de vista, que no alcancemos la información que nos daría un contrapunto y que nos hiciese cuestionar nuestras creencias previas. De esta manera, una fuente podría darnos una información falsa interesadamente, dándonos una confirmación de algo que tenemos nosotros prefijado previamente y que no necesariamente se acercase a la realidad.

En definitiva, el riesgo no es la información, sino la desinformación y la manipulación como se ha ido demostrando los últimos años. Una vez más, como consumidores de información debemos considerar qué fuentes de información consultamos, qué ética se persigue y si realmente esta fuente de información es real o de humor (¿cuántas personas de habla hispana y no hispana saben que El Mundo Today es un medio satírico?).

Actualmente, el acceso a la información es casi inmediato, pero sin filtro. El filtro lo establecemos cada uno de nosotros con nuestra experiencia, aunque gracias a los algoritmos serán otros los que decidan cómo y qué tipo de información consumiremos.

Deja un comentario

La otra barra de internet: los comentarios

Alguien me comentó una vez divertido que cuando visitaba un medio de comunicación, tenía querencia por leerse el titular y pasar directamente a los comentarios mientras se reía. Me pareció un punto de vista interesante, ya que acababa de despreciar el contenido del medio de comunicación por la conversación que se generaba, y además marcaba otro lugar fuera de lo que actualmente se considera que el lugar donde deben realizarse las conversaciones de bar digitales: Twitter. Por supuesto que la red social no está marcada tan sólo por polémicas informativas, ya que se han llegado a diferenciar hasta seis tipos de conversaciones en Twitter, pero no me parecía sensato que se abonase el terreno dentro de una web para discutir casi de cualquier cosa porque, como es obvio, la conversación podría escalar hasta límites insospechados.

Tampoco debemos olvidar que no sólo los medios de comunicación generan polémicas alrededor de los comentarios ya que sitios de compra o de recomendación como Amazon o Tripadvisor también los poseen dentro de su ámbito. Por lo tanto, como podemos comprobar cómo gestionar la participación de los usuarios y los lectores dentro de las webs ha sido intenso y complejo. En el caso de los medios, ¿qué valor añadido pueden dar? ¿realmente fomentan el debate y la generación de argumentos, contraargumentos e ideas? ¿o simplemente se trata de armar una discusión abonada al insulto o a afirmar que el otro no tiene ni idea sin atender a nuestras propias argumentaciones?

Desde luego, que más allá de la problemática de gestión que generan los comentarios en un medio de comunicación, también hay que tener presente que los profesionales que firman un artículo también se pueden llegar a sentir afectados de cierta manera sobre el debate sin freno que pueden generar. Sin embargo, aunque el debate se ha extendido incluso teniendo que dar explicaciones en algunas ocasiones debido a la virulencia de los comentarios, que un medio renuncie a los comentarios es renegar de una parte del valor que generan los contenidos. Y aunque es cierto que ese debate se ha trasladado hacia otras fuentes de información y de difusión como son las redes sociales, esos comentarios permiten a los medios de comunicación construirse una identidad tanto dentro de internet como fuera de ella.

Por eso, en un primer momento, los medios de comunicación no percibieron la polémica con los comentarios como un problema, si no como algo positivo. Principalmente, porque la presencia de que algún usuario incitase a la polémica servía a la retención del resto de los usuarios, a registrarse en el medio y por supuesto a que permaneciesen más tiempo en la página. Claro que finalmente el contenido del artículo no era lo importante y se veía desplazado por las descalificaciones que se entrecruzaban unos y otros. Se alcanzaba un punto que los propios autores de las piezas informativas debían evitar la lectura de esos comentarios puesto que descubrían que lo importante no era lo que se relataba en ellos sino más bien la viralidad que se podía obtener de ellos.

Sin embargo, los medios de comunicación han tratado de cuidar los comentarios desde un primer momento tratando de controlar el ámbito y las buenas formas. Simplemente para dar un valor añadido a los artículos. Lamentablemente, en algunas ocasiones, las peores cosas de los propios medios de comunicación son los lectores y desde luego que tener la posibilidad de decir no implica tener algo que decir y es lo que siento cuando yo mismo leo los comentarios de algunas noticias.

Imagino que cuando ya se alcanzan las descalificaciones personales es cuando el asunto se descontrola. En el pasado, las cartas al director eran una vía de salida a aquellos lectores enfadados con el medio. Por supuesto que eran otros tiempos cuando todo se destilaba de una forma más tranquila y sin las premuras de esta sociedad líquida. En cualquier caso, los medios de comunicación todavía no han acabado con la posibilidad de que sus lectores aporten sus puntos de vista a través de los comentarios y desde luego no parece que sea una opción que vaya a cerrarse en el medio plazo.

Deja un comentario

Abro hilo

Hace un tiempo que Twitter dejó de ser el lugar de los 144 caracteres y pasó a ser algo más basto y probablemente más interesante. No cabe duda que fueron sus propios usuarios los que fueron marcando el camino a sus desarrolladores. Los RT fueron retuits, los FAV fueron likes y los enlaces pasaron a no contar dentro de esos 144 carácteres cuando fueron considerados como información necesaria (para drama de las plataformas desarrolladas para acortar las URLs de esos enlaces). Un tiempo después, esos 144 caracteres se duplicaron con la intención de permitir poner más contenido; aunque también es posible que simplemente sirviese para añadir más palabras de las necesarias.

Pero, Twitter es un ente que se debe ir ajustando a sus usuarios y estos comenzaron a marcar sus tuits indicando cuándo comenzaba y acababa un mensaje que sobrepasaba esos 144 caracteres iniciales. Por ejemplo, si un tuit pertenecía a un grupo de tres, y era el segundo de ellos, se marcaba claramente (2/3). Y de ahí surgieron los hilos y Twitter decidió implementarlo como otra opción más.

Me parece fascinante las aplicaciones complementarias de estos hilos tuiteros. En algunos casos, se trata de hilos periodísticos de resumen de una semana. En otras ocasiones, se trata de hilos literarios donde el autor prosigue su relato, intercalándose los comentarios de los lectores. Otras veces, es una historia de ficción, personificada en el tuitero donde transmite sus vivencias jugando con la realidad y la ficción. En otras ocasiones, son artículos más o menos elaborados de un tema, que añaden información relativamente novedosa y podrían ser considerados bastante bien una pieza periodística.

Como autor en un blog, y desde luego que amante de los textos largos puesto que considero que siempre es necesario un poco de contexto, nunca llegué a comprender muy bien las bondades de Twitter. Aunque tengo que afirmar que Twitter es una herramienta ideal dentro de esta sociedad hiperconectada, enganchada a las notificaciones, que consume contenidos en pantallas pequeñas y que agotan la vista. Twitter pertenece y es un paradigma de esta sociedad líquida. Sin embargo, los hilos también agotan a sus consumidores. El esfuerzo cognitivo y de recuperación de la información que debe realizarse para consumir contenidos en Twitter y más si se trata de un hilo es superior a otros contenidos puesto que hay que hacer una tarea de recuperación e investigación superior. En ocasiones, es imposible recuperar toda la información y obviamente se pierde.

Personalmente, opino que el drama de los hilos es que pueden quedarse en un saco roto. Nadie podrá recuperarlos dentro de un breve tiempo (unos meses) y sus autores también les perderán la pista una vez publiquen 20 tuits o incluso otro hilo. Este es el destino de los hilos, de sus contenidos, que nadie se acordará de ellos cuando sobre pasen los diez primeros tuits de las cuentas que los originaron.

Aunque también es posible que sus autores perseguían precisamente eso con sus hilos, contenidos breves y efímeros sin mayor ambición que ser consumidos en el ámbito temporal en el que fueron concebidos. Sociedad líquida en estado puro tal y como lo es también Twitter.

Deja un comentario

El fin del hiperenlace

Esta semana, en el blog de Microsiervos, realizaban una interesante reflexión gracias a la publicación de un vídeo TED sobre el origen de los hiperenlaces y cómo este concepto cambió la forma en la que entendíamos Internet. Porque en los años 90 se distinguía entre la Web e Internet, ya que Internet era mucho más grande que la Web que se cimentaba en el desarrollo de Tim Berners-Lee que definió como un sistema de información (1989).

El desarrollo de Apple y de Steve Jobs cambió totalmente en 2007 la forma en que las personas podíamos acceder a la información alojada en la Web. El iPhone permitía priorizar unas fuentes sobre otras simplemente colocando un icono en la pantalla de inicio de un teléfono. En ocasiones, se trataba de fuentes de información y de comunicación basadas en pequeños textos, donde se destacaba la agilidad de los mensajes cortos como fue Twitter o Facebook en sus inicios. Aunque por supuesto también teníamos acceso a las fuentes mismas de información mediante las aplicaciones para dispositivos móviles de los propios medios de comunicación. Además, no podemos olvidar que surgieron otras aplicaciones que durante mucho tiempo sólo eran accesibles a través de dispositivos móviles y no permitían su acceso a través de navegadores web como era el caso de Instagram o incluso de aplicaciones de mensajería instantánea tipo Whatsapp o Telegram que desarrollaron sus versiones web de forma tardía.

Sobre las páginas web ya existentes previamente antes de la sacudida del iPhone, todos los sistemas de gestión de contenidos tuvieron que migrar desde una concepción basado en el navegador hacia otro concepto basado en el dispositivo móvil. Los gestores de bases de datos tuvieron que ser rediseñados para servir peticiones de acceso para un tipo de dispositivo u otro, además de tener que adaptarse a pantallas que contradecían la tendencia en el escritorio. En este caso, las pantallas de los ordenadores se hacían más grandes, sin embargo los primeros smartphones tenían pantallas de 4 pulgadas.

Aunque en los inicios del desarrollo de la Web se pudo criticar a los medios de comunicación de estar centrados en demasía consigo mismos, teniendo una tendencia a no enlazar contenidos externos, si observamos los últimas noticias políticas de los últimos meses, podremos comprobar que esta tendencia se ha revertido en parte. El reconocimiento de unos medios hacia otros ha cambiado y no es difícil encontrar referencias e incluso enlaces de un medio a otro. El objetivo en aquel momento era no perder lectores, reducir el bounce rate lo máximo posible y retener a los visitantes. Esto bien sucede en las aplicaciones para dispositivos móviles de medios de comunicación actuales que incluso les cuesta permitirte copiar los textos de un artículo aunque tengas intención de twitearlo (lo cual es fácilmente evitable entrando en el artículo del medio a través de su página web, por supuesto).

Es posible que las páginas web y las aplicaciones móviles de las empresas más importantes de Internet (ahora sí) eviten la utilización de enlaces puesto que carecen de interés a que el usuario se marche a otro lugar, reduciendo sus métricas y obviamente yendo en detrimento de sus anunciantes. De hecho, por ello, las estrategias de estas empresas pasan en los móviles en desarrollar seudo-navegadores en sus propias aplicaciones móviles cuando el usuario hace clic en un enlace. Sin embargo, la naturaleza propia de la web, compartir información, saltando de un sitio a otro, sigue estando muy presente. Puede que el enlace en su concepción inicial como elemento diferenciado y destacado de un texto haya evolucionado, mercantilizado en suma, sin embargo seguimos compartiendo información de forma masiva. El hiperenlace web simplemente fue un primer estadio, ahora sus usos y aplicaciones simplemente se han sofisticado.

Deja un comentario

La explotación estadística de textos a través de Ngram Viewer

Google Ngram Viewer es un motor de búsqueda que muestra las frecuencias de un conjunto de cadenas de búsqueda delimitadas por comas, utilizando un recuento anual de n-gramas de fuentes impresas entre 1500 y 2008. Liberado en 2010, la fuente principal de donde se nutre este programa es Google Books. El programa puede buscar una sola palabra, un conjunto de ellas o frases completas, incluyendo errores ortográficos. Esto permitiría a historiadores y lingüistas trazar la trayectoria de palabras y frases a través del tiempo sobre la base de una enorme cantidad de datos lo que permite observar el auge y la caída de ciertas expresiones, giros y palabras. Incluso algunos historiadores denominaron a este nuevo campo abierto por Google como culturomics. Sin embargo, aunque el fondo puede llegar a ser interesante, el Ngram Viewer dispone de varios problemas.

El más evidente son los errores en el reconocimiento de caracteres, que nunca es un proceso perfecto y que empeora cuando las tipografías utilizadas son antiguas. Uno de los mejores ejemplos, es la confusión que tiene el sistema con las letras f y s. El segundo es que existe una preponderancia de literatura científica. El tercero los errores en la introducción de los metadatos de los libros escaneados que pueden dar representaciones de términos en épocas que no existían.

En el gráfico siguiente, podemos ver la evolución comparativa de los términos disruptive y disruption a modo de ejemplo.

ngram

Deja un comentario
Usamos Cookies - Utilizando este sitio o cerrando este mensaje aceptas nuestra política de Cookies.
Aceptar Cookies
x