Saltar al contenido →

Categoría: Tecnología

Cuando Goliat (Google) se encontró con David (ChatGPT)

La rápida tasa de adopción de ChatGPT de OpenIA será digno de estudio en las escuelas de negocio en un breve espacio de tiempo. Desde que se permitió el acceso al gran público en noviembre de 2022, ha fascinado a todos los que se han aventurado a probarlo ofreciendo una calidad en las respuestas y en los resultados que no han podido poner en cuestión el producto en sí. Un producto que recordemos que se encuentra en fase de prototipo y que ya ha puesto a la defensiva a las grandes tecnológicas como Google, Meta (Facebook) y Apple.

ChatGPT (Generative Pre-Trained Transformer) posee la interfaz de un chatbot. La interacción con el producto es lanzando preguntas a las que el sistema genera respuestas a través de toda la información con la que se ha entrenado (570 gigabytes de información textual). Su éxito se debe a que comprende bien las instrucciones y proporciona respuestas mediante el procesamiento del lenguaje natural. Cada pregunta puede tener contestaciones similares pero no iguales, puesto que se generan automáticamente y a cada interacción por lo que puede ampliar o reducir el alcance de la respuesta a cada momento. Sin embargo, y es un punto en su contra, no aporta información sobre sus fuentes de información por lo que puede generar dudas sobre las respuestas si el usuario no es un experto en la materia que se está consultando.

En definitiva, la interfaz es similar a la de Google y muy sencilla, una caja de texto (en este caso de interacción) en la que se pueden solicitar definiciones, que detalle conceptos complejos de forma sencilla, que trace planes estratégicos para las empresas, recomendaciones de lugares que visitar en vacaciones, resúmenes de textos ya sean artículos o libros o ayudar a programar en código. Una herramienta muy potente y diversa en casos de uso que puede llegar a amenazar a Google en la mayoría de las búsquedas de internet y cuyo uso ha comenzado a generalizarse tanto en el ámbito de la educación, académico y empresarial.

Google es el gigante de internet más allá de su buscador, también posee YouTube y el sistema operativo para móviles Android, además de infinitos productos pensados para ser utilizados en Cloud. En cuanto a las búsquedas, actualmente el 92.58% del mercado de las búsquedas a nivel global y el 80% de sus ingresos provienen del mercado publicitario en Internet. Posee acuerdos marco tanto con Apple (Safari) como con Mozilla (Firefox) para que su buscador sea la opción por defecto en sus respectivos navegadores. Sin embargo, el producto de la empresa OpenIA participada por Microsoft parece dispuesta a arrebatarle el trono de las búsquedas en Internet y en otros muchos ámbitos según evolucionen los casos de uso donde aplicarse la tecnología desarrollada por la empresa.

Puede parecer que a Google el desarrollo la haya cogido con el pie cambiado, pero lleva años trabajando en aplicaciones de inteligencia artificial como ChatGPT. De hecho, la tecnología que representa el corazón del producto de OpenIA fue desarrollada por ingenieros de Google. Sin embargo, Google no había decido apostar claramente por estos interfaces porque generaría un problema con su modelo de negocio. Una estrategia que se ha demostrado errónea en cuanto el mercado se ha puesto patas arriba con ChatGPT, y la gran G se ha apresurado a lanzar su propio chat denominado Bard, aunque no estaba tan depurado como el primero.

Microsoft no ha perdido el tiempo en cuanto el producto ha obtenido tracción e interés en el mercado. Ha ampliado su inversión en la empresa OpenIA a pesar de las dudas del modelo de negocio de la empresa, ha integrado ChatGPT en su buscador Bing (a mi parecer que unos resultados más pobres, aunque sí que referencia las fuentes de información) y ha comenzado su implementación en su sistema operativo Windows y en la suite Office (Microsoft Copilot) . Una apuesta absoluta a un desarrollo tecnológico que va a hacer que cambiemos no sólo cómo buscamos en internet, si no también cómo interactuamos con nuestras aplicaciones en el ordenador.

Deja un comentario

Persuasive Technology, haciendo que la tecnología nos haga cambiar de comportamiento

La Persuasive Technology y su campo de investigación, Captology, comenzó a ser estudiada por B.J. Fogg a inicios de los años 90 en la Stanford University. Este área se define como el estudio de cómo usar la tecnología para persuadir a las personas que cambien su actitud o su comportamiento. Un ejemplo claro de su aplicación son los sitios web y sus aplicaciones móviles correspondientes (Facebook, YouTube, Instagram…) que nos hacen estar enganchados con los métodos tradicionales de persuasión – usando información, incentivos y coacciones – junto con las nuevas capacidades de los dispositivos para cambiar el comportamiento de los usuarios. En definitiva, esta rama del conocimiento estudia cómo entrenar a las personas para que hagan las acciones concretas que los diseñadores de esa tecnología desean (behavioural design)

El concepto definido por Fogg podría resumirse en la fórmula B=MAT. Donde B sería comportamiento (Behaviour) que se define como la conducta de alguien, mientras que el resto correspondería a Motivación, habilidad (Ability) y gatillo (Trigger). Además, el investigador considera que si uno de estos elementos no se encuentra, el cambio de comportamiento no ocurrirá.

  • Motivación. Las personas debe estar lo suficiente motivada para cambiar su comportamiento.
  • Habilidad. Las personas necesitan disponer de la habilidad de gestionar su comportamiento.
  • Gatillo (Trigger). Los usuarios tiene que ser alentados a cambiar su comportamiento como, por ejemplo, a través de un diseño atractivo o el uso de gamificación.

Por otro lado, los elementos se interrelacionan entre sí, por lo que hay cuatro puntos a tener presente:

  • Según la motivación y las capacidades aumentan, es más sencillo que se produzca el cambio de comportamiento.
  • Existe una relación inversa entre motivación y habilidad, cuanto más sencillo es hacer algo menor motivación se necesita.
  • Si un diseñador quiere que un tipo de comportamiento ocurra, necesita encontrar maneras para incrementar la motivación de las personas o sus habilidades (o ambas).
  • Si alguien no tiene motivación para hacer algo fracasará al hacerlo, no importa lo simple que sea. Por otro lado, si alguien está muy motivado pero es difícil hacerlo, se sentirán frustrados y no realizarán ninguna acción.
Comentarios cerrados

El efecto madriguera en Internet (y en tu móvil)

No es algo infrecuente. Recibes una notificación en el smartphone y sin que te hayas percatado ya ha pasado una hora. Es como un agujero de gusano en el que nos adentramos y no sabemos qué hay en el otro extremo, una cosa nos lleva a la otra sin que nos demos cuenta realmente del tiempo malgastado. No importa mucho qué plataforma utilices, puede tratarse de Twitter, YouTube, WhatsApp, Facebook o Instagram (por citar unas pocas), una vez te adentras en ellas te es casi imposible salir. Tu cerebro parece desconectarse de la verdadera razón del porqué está ahí y de las cosas más urgentes que te quedan por hacer.

Pero no deberías culparte, estas plataformas están diseñadas para ello, para atraparte en un bucle infinito de tal manera que permanezcas el máximo tiempo posible. Quién negaría que se ha pasado una tarde saltando en Netflix de serie en serie, película en película (bendita reproducción automática de contenidos), para finalmente descubrir que no ha acabado ninguna serie ni ninguna película. Dos horas de tu vida en un vacío donde realmente no has alcanzado a ver nada.

Es lo que en el ámbito anglosajón denominan el efecto madriguera (rabbit hole phenomenon) sobre nuestro comportamiento on-line haciendo referencia y como metáfora a Alicia en el País de las Maravillas de Lewis Carroll, porque Alicia caía en la madriguera hacia un destino incierto y con muchas cosas extrañas que se encontraba en el camino. Es gracias a la cultura de la distracción creada por el ámbito tecnológico actual. No hace tanto tiempo, podíamos pasar una tarde entera leyendo un libro o viendo una película completamente centrados en esas actividades, actualmente no. Es inevitable que nuestro cerebro busque la recompensa inmediata de una notificación o que de repente recuerde que tiene que buscar eso que es tan urgente, pero que podría esperar hasta el día siguiente.

Puede que seamos conscientes de ello o no lo seamos, que nos frustremos por aquella capacidad de concentración que antes teníamos, sin embargo constantemente caemos en ella. Incluso se podría describir las formas en las que caemos en esas madrigueras: iterativa, exhaustiva y asociativa. Parece que desde luego no importa lo que hagas, finalmente vas a caer en una de ellas.

En el caso de la iterativa, comienzas buscando algo (puede tratarse de información pero también de un producto o un servicio) y acabas buscando en distintas fuentes comparando servicios y productos. En la exhaustiva, buscas algo muy concreto y acabas recopilando información ampliando el alcance de esa búsqueda dentro de un ámbito relacionado. Finalmente, en la asociativa, consultas una fuente de información que te lleva a otra y ésta te lleva a otra, dos horas después estás en un punto que lo que estás consultando no tiene nada que ver con la primera cosa que consultabas.

Comentarios cerrados

EdgeRank vs PageRank o cómo consumimos información en Internet

Es cierto. Hablar hoy en día sobre cómo interactuamos con el contenido en la Red basándonos en los algoritmos de Google (PageRank) y Facebook (EdgeRank), sólo nos puede ilustrar respecto a los filtros a los que nos vemos sometidos para acceder a la información que estamos consumiendo. Hace mucho tiempo que Google trata de ocultar la puntuación de Pagerank en los sitios web animando a los desarrolladores a que se centren más en el SEO, mientras que Facebook dejó de utilizar su algoritmo EdgeRank en 2011 siendo sustituido por una inteligencia artificial en 2013 que tiene presentes 100.000 factores distintos. Sin embargo, es necesario retroceder al nacimiento de estos dos algoritmos, para entender cómo consumimos la información hoy en día y cómo las grandes empresas recaban información sobre nuestros comportamientos para tratar de mostrarnos la mejor información posible.

Google se basó en conceptos bibliométricos para desbancar a su competencia a finales del siglo XX. Realmente, cuando buscabas cualquier término en el buscador de Mountain View los resultados eran relevantes y parecía que su motor de búsqueda se encontrase a gran distancia de su competencia más inmediata. Tanto es así que Google estuvo mucho tiempo relacionado con el concepto de «buscar en Internet» porque funcionaba realmente bien. Sencillamente, el algoritmo PageRank consideraba los enlaces del hipertexto como votos. Si una página web recibía muchos enlaces era como citarla, por lo que había muchos autores que referenciaban a esa página web como interesante dentro de un campo. Además, PageRank también tenía presente el contenido de la página, si un término aparecía en el título o al principio del texto es que esa página abordaba esa temática de forma relevante.

Sin embargo, PageRank en sus inicios sólo consideraba que el contenido era relevante gracias a los productores de contenido, por ejemplo, los periodistas, los bloggers… Pero no por los usuarios finales de ese contenido, es decir, los internautas que eran los que finalmente los consumían. ¿Cómo afinar los contenidos teniendo presente los intereses de un usuario?

Facebook se enfrentó a su problema desde un principio. A medida que su red social se incrementaba, los usuarios necesitaban de esa priorización. ¿Cómo podía saber Facebook en sus inicios qué contenidos tenía que destacar en la página principal de un usuario? EdgeRank fundamentaba la relevancia no por el contenido en sí mismo, sino por la interacción entre usuarios y tenía presente tres variables:

  • La puntuación de afinidad entre usuarios. Cuantos más usuarios compartiesen dos «amigos» significaba que tenían vínculos sociales más fuertes entre ellos dos. Además, también podía identificarse esa afinidad mediante los mensajes que se enviasen, la visualización de sus respectivos perfiles y otro tipo de interacciones dentro de la red social.
  • Asignación de pesos a las interacciones. El algoritmo tenía presente que un mensaje o un comentario tenía más peso en la puntuación final que un simple like, por ejemplo.
  • Tiempo pasado. A la hora de mostrar contenido, EdgeRank preponderaba contenido más nuevo frente a contenido más viejo.

Si bien Google lo tuvo más complicado en un principio por su propia naturaleza como buscador, tanto la Gran G como Facebook se esforzaron por conocer cuáles es nuestro comportamiento con los contenidos en la Web. Facebook y Google han tratado de capturar nuestros clics, nuestras interacciones, cómo compartíamos y con quién la información y cómo la consumíamos. Todo ello, no sólo para mejorar los resultados que nos muestra si no también para poder vender esa información a terceros para mejorar los impactos publicitarios.

Sin embargo, esa búsqueda por mostrar la información que es relevante para nosotros tiene efectos perniciosos puede que no buscados por las tecnológicas. Por un lado, se provoca un filtro burbuja en la que nos muestra tan sólo la información que es relevante para nosotros como por ejemplo de nuestra tendencia política, pero también afecta a nuestro bienestar puesto que se puede provocar un sesgo respecto a la información positiva o negativa que se nos puede llegar a mostrar.

Comentarios cerrados

La batalla entre las notificaciones y nuestra concentración lectora

No, de momento, no nos hemos hecho ni más vagos ni más tontos debido a la presencia cada vez más ubicua de pantallas en nuestras vidas. Aunque sí que es cierto que estamos cambiando nuestra forma de procesar la información. Una vez que sabemos que tenemos una fuente de información inmensa a nuestro alcance puede que nos apoyemos mucho más en la herramienta para no tratar de retener esos datos en nuestra memoria. Aunque en realidad es algo accesorio, no dejamos de retener información porque Google nos eche una mano de vez en cuando. Sólo debemos recordar que antaño fueron los libros y las enciclopedias los que desempeñaron esa función, pero obviamente no hay nada más rápido que teclear unas teclas y darle al Intro para realizar una búsqueda ante cualquier duda que nos surja. A pesar de todo, nunca dejamos de sumar porque existiesen las calculadoras.

La recepción de mensajes, que ojeemos las redes sociales (con su scroll infinito) y leer trozos de noticias de forma diagonal (tratar de localizar la parte de un texto que sea la que realmente nos interesa) lo que provoca es que nuestra capacidad de procesar la información sea más rápida. No debemos olvidar que hoy leemos más que nunca porque tenemos una acceso ilimitado a fuentes de información textual. Leemos fragmentos de comentarios y noticias de otras personas de forma rápida, fragmentada y apresurada. Se trata de nuevos géneros textuales (entrada, tuits, comentarios…), en nuevos entornos comunicativos (foros, redes sociales…) con sus propias características tratándose de textos en generar breves, poco definidos, interactivos y cooperativos. Es cierto que este tipo de comunicación se acerca más a la oralidad que con la tradición escrita que se da en libros o en los medios de comunicación, pero también lo es que cada vez más se está transformando hacia una comunicación más visual y directa.

Lo que realmente se resiente es nuestra capacidad de centrarnos en una tarea frente a otros estímulos externos. Por ejemplo, la mayoría de las páginas web no se visionan durante más de diez segundos y menos de una de cada diez permanece abierta más de dos minutos, por lo tanto cuando navegamos lo hacemos de forma interactiva saltando de un sitio a otro. Son las interrupciones lo que merma nuestra capacidad de concentrarnos y lo que nos distingue de los animales. Así como ellos por supervivencia tienen que estar cambiando de prioridades por los estímulos que reciben de forma externa y de manera continua por propia supervivencia, los seres humanos tenemos la capacidad de priorizar los estímulos externos que recibimos. Por lo tanto lo que está en peligro con esta falta de concentración debido a los distintos estímulos, es nuestra capacidad de focalizarnos en sólo una cosa, analizar el entorno, reflexionar y posponer una respuesta a los cambios de éste.

La lectura profunda no se aprende, se entrena. Desde luego que podemos recuperar la paciencia para leer textos complejos. Obviamente, no nos comportamos del mismo modo si lo que estamos haciendo es leer un texto on-line que otro off-line. Encontramos muchos más estímulos en el primero y sabemos que podemos cambiar de actividad con sólo mover un dedo lo que interfiere en la actividad en que estamos realizando en ese momento.

A lo que nos enfrentamos es a una fase de transición, donde se produce mucha desorientación sobre dónde se consolidará nuestro comportamiento como especie y los efectos no sólo económicos y sociales que está llevando Internet en cómo nos relacionamos con el entorno.

Comentarios cerrados

Memex, una propuesta de proto-hipertexto

Si lo hubiésemos leído en cualquier relato de algún autor clásico de ciencia-ficción, no hubiese pasado de una anécdota literaria; pero Vannebar Bush se tomó muy en serio la descripción de su máquina Memory – Extender (MEMEX). En la descripción de esta máquina, se aportaba una primera idea de cómo un documento podría ser unido con otro para su recuperación mecánica. La idea fue difundida en un artículo en The Atlantic Monthly en 1945 bajo el título As We May Think, aunque el autor comenzó a trabajar en el texto seis años antes, en 1939. En el documento, Bush se planteaba cómo se estaba gestionando la información en aquella época y cómo se podría hacer más accesible.

Inspirado por Paul Otlet, Bush consideraba que los métodos utilizados para transmitir y revisar los resultados de la investigación no eran los más adecuados. De hecho, consideraba que la cantidad y el volumen de la información que se generaba en aquel momento era tal que no se podía gestionar adecuadamente. Por ello, proponía un dispositivo que permitiese gestionar la información y que evitase en buena medida la sobrecarga de información (infoxicación). Con su Memex, las personas podrían comprimir y almacenar todos sus libros, registros y comunicaciones, además de gestionarlos.

A memex is a device in which an individual stores all his books, records, and communications, and which is mechanized so that it may be consulted with exceeding speed and flexibility. It is an enlarged intimate supplement to his memory.

It consists of a desk, and while it can presumably be operated from a distance, it is primarily the piece of furniture at which he works. On the top are slanting translucent screens, on which material can be projected for convenient reading. There is a keyboard, and sets of buttons and levers. Otherwise it looks like an ordinary desk.

Esquema del MEMEX de Bush

Bush consideraba que su aparato podría extender la memoria de las personas – de ahí su nombre -, podría ser consultado con velocidad y flexibilidad. El soporte elegido por el investigador era el microfilm. De este modo, creía que todos los registros debían ser almacenados en ese soporte, ya se tratase de materiales adquiridos o materiales introducidos por el autor. El Memex permitía al usuario «fotocopiar» aquellos contenidos que desease e integrarlos dentro del sistema.

Tal vez, lo más interesante conceptualmente era que sugería un sistema de clasificación que podría ser considerado como un sistema proto-hipertextual. El aparato facilitaba un tipo de indexacion asociativa a través del que cualquier elemento podría llevar a otro mediante la voluntad del usuario y los senderos (trails) que defina. Según Bush, el usuario tiene que indexar un documento o imagen mediante un código que se registrará en un libro de forma independiente y que facilitará la recuperación de información. El autor no describe en ningún momento un sistema de recuperación automática, ni esquemas de metadatos universales como una clasificación bibliotecaria.

The essential feature of the memex [is] the process of tying two items together… When the user is building a trail, he names it in his code book, and taps it out on his keyboard. Before him are the two items to be joined, projected onto adjacent viewing positions. At the bottom of each there are a number of blank code spaces, and a pointer is set to indicate one of these on each item. The user taps a single key, and the items are permanently joined… Thereafter, at any time, when one of these items is in view, the other can be instantly recalled merely by tapping a button below the corresponding code space.

El concepto del Memex se considera como una de las ideas semilla de lo que vendría a posterior cuando se empezó a diseñar Internet en primera instancia y la Web en segunda, evolucionando esa concepción de trail el hiperenlace y el hipertexto que verían la luz varias décadas después.

Comentarios cerrados

Tu vida pasa en un scroll infinito

Somos unos yonkis de la información y nos hemos convertido en ello sin darnos cuenta. No, en este caso, no me refiero a la infoxicación, si no más bien a nuestra dependencia a las notificaciones de los teléfonos móviles y el cómo consumimos la información en nuestros dispositivos móviles. Todo podría enmarcarse dentro de lo que se ha denominado la economía de la atención que se basaba en que, puesto que mucho del consumo dentro de una plataforma de los usuarios sería prácticamente gratuito, lo único que sería diferencial -desde un punto de vista publicitario y por tanto de ingresos para estas plataformas- es el tiempo que un usuario pasa consumiendo contenidos en esa web/plataforma.

Hay un ejército de expertos cuya función es hacernos caer en esta misma trampa, por lo que tenemos la batalla perdida de antemano. Una de las formas más sencillas de tratar de captar la atención del usuario es mediante la explotación de la vulnerabilidad de la psicología humana. En este ámbito, la dopamina tiene un papel relevante puesto que es una hormona que segrega nuestro cerebro para recompensarnos. Segregamos dopamina en cuanto recibimos un like o un comentario que recibimos en cualquier red social, puesto que esta hormona es una de las encargadas en recompensarnos cuando estamos satisfechos.

Aza Raskin fue el inventor del scroll infinito, una característica muy práctica dentro de las redes sociales a distintos niveles y que han sabido explotar sobremanera. El scroll infinito permite cargar contenidos de manera secuencial una vez has acabados los previos sin una acción necesaria por parte del usuario. Sin embargo, su aplicación tuvo un efecto nocivo y tal como él mismo declara al cerebro de los usuarios no les da tiempo a ponerse al día con sus impulsos así que sólo puedes seguir haciendo scroll. Obviamente, esto hace que el usuario se encuentre constantemente consumiendo contenidos en un bucle infinito y mientras trata de centrarse en lo que está haciendo, se queda atrapado en las redes sociales.

Por si fuese poco, estas plataformas están diseñadas para que volvamos una y otra vez a las mismas para ver qué ha estado sucediendo dentro de ellas. A esto se le denomina FOMO (miedo a perderse algo, del inglés, fear of missing out) y entran en juego las notificaciones que deliberadamente permitimos que nos alcancen hora tras hora. Sencillamente, somos seres sociales y nos gusta estar conectados de forma permanente con las personas que nos rodean. Para bien o para mal.

Al final, se ha hecho tan bien el trabajo de tenernos enganchados que los propios desarrolladores de sistemas operativos para teléfonos móviles se han preocupado por nuestro bienestar digital. De esta manera, podremos saber para nuestro sonrojo o sorpresa, cuánto tiempo al día destinamos a nuestros terminales y si así lo deseamos apartar nuestra vista de nuestro terminal… Hasta la próxima notificación, claro.

2 comentarios