Una de las razones del éxito de Internet es la utilización de hypertextos, o lo que hoy conocemos como enlaces. Los enlaces, además de facilitar la navegación al lector, permiten conectar unas páginas web con otras. Esta es la razón por la que los anglosajones conocen Internet como "the Web", que es una interconexión de elementos, como por ejemplo una tela de araña. Siguiendo con el símil, los buscadores de páginas web como Google utilizan un programa para recorrer todos los elementos de la red (las páginas) que se conoce como "Spider" (araña).
Sin embargo, con la gran cantidad de páginas que existen, resulta imposible incluir en una página enlaces a todas las páginas de Internet con las que guarda relación. Es necesario, pues, un sistema automático capaz de determinar esas relaciones. Además, esas relaciones deberían calcularse en función del lector, por ejemplo de su lengua, cultura, sus gustos, hábitos de lectura, etc. Así nos dirigimos hacia un modelo en el que cada usuario tiene su propia visión del tejido compuesto por las diferentes páginas con el objetivo de minimizar el tiempo necesario para entrontrar la información que busca.
Desde hace ya un par de años, podemos observar una tendencia a la personalización de los contenidos ofrecidos por las diferentes páginas. Los métodos más usados son la personalización basada en la popularidad y la personalización basada en los hábitos y gustos del usuario.
La personalización basada en la popularidad
Este es el modelo más simple y consiste en mostrar al usuario los contenidos que han tenido una mejor acogida por parte de la comunidad. Es el modelo utilizado por servicios como Menéame o Techmeme. El primero de ellos utiliza un algoritmo que se utiliza entre otros parámetros el número de votos y la fecha de publicación del contenido. El segundo utiliza un método completamente automático que se basa en el análisis del número de enlaces entrantes a una noticia así como su fecha de publicación. Es decir, la popularidad la da el número de veces que la noticia es citada en otros medios.
Existen evoluciones posibles de este modelo que utilizan el concepto de "amigo" en el cálculo de la popularidad. Un usuario del servicio establece enlaces con otros usuarios del mismo servicio que pasan a formar parte de su "círculo de amigos". Al presentarle los contenidos a un usuario, en el cómputo de los votos se da más importancia a los votos realizado por "amigos" de este usuario.
La personalización basada en los hábitos y gustos del usuario
Este modelo es mucho más complejo. Existen hoy en día varias alternativas para su aplicación.
Una alternativa es el análisis de patrones de comportamiento. Se traza el comportamiento (la navegación realizada por el usuario a través de los contenidos) de todos los usuarios del sistema y se extraen patrones de comportamiento que permite agrupar usuarios afines. De esta manera, se puede recomendar a un usuario contenidos que han sido bien valorados por usuarios afines. Un ejemplo sencillo: supongamos que tenemos 1000 usuarios de nuestro sistema. El usuario X ha visitado las páginas p1, p2, p5, p10 y p25. Supongamos también que identificamos en nuestras trazas 50 usuarios que han visitado cuatro de las páginas visitadas por el usuario X y además han visitado la página p14. En este modelo, es bastante probable que el usuario X esté interesado por la página p14. Tened en cuenta que no se analizan para nada los contenidos, tan sólo los patrones de navegación. Este método es utilizado por Aggregate Knowledge entre otros.
Otra alternativa es el análisis semántico de los contenidos para proponer contenidos similares. En este caso no se utilizan los patrones de navegación, tan sólo el hecho de que si estamos leyendo una noticia sobre el resultado de las elecciones municipales en Barcelona, es probable que también nos interesen otras noticias de actualidad sobre las elecciones municipales y/o Barcelona. Así extrayendo los conceptos que describen los diferentes artículos leídos por el usuario, se podría construir un perfil de sus intereses y proponerle las nuevas noticias que vayan apareciendo ordenadas según sus preferencias.
En rollSense utilizamos la extracción de conceptos para mostrar artículos similares al que el usuario lee en un momento determinado, lo que permite mostrar noticias relacionadas. rollSense incluye además un nivel suplementario de personalización ya que permite escoger las fuentes de las que provienen las noticias. Podríamos extender rollSense para trazar todos los artículos que son accedidos por un usuario y utilizar los conceptos extraídos para crear un perfil con sus intereseses.
Un método quizá más efectivo sería el resultado de combinar las dos alternativas descritas anteriormente. De esta manera se podría recomendar contenido bien valorado por otros usuarios con un perfil de navegación similar pero guardando relación con los intereses del usuario o con el artículo que está leyendo en un momento dado.
Sin embargo, todos estos modelos se basan en un factor muy a tener en cuenta: la conservación de la información sobre los hábitos de navegación y los gustos de los usuarios de Internet. La conservación de esta información atenta contra la privacidad de las personas. De igual manera que la ley prohibe hacer fotos de la vida privada de una persona, también debería estar prohibido guardar información sobre los hábitos de navegación de las personas, lo cual también forma parte de su vida privada. Aún está por ver como se solucionará este problema. Este artículo ejemplifica muy bien las dudas que la privacidad en Internet genera.