meta content='all' name='robots'/> meta content='all' name='robots'/> User-agent: * Allow: /
RSS

Análisis de consultas a un buscador y su aplicación a la jerarquización de páginas web

Tomado de: http://www.doaj.org

"Existen diversas fuentes de información en la web. Una de ellas es la información que deja el usuario mientras usa un buscador. Es posible utilizar esta información para complementar el resultado de algoritmos de jerarquización tradicionales, de manera de agregar conocimiento humano al resultado. Dentro de este concepto, en el presente trabajo se muestra una visión global del análisis del registro de los accesos al buscador TodoCL, mostrando de forma general qué es lo que buscan los usuarios en la web chilena. Luego se expone una aplicación práctica de los datos, al ver los resultados de la implementación de un algoritmo que determina relevancia y jerarquía de documentos basándose en las búsquedas y documentos seleccionados por los usuarios."1


"Los usuarios, al acceder al sitio, dejan su huella en los registros o bitácoras de acceso. A partir de ellos es posible reconstruir el camino seguido por cada usuario. La reconstrucción no es tan directa como aparenta, ya que el caché del navegador hace que ciertos pasos del usuario sean omitidos de las bitácoras. Por ejemplo, es posible que el usuario haya escrito la URL directamente en el navegador (no siguiendo un enlace) y que el caché del navegador cargue la página sin pedirla al servidor. En general, se consideró que el caso en que el usuario ingresa la URL directamente es menor, por lo que la mayoría de los pasos de navegación siguen la estructura del sitio.

Figura 1. Mapa de navegación del sitio del buscador TodoCL


 
Una forma de representar la navegación es planteándola como un grafo, que es conocido como el mapa de navegación del sitio. La forma en que los usuarios navegan por éste, es una fuente de datos que nos enseña el uso que éstos dan al buscador. Para el caso del buscador TodoCL, el mapa de navegación del sitio se muestra en la figura 1, indicando los estados posibles.
El análisis de los registros de accesos genera el diagrama de la figura 2. Las transiciones entre estados (nodos) representan la porción de usuarios que al salir del nodo de origen fueron hacia el nodo de destino. Este número es una estimación de la probabilidad de que, dado que un usuario está en el origen del arco, vaya hacia el destino de éste. Dentro de cada estado está la probabilidad de que un usuario esté en esa página.
Hay tres observaciones que se pueden obtener de la figura 2:
  • Los usuarios no usan las opciones avanzadas (menos del 1%).
  • Es común el refinamiento de la consulta.
  • Sólo el 9% de las personas usa el directorio de sitios. 
.

Figura 2. Navegación de los usuarios por TodoCL

Lo anterior indica que los usuarios, como método de búsqueda, utilizan la información del despliegue de los resultados. Es decir, un método más cercano a prueba y error que a una búsqueda más precisa, que sería el caso de la opción de búsqueda avanzada. Además, al observar el gráfico vemos que la probabilidad de que un usuario se encuentre en la página con resultados es mucho mayor que la probabilidad de que un usuario se encuentre en la URL seleccionada. Esto indica que los usuarios visitan relativamente pocas de las páginas del resultado como se mencionó anteriormente."1

Tomado de: http://www.ub.edu/bid/10baeza.htm

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

0 comentarios:

Publicar un comentario

Vistas de página en total