Tomado de: http://www.doaj.org
"Existen diversas fuentes de información en la web. Una de ellas es la
información que deja el usuario mientras usa un buscador. Es posible
utilizar esta información para complementar el resultado de algoritmos
de jerarquización tradicionales, de manera de agregar conocimiento
humano al resultado. Dentro de este concepto, en el presente trabajo se
muestra una visión global del análisis del registro de los accesos al
buscador TodoCL, mostrando de forma general qué es lo que buscan los
usuarios en la web chilena. Luego se expone una aplicación práctica de
los datos, al ver los resultados de la implementación de un algoritmo
que determina relevancia y jerarquía de documentos basándose en las
búsquedas y documentos seleccionados por los usuarios."1
"Los usuarios, al acceder al sitio, dejan su huella en los registros o
bitácoras de acceso. A partir de ellos es posible reconstruir el camino
seguido por cada usuario. La reconstrucción no es tan
directa como aparenta, ya que el caché del navegador hace que
ciertos pasos del usuario sean omitidos de las bitácoras. Por ejemplo,
es posible que el usuario haya escrito la URL directamente
en el navegador (no siguiendo un enlace) y que el caché del navegador cargue la página sin pedirla al servidor. En general, se consideró que el caso en que el usuario ingresa la URL
directamente es menor, por lo que la mayoría de los pasos de navegación siguen la estructura del sitio.

Figura 1. Mapa de navegación del sitio del buscador TodoCL
Una forma de representar la navegación es planteándola como un grafo, que es conocido como el mapa de navegación del sitio. La forma en que los usuarios navegan por éste, es una fuente de
datos que nos enseña el uso que éstos dan al buscador. Para el caso del buscador TodoCL, el mapa de navegación del sitio se muestra en la figura 1, indicando los estados posibles.
El análisis de los registros de accesos genera el diagrama de la figura
2. Las transiciones entre estados (nodos) representan la porción de
usuarios que al salir del nodo de origen fueron hacia el
nodo de destino. Este número es una estimación de la probabilidad de
que, dado que un usuario está en el origen del arco, vaya hacia el
destino de éste. Dentro de cada estado está la probabilidad de
que un usuario esté en esa página.
Hay tres observaciones que se pueden obtener de la figura 2:
- Los usuarios no usan las opciones avanzadas (menos del 1%).
- Es común el refinamiento de la consulta.
- Sólo el 9% de las personas usa el directorio de sitios.

Figura 2. Navegación de los usuarios por TodoCL
Lo anterior indica que los usuarios, como método de búsqueda, utilizan
la información del despliegue de los resultados. Es decir, un método más
cercano a prueba y error que a una búsqueda más
precisa, que sería el caso de la opción de búsqueda avanzada. Además, al
observar el gráfico vemos que la probabilidad de que un usuario se
encuentre en la página con resultados es mucho mayor que la
probabilidad de que un usuario se encuentre en la URL seleccionada. Esto
indica que los usuarios visitan relativamente pocas de las páginas del
resultado como se mencionó anteriormente."1
Tomado de: http://www.ub.edu/bid/10baeza.htm
0 comentarios:
Publicar un comentario