Mejoras en la recuperación de información en la Web mediante el tratamiento de la información de los enlaces.

José Luis Alonso Berrocal, Carlos García Figuerola Paniagua, Ángel Francisco Zazo Rodríguez

Resumen


El objetivo principal de este trabajo es intentar comprobar la posible mejora en la recuperación de información en la Web mediante técnicas de posicionamiento o ranking. La metodología consistirá en recoger la información del web mediante un robot, en concreto uno elaborado por nosotros y llamado SACARINO (Sonda AutomátiCA para la Recuperación de Información en el web), que nos permita disponer de toda la información de los enlaces existentes en el espacio web analizado. Una vez finalizada la recogida de datos procederemos a generar las matrices de datos que nos permitirán aplicar las diferentes técnicas de ranking disponibles. En concreto pretendemos centrarnos en el PageRank, y lo calcularemos aplicando algunos de los algoritmos disponibles para ello. Una vez obtenidos estos datos intentaremos matizar este PageRank calculado por nosotros con el asignado por Google mediante un programa que hemos efectuado a tal efecto. Lo que pretendemos analizar es si este nuevo posicionamiento obtenido mejora el posicionamiento inicial calculado. Este matiz puede resultar de interés en función del diferente valor del PageRank calculado por nosotros (en función del espacio web recogido) y el que puede asignar Google con un espacio web mucho mayor y con una intervención de enlaces mucho más amplia.

Texto completo:

PDF