Representación de páginas web a través de sus enlaces y su aplicación a la recuperación de información

José Luis Alonso Berrocal, Carlos García Figuerola Paniagua, Ángel Francisco Zazo Rodríguez

Resumen


Los sistemas más habituales de Recuperación de la Información se basan en conseguir una representación homogénea y procesable de documentos y consultas, y en el cálculo subsiguiente de alguna función que exprese el grado de similaridad entre una consulta dada y cada uno de los documentos de una colección. Por regla general, tales representaciones toman como base las palabras o términos que aparecen en los documentos. Las páginas web, sin embargo, contienen hiperenlaces, lo que sugiere la posibilidad de representar dichas páginas en función de tales hiperenlaces, en lugar de términos. Se describe un experimento exploratorio efectuado para estimar la viabilidad de esta hipótesis. Los resultados de dicho experimento sugieren que los hiperenlaces pueden ser aplicados ventajosamente en la representación de las páginas web, pero también que es preciso definir y aplicar mecanismos correctores. (Autor)

Texto completo:

PDF