La detección de nombres propios en español su aplicación en recuperación de información
DOI:
https://doi.org/10.54886/ibersid.v1i.3272Resumo
En este trabajo se describe un método automático para detectar y extraer nombres propios de una extensa colección de documentos en español, con el objetivo de determinar si tal proceso puede aplicarse para mejorar los resultados de recuperación de información, y bajo qué condiciones. La incorporación de mayor información en el proceso de indización, como es en este caso, permite obtener mejores representaciones de los documentos, y por tanto, ello debiera proporcionar mejores resultados en la recuperación. Esto que parece evidente, no parece estar tan claro cuando se analizan los resultados experimentales, al menos en tareas clásicas de recuperación de información. Hemos realizado gran cantidad de experimentos considerando nombres propios simples y compuestos, con diferente valor de ponderación de los nombres propios respecto del resto de palabras indizadas, incluso considerando en la indización los nombres propios compuestos y los simples que los forman, y otras combinaciones. En todos los experimentos hemos comprobado que la detección de nombres propios no mejora los resultados de recuperación, a pesar de que la indización sí se mejora. Los resultados son peores cuando se detectan nombres propios compuestos, debido fundamentalmente a que se introducen variaciones en los nombres de las mismas entidades, si bien, el efecto se reduce al considerar también como términos índice los simples que los forman.Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2007 Los autores y autoras conservan sus derechos de autor, aunque ceden a la revista de forma no exclusiva los derechos de explotación (reproducción, distribución, comunicación pública y transformación) y garantizan a esta el derecho de primera publicación de su trabajo, el cual estará simultáneamente sujeto a la licencia CC BY-NC-ND. Los autores aceptan la responsabilidad legal de cumplir plenamente con los códigos éticos y leyes apropiadas, y de obtener todos los permisos de derecho de autor debidos. Se permite y se anima a los autores y autoras a difundir electrónicamente la versión editorial (versión publicada por la editorial) en la página web personal del autor y en el repositorio de la institución a la que pertenece.
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
© 2007- . Los autores y autoras conservan sus derechos de autor, aunque ceden a la revista de forma no exclusiva los derechos de explotación (reproducción, distribución, comunicación pública y transformación) y garantizan a esta el derecho de primera publicación de su trabajo, el cual estará simultáneamente sujeto a la licencia CC BY-NC-ND. Los autores aceptan la responsabilidad legal de cumplir plenamente con los códigos éticos y leyes apropiadas, y de obtener todos los permisos de derecho de autor debidos. Se permite y se anima a los autores y autoras a difundir electrónicamente la versión editorial (versión publicada por la editorial) en la página web personal del autor y en el repositorio de la institución a la que pertenece.