Digital repositories in Spain and metadata quality

Authors

  • J. Federico Medrano Universidad de Salamanca. Departamento de Informática y Automática
  • Carlos G. Figuerola Universidad de Salamanca, Instituto de Estudios de la Ciencia y Tecnología (ECyT)
  • José Luis Alonso Berrocal Universidad de Salamanca, Instituto de Estudios de la Ciencia y Tecnología (ECyT)

DOI:

https://doi.org/10.54886/scire.v18i2.3977

Keywords:

Digital repositories, OAI, PMH, Metadata, Harvesting, Quality

Abstract

Digital repositories have experimented a significant development in recent years, from the raising of the Open Archives Initiative (OAI) to the emergence of tools as the Open Archives Initiative Protocol for Metada Harvesting (OAI-PMH). In this paper we analyze metadata from the 69 Spanish repositories available through such protocol. Also, a qualitative and quantitative analysis is performed on the data contained in those repositories. Specifically, we analyze factors that directly affect the quality of the data, identifying the most common problems. The eight most used Dublic Core fields were title, identifier, date, language, format, description, type and subject. Creator was filled only in 56% and subject is frequently missed, and also vocabulary control in general, a key aspect to offer good search results. Biggest repositories usually offer worse quality.

Downloads

Download data is not yet available.

Author Biographies

Carlos G. Figuerola, Universidad de Salamanca, Instituto de Estudios de la Ciencia y Tecnología (ECyT)

Es profesor del Grado en Documentación y del Master en Sistemas de Información Digital de la Universidad de Salamanca. Su docencia se centra en las técnicas informáticas base de las Ciencias de la Información y Documentación. Además es miembro del grupo de investigación E-lectra, grupo reconocido de la Universidad de Salamanca, cuyos temas de interés son la recuperación de información y la cibermetría: implementación de conocimiento lingüístico en sistemas de recuperación, procesamiento de lenguaje natural, recuperación de información multilingüe, clasificación automática, recuperación robusta, recuperación interactiva, recuperación de información en el web, cibermetría, etc.

José Luis Alonso Berrocal, Universidad de Salamanca, Instituto de Estudios de la Ciencia y Tecnología (ECyT)

Es profesor del Grado en Documentación y del Master en Sistemas de Información Digital de la Universidad de Salamanca. Su docencia se centra en las técnicas informáticas base de las Ciencias de la Información y Documentación. Además es miembro del grupo de investigación E-lectra, grupo reconocido de la Universidad de Salamanca, cuyos temas de interés son la recuperación de información y la cibermetría: implementación de conocimiento lingüístico en sistemas de recuperación, procesamiento de lenguaje natural, recuperación de información multilingüe, clasificación automática, recuperación robusta, recuperación interactiva, recuperación de información en el web, cibermetría, etc.

Published

2012-08-21

How to Cite

Medrano, J. F., G. Figuerola, C., & Alonso Berrocal, J. L. (2012). Digital repositories in Spain and metadata quality. Scire: Knowledge Representation and Organization (ISSNe 2340-7042; ISSN 1135-3716), 18(2), 109–121. https://doi.org/10.54886/scire.v18i2.3977

Issue

Section

Articles

Most read articles by the same author(s)

1 2 > >>