Wiki3DRank

un modelo para medir la relevancia de objetos de conocimiento mediante datos cuantitativos de Wikidata y Wikipedia

Autores/as

Palabras clave:

Wiki3DRank, Rankings, Wikidata, Wikipedia, Conocimiento enciclopédico, Análisis de dominios, Objetos culturales

Resumen

Se presenta el modelo Wiki3DRank, que combina datos cuantitativos extraídos en tiempo real de Wikidata y Wikipedia para obtener un ranking de objetos de conocimiento a través de un valor cuantitativo que mida la relevancia de un objeto frente a otros en un determinado dominio. El modelo se basa en la distribución de los objetos de conocimiento en un espacio vectorial cuyas componentes se basan en tres variables principales: número de declaraciones en Wikidata sobre un ítem, número de artículos en las diferentes ediciones de Wikipedia y extensión en número de palabras de dichos artículos. Estas variables se asocian al nivel de descripción de los ítems de Wikidata, la difusión de los objetos de conocimiento asociados a los mismos en las ediciones de Wikipedia de diferentes idiomas y el grado de elaboración editorial de los correspondientes artículos de Wikipedia. Para demostrar la viabilidad del modelo se analizan una serie de casos de uso sobre diversos dominios: libros, películas, catedrales, terremotos, ríos y elementos químicos. A partir de los resultados obtenidos es posible concluir que Wiki3DRank es una herramienta que permite medir la relevancia de objetos de conocimientos en el contexto de un dominio de conocimiento. Se muestra el funcionamiento de una herramienta de código abierto que permite el cálculo en línea de Wiki3DRank. Los resultados obtenidos sugieren que el modelo propuesto puede aplicarse para diferentes contextos y dominios, que pueden introducirse elementos de ponderación y es posible extender el modelo mediante la introducción de nuevos componentes basados en otras características de los datos enciclopédicos de los objetos de conocimiento, al mismo tiempo que se mantiene el sistema de cálculo vectorial de base.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Ahnert, Ruth; Ahnert, Sebastian; Coleman, Catherine; Weingart, Scott (2020). The Network Turn: Changing Perspectives in the Humanities. Cambridge: Cambridge University Press. https://doi.org/10.1017/9781108866804

Anderson, Chris (2014). The Longer Tail Why the Future of Business is Selling Less of More. New York: Hachette Books.

Beytía, Pablo; Schobin, Janosch (2020) Networked Pantheon: a Relational Database of Globally Famous People. // Research Data Journal for the Humanities and Social Sciences. 5, 50-65. https://doi.org/10.1163/24523666-00501002

Bianchini, Carlo; y Sardo, Lucia (2022). Wikidata : a new perspective towards universal bibliographic control. // JLIS. 13:1, 291-311. https://doi.org/10.4403/jlis.it-12725

Blank, Grant (2007). Critics, Ratings, and Society. Lanham: Rowman and Littlefield.

Blasco-Blasco, Olga; Rodríguez-Castro, Marta; Túñez-López, Miguel (2020). Composite indicators as an innovative methodology for Communication Sciences: implementation for the assessment of European public service media”. // Profesional de la información. 29, n. 4, e290437, 2020. https://doi.org/10.3145/epi.2020.jul.37

Borgman, Christine L. (2017). Big data, little data, no data. Cambridge, Massachusetts: The MIT Press. https://doi.org/10.7551/mitpress/9963.001.0001

Brown, Andrew (2011). A brief history of encyclopaedias: from Pliny to Wikipedia. Londres: Hesperus.

Halpern, Orit; Mitchell, Robert (2022) The smartness mandate. Cambridge, Massachusetts: The MIT Press. https://doi.org/10.7551/mitpress/14623.001.0001

Hill, Benjamin Mako; Shaw, Aaron (2020). The Most Important Laboratory for Social Scientific and Computing Research in History. // Reagle, Joseph; Koerner, Jackie (eds.). Wikipedia @ 20: Stories of an Incomplete Revolution. Cambridge, Massachusetts: The MIT Press. https://doi.org/10.7551/mitpress/12366.001.0001

Lewoniewski, Włodzimierz; Węcel, Krzysztof; Abramowicz, Witold (2019). Multilingual Ranking of Wikipedia Articles with Quality and Popularity Assessment in Different Topics. // Computers. 8:3, 60. https://doi.org/10.3390/computers8030060

McDowell, Zachary J.; Vetter, Matthew A (2022). Wikipedia and the Representation of Reality. New York: Routledge. https://doi.org/10.4324/9781003094081

Minguillón, Julia; Lerga, Maura; Aibar, Eduard; Lladós-Masllorens, Josep; y Meseguer-Artola, Antoni (2017). Semi-automatic generation of a corpus of Wikipedia articles on science and technology. // El Profesional de la Información. 26:5, 995-1004. https://doi.org/10.3145/epi.2017.sep.20

Miquel-Ribé, Marc (2019). The Sum of Human Knowledge? Not in One Wikipedia Language Edition. Wikipedia@20. https://wikipedia20.mitpress.mit.edu/pub/26ke5md7/release/15

Moás, Pedro Miguel; Teixeira Lopes, Carla (2023). Automatic Quality Assessment of Wikipedia Articles: A Systematic Literature Review. // ACM Computing Surveys. 56:4, article 95. https://doi.org/10.1145/3625286

Nielsen, Finn Årup (2012). Wikipedia Research and Tools: Review and Comments. http://doi.org/10.2139/ssrn.2129874

Piscopo, Alessandro; y Simperl, Elena (2018). Who Models the World?: Collaborative Ontology Creation and User Roles in Wikidata. // Proceedings of the ACM on Human-Computer Interaction. 2:CSCW, Article 141. https://doi.org/10.1145/3274410

Reznik, Ilia; Shatalov, Vladimir (2016). Hidden revolution of human priorities: An analysis of biographical data from Wikipedia. // Journal of Informetrics. 10:1, 124-131. https://doi.org/10.1016/j.joi.2015.12.002

Shenoy, Kartik; Ilievski, Filip; Garijo, Daniel; Schwabe, Daniel; Szekely, Pedro (2022). A study of the quality of Wikidata. Journal of Web Semantics. 72, 100679. https://doi.org/10.1016/j.websem.2021.100679

Skiena, Steven; Ward, Charles B. (2014). Who’s bigger? Where historical figures really rank. Cambridge: Cambridge University Press.

Torres-Salinas, Daniel; Robinson-García, Nicolás; Jiménez-Contreras, Evaristo (2023). The bibliometric journey towards technological and social change: A review of current challenges and issues. // Profesional de la información. 32:2, e320228. https://doi.org/10.3145/epi.2023.mar.28

Publicado

2024-06-14

Cómo citar

Pastor Sánchez, J.-A., Saorín, T., & Baños-Moreno, M.-J. (2024). Wiki3DRank: un modelo para medir la relevancia de objetos de conocimiento mediante datos cuantitativos de Wikidata y Wikipedia. Ibersid: Revista De Sistemas De información Y documentación, 18(1), 55–70. Recuperado a partir de https://ibersid.eu/ojs/index.php/ibersid/article/view/4967

Número

Sección

Artículos