Ir al contenido

Documat


Modelo semántico de expansión de consultas para la búsqueda web (MSEC)

  • Autores: Miguel Ángel Niño Zambrano, Ivan Dario Lopez, Carlos Adrian Andrade, Carlos Alberto Cobos Lozada, Ramón Fabregat Gesa Árbol académico
  • Localización: Revista UIS Ingenierías, ISSN-e 2145-8456, ISSN 1657-4583, Vol. 11, Nº. 1, 2012 (Ejemplar dedicado a: Revista UIS Ingenierías), págs. 11-20
  • Idioma: español
  • Títulos paralelos:
    • Semantic expansion of queries for web search (MSEC)
  • Enlaces
  • Resumen
    • español

       Internet se ha convertido en el mayor repositorio de conocimiento humano y la cantidad de información almacenada crece cada día más. Esto último repercute en el bajo nivel de precisión que reportan los sistemas de búsqueda Web respecto a los documentos que son recuperados para el usuario. Para enfrentar este problema, una de las estrategias utilizadas  es  la  recuperación  personalizada  de  recursos. Actualmente  existen  varios  proyectos  que  proponen  métodos semánticos para aumentar la relevancia de las búsquedas, a través del uso de ontologías, procesamiento de lenguaje natural, sistemas basados en conocimiento, lenguajes de especificación de consultas y perfil de usuario, entre otras. Los resultados generalmente son mejores que los obtenidos por  buscadores que no usan éstas técnicas.  Sin embargo, el costo que se paga por estas mejoras en precisión se centra en el uso de algoritmos más complejos en implementación y que consumen más recursos computacionales.  Este artículo describe un modelo semántico de expansión de consultas denominado MSEC, el cual está basado principalmente en el concepto de similitud semántica a partir de Ontologías de dominio y en el uso del perfil de usuario para personalizar las búsquedas y así mejorar la precisión de las mismas. Para evaluar el modelo propuesto se creó un prototipo software. Los resultados experimentales preliminares muestran una mejora respecto al enfoque tradicional de búsqueda. Finalmente se comparó con el mejor buscador semántico del estado del arte, llamado GoPubMed para la colección MEDLINE.

    • English

      Internet has become the largest repository of human knowledge, and the amount of stored information increases day by day. This increase of information affects the levels of precision reported by Web search engines regarding  documents retrieved for the user. One strategy being used to address this problem is a focus on a personalized resource recovery. Several projects currently offer semantic methods for improving the relevance of search results  through the use of ontologies, natural language processing, knowledge based systems, query specification languages, and user profile, among others. Results are generally better than for web search engines that do not use these  techniques. However, the high cost of these improvements in precision relate to use of more complex algorithms in carrying out the search and which are more wasteful of computational resources. This article describes a semantic  query expansion model called MSEC, which is based mostly on the concept of semantic similarity, starting from domain ontologies and on the use of user profile in order to customize user searches so to improve their precision. In order to evaluate the proposed model, a software prototype was created. Preliminary experimental results show an improvement compared to the traditional web search approach. Finally the model was compared against the best  state of the art semantic search engine, called GoPubMed, for the MEDLINE collection.

  • Referencias bibliográficas
    • Citas R. Dhanapal, “An intelligent information retrieval agent,” Knowledge-Based Systems, vol. 21, No. 6, August 2008, pp. 466-470.
    • C. Deco, C. Bender, J. Saer, and M. Chiari, “Expansión de consultas utilizando recursos lingüísticos para mejorar la recuperación de información...
    • R. Baeza-Yates and B. Ribeiro-Neto, Modern information retrieval, 2nd Edition, ACM Press Books, USA., 1999, p. 453.
    • L. Schamberg, B. Einseberg, and S. Nilo, “A re-examination of relevance: toward a dynamic, situational definition,” Information Procesing...
    • K. Kim, J. Hong, and S. Cho, “A semantic Bayesian network approach to retrieving information with intelligent conversational agents,” Information...
    • G. Salton, Introduction to modern information retrieval, McGraw-Hill, New York, 1983, p. 448.
    • Y. Marcano and R. Talavera, “Gestión de la información a través de la Web Semántica: Iniciativas y dificultades,” Revista Venezolana de Gerencia...
    • P. Mitra, N. Noy, and A. Jaiswal, “Ontology Mapping Discovery with Uncertainty,” Fourth International Conference on the Semantic Web, Galway...
    • D. Avello, Web Cooperativa (Trabajo de Investigación), Universidad de Oviedo, 2002, p. 67.
    • J. X. Xu and W. B. Croft, “Query expansion using local and global document analysis”, Proceedings of the 19th Annual International SIGIR Conference...
    • R. Attar and A. S. Fraenkel, “Local feedback in full-text retrieval systems”, Journal of the ACM, vol. 24, No. 3, 1977, pp. 397 – 417.
    • J. X. Xu and W. B. Croft, “Improving the effectiveness of information retrieval with local context analysis,” ACM Transactions on Information...
    • G. Solskinnsbakk and J. Gulla, “Combining ontological profiles with context in information retrieval,” Data & Knowledge Engieering, vol....
    • H. Wang, J. Qin and H. Shao, “Expansion Model of Semantic Query Based on Ontology,” 2009 Second Pacific-Asia Conference on Web Mining and...
    • J. Mustafa, S. Han, and K. Latif, “Ontology based semantic information retrieval,” 4th International IEEE Conference, Varna 6th – 7th September...
    • M. Baziz, M. Boughanem, and N. AussenacGilles, “Evaluating a Conceptual Indexing Method by Utilizing WordNet,” Lecture Notes in Computer Science,...
    • S. Liu, F. Liu, C. Yu, and W. Meng, “An Effective Approach to Document Retrieval via Utilizing WordNet and Recognizing Phrases,” Proceedings...
    • V. Cordi, P. Lombardi, M. Martelli and V. Mascardi, “An Ontology-Based Similarity between Sets of Concepts,” 2005, p. 6.
    • T. Slimani, B. B. Yaghlane, and K. Mellouli, “A New Similarity Measure based on Edge Counting,” Proceedings of world academy of science, engineering...
    • P. Chen and F. Kuo, “An information retrieval system based on a user profile,” Journal of Systems and Software, vol. 54, No. 1, 2000, pp....
    • National Cancer Institute. U.S. National Institutes of Health. Available: http://www.cancer.gov [citado 26 de Abril de 2011].
    • MEDLARS. MEDical Literature Analysis and Retrieval System. Available: http://www.uninet. edu/do/MEDLARS.html [citado 26 de Abril de 2011].
    • J. J. Yepes, Ontology Refinement for Improved Information Retrieval in the Biomedical Domain [PhD Thesis]. Universitat Jaume, Castellón, 2009.
    • B. Croft, D. Metzler, T. Strohman, Search Engines: Information Retrieval in Practice, first edition, Addison-Wesley, USA, 2009, p. 552.
    • C. D. Manning, P. Raghavan, H. Schütze, An Introduction to Information Retrieval, first edition, Cambrige University Press, Cambridge, 2008,...
    • GoPubMed. GoPubMed, searching is now sorted!. Available: http://www.gopubmed.com/ [citado 23 de Junio de 2011].
    • MEDLINE. MEDLINE/PubMed Resources Guide. Available: http://www.nlm.nih.gov/bsd/ pmresources.html [citado 27 de Junio de 2011].
    • Gene_Ontology. The Gene Ontology. Available: http://www.geneontology.org/ [citado 27 de Junio de 2011].
    • BiKE-Laboratory. MeSH Ontology in OWL format. Available: http://bike.snu. ac.kr/?q=node/207 [citado 30 de Noviembre de 2010].
    • M. Suárez, K. Salinas, “An Approach to Semantic Indexing and Information Retrieval,” Revista Facultad de Ingeniería Universidad de Antioquia,...
    • P. Jackson, F. Schilder, “Natural Language Processing: Overview,” Encyclopedia of Language & Linguistics, Elsevier, 2006, pp. 503 – 518.
    • C. Cobos, E. Estevez, M. Mendoza, L. Gomez and E. León, “Algoritmos de Expansión de Consulta basados en una Nueva Función Discreta de Relevancia,”...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno