Ir al contenido

Documat


Augmenting Web Page Classifiers with Social Annotations

  • Autores: Arkaitz Zubiaga Árbol académico, Raquel Martínez Unanue Árbol académico, Víctor Fresno Fernández Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 47, 2011, págs. 189-196
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      La falta de contenido textual representativo en muchas páginas web sugiere el estudio de metadatos adicionales para mejorar tareas de clasificación de páginas web. Los sitios de marcadores sociales proveen un medio accesible para aumentar en gran medida los metadatos disponibles con anotaciones dadas por usuarios. Aún no se ha explorado a fondo en este campo. En este trabajo, analizamos la utilidad de las anotaciones sociales para clasificación de páginas web. Evaluamos los resultados sobre dos niveles de categorización, así como su utilidad para páginas de entrada y profundas. Concluimos que las anotaciones sociales pueden mejorar los clasificadores de páginas web en múltiples casos, y presentamos un método para sacar el máximo partido mediante la combinación de clasificadores.

    • English

      The lack of representative textual content in many web documents suggests the study of additional metadata to improve web page classification tasks. Social bookmarking sites provide an accessible way to increase available metadata in large amounts with user-provided annotations. This field remains relatively unexplored. In this work, we analyze the usefulness of social annotations for web page classification. We evaluate the results on two different categorization levels, and analyze their suitability for home and deeper pages. We conclude that social annotations could enhance web page classifiers in multiple cases, and we present a method to get the most out of them using classifier committees.

  • Referencias bibliográficas
    • Aliakbary, Sadegh, Hassan Abolhassani, Hossein Rahmani, and Behrooz Nobakht. 2009. Web page classification using social tags. IEEE Intl. Conf....
    • Fisher, Michelle and Richard Everson. 2003. When are links useful? experiments in text classification. In Fabrizio Sebastiani, editor, Advances...
    • Golder, Scott and Bernardo A. Huberman. 2006. The structure of collaborative tagging systems. Journal of Information Science, 32(2), pages...
    • Heymann, Paul, Georgia Koutrika, and Hector Garcia-Molina. 2008. Can social bookmarking improve web search? In WSDM ’08, pages 195–206, New...
    • Noll, Michael G. and Christoph Meinel. 2008a. Exploring social annotations for web document classification. In Proc. of the 2008 ACM Symposium...
    • Noll, Michael G. and Christoph Meinel. 2008b. The metadata triumvirate: Social annotations, anchor texts and search queries. In Web Intelligence...
    • Qi, Xiaoguang and Brian D. Davison. 2009. Web page classification: Features and algorithms. ACM Computing Surveys, 41:12:1–12:31, February.
    • Ramage, Daniel, Paul Heymann, Christopher D. Manning, and Hector Garcia-Molina. 2009. Clustering the tagged web. In Proc. of the Second ACM...
    • Sun, Bing-Yu, De-Shuang Huang, Lin Guo, and Zhong-Qiu Zhao. 2004. Support vector machine committee for classification. In Advances in Neural...
    • Weston, J. and C. Watkins. 1999. Multiclass support vector machines. In Proc. of the 1999 European Symposium on Artificial Neural Networks.
    • Yeung, Ching Man Au, Nicholas Gibbins, and Nigel Shadbolt. 2008. Web search disambiguation by collaborative tagging. In Proc. of the Workshop...
    • Zhou, Ding, Jiang Bian, Shuyi Zheng, Hongyuan Zha, and C. Lee Giles. 2008. Exploring social annotations for information retrieval. In Proc....
    • Zubiaga, Arkaitz, Raquel Martínez, and Víctor Fresno. 2009. Getting the most out of social annotations for web page classification. In DocEng...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno