Ir al contenido

Documat


Text categorization using bibliographic records: beyond document content

  • Autores: Arturo Montejo Ráez Árbol académico, Luis Alfonso Ureña López Árbol académico, Ralf Steinberger Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 35, 2005, págs. 119-126
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      En este artículo se estudia el uso de diferentes fuentes de información para tareas de clasificación de textos. Dado el creciente número de bibliotecas digitales, se impone una revisión de la información disponible en dichas bases de datos. Se han llevado a cabo una serie de experimentos de clasificación multi-etiquetado dentro del dominio de la Física de Altas Energías haciendo uso de diferentes clasificadores base y combinando distintas fuentes de formación. Los resultados muestran que el uso de metadatos es tan válido como el uso de versiones a texto completo de los documentos

    • English

      This paper studies the use of different sources of information for performing a text classification task. The growing number of digital libraries imposes a review of the available data from those databases. Some experiments applying different base classifiers for a multi-label classifier in the domain of High Energy Physics on several of these possible sources have been carried out. Results show that the use of metadata is almost as good as the full-text version of papers


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno