La Recuperación de Información en español y la normalizacion de términos

Autores: José Luis Alonso Berrocal , Emilio Rodríguez Vázquez de Aldana, Luis Carlos García de Figuerola Paniagua , Ángel Francisco Zazo Rodríguez
Localización: Inteligencia artificial: Revista Iberoamericana de Inteligencia Artificial, ISSN-e 1988-3064, ISSN 1137-3601, Vol. 8, Nº. 22, 2004, págs. 135-145
Idioma: español
Enlaces
- Texto completo

Resumen
- La mayor parte de los Sistemas de Recuperacion de Informacion utilizan, de una forma u otra, recuentos de frecuencias de las palabras que aparecen en los documentos.Tales recuentos conllevan la necesidad de normalizar dichos terminos. Una simple normalizacion de caracteres (mayusculas/minusculas, acentos y otros diacriticos) parece insuficiente, ya que muchas palabras, por exion morfologica o derivacion, podrian ser agrupadas bajo una unica forma, al tener contenidos semanticos muy cercanos. Se analizan diversos algoritmos de normalizacion y se muestran los experimentos llevados a cabo para evaluar su eficacia.