La mayor parte de los Sistemas de Recuperacion de Informacion utilizan, de una forma u otra, recuentos de frecuencias de las palabras que aparecen en los documentos.Tales recuentos conllevan la necesidad de normalizar dichos terminos. Una simple normalizacion de caracteres (mayusculas/minusculas, acentos y otros diacriticos) parece insuficiente, ya que muchas palabras, por exion morfologica o derivacion, podrian ser agrupadas bajo una unica forma, al tener contenidos semanticos muy cercanos. Se analizan diversos algoritmos de normalizacion y se muestran los experimentos llevados a cabo para evaluar su eficacia.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados