Ir al contenido

Documat


Clasificación automática de información en portales web mediante técnicas de clustering

  • Autores: Juan Carlos Álvarez García
  • Directores de la Tesis: Luis Carlos García de Figuerola Paniagua (dir. tes.) Árbol académico
  • Lectura: En la Universidad de Salamanca ( España ) en 2010
  • Idioma: español
  • Tribunal Calificador de la Tesis: Luis Alonso Romero (presid.) Árbol académico, José Luis Alonso Berrocal (secret.) Árbol académico, Montserrat Mateos Sánchez (voc.) Árbol académico, Montserrat Sebastià Salat (voc.) Árbol académico, Francisco Javier García Marco (voc.) Árbol académico
  • Enlaces
    • Tesis en acceso abierto en: GREDOS
  • Resumen
    • La expresión, "Recuperación de la Información" (Information Retrieval), hace referencia al tratamiento automatizado que se lleva a cabo para poder dar respuesta a una necesidad de información. Engloba por una parte aspectos relacionados con la representación, almacenamiento y organización de la información y por otra parte aspectos relacionados con la eficiencia en la presentación de resultados como consecuencia de consultas. Se trata de proporcionar al usuario información válida que le sea relevante, no solamente datos, en la medida de lo posible clasificada o ponderada en cuanto a su grado de utilidad.

      Se ofrece una visión de los principales modelos de clasificación. Modelos clásicos como el booleano, el vectorial o el probabilístico. Modelos alternativos a los clásicos, como el de conjuntos finitos, el booleano extendido, el espacio vector generalizado, el de indexación por la semántica latente, el de redes neuronales, el de red de inferencias o el de red de creencias.

      Se han analizado las distintas técnicas de clustering de documentos para determinar cuál se adapta mejor a la clasificación de documentos provenientes de sitios web y modelar un proceso determinando y caracterizando sus distintas fases que permita combinar modelos de recuperación de la información con enfoques de técnicas de clustering.

      Se han desarrollado herramientas que permiten aplicar las reglas de clustering para clasificar de forma automatizada grandes cantidades de información que manejan habitualmente los directorios de muchos sitios web, permitiendo clasificar los documentos en categorías atendiendo a su significado interno, de forma que puedan ser accedidos mediante árboles jerárquicos de navegación.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno