Nuevas técnicas de minería de textos: Aplicaciones

María del Consuelo Justicia de la Torre

Ayuda

Nuevas técnicas de minería de textos: Aplicaciones

Autores: María del Consuelo Justicia de la Torre
Directores de la Tesis: María José Martín Bautista (dir. tes.) , Daniel Sánchez Fernández (dir. tes.)
Lectura: En la Universidad de Granada ( España ) en 2017
Idioma: español
Tribunal Calificador de la Tesis: Miguel Delgado Calvo-Flores (presid.) , María Amparo Vila Miranda (secret.) , Carmen Martínez Cruz (voc.) , José Maria Serrano Chica (voc.) , Fernando Bobillo Ortega (voc.)
Enlaces
- Tesis en acceso abierto en: DIGIBUG
Resumen
- Una diferencia fundamental entre Minería de Datos y Minería de Textos es la naturaleza de la información de partida. Los datos tienen una estructura explícita y contienen conocimiento de forma implícita, mientras que con el texto ocurre todo lo contrario, es decir, contiene un conocimiento explícito (aunque por lo general dependiente de un contexto que no está del todo hecho expresado en el documento) y una estructura que se puede sobrentender.
  
  Esta diferencia puede interpretarse desde el punto de vista de la Ingeniería del Conocimiento, según el cual los datos constituyen colecciones de hechos simples, representados mediante un modelo de datos que facilita su tratamiento, mientras que el texto contiene una base de conocimiento completa que incorpora, además de hechos, relaciones de diversos tipos, con la desventaja de estar expresados en un lenguaje de representación (el lenguaje natural) que, aunque de una expresividad máxima, resulta totalmente inadecuado para llevar a cabo procesos automáticos de inferencia.
  
  Dichas diferencias plantean nuevos retos a la investigación en Minería de Textos y, al mismo tiempo, abren la puerta a un importante paso adelante desde el estado actual de la técnica, con nuevas capacidades y aplicaciones.
  
  En este trabajo se muestra una retrospectiva de los principales artículos científicos que han tratado el tema de la Minería de Textos, se revisa su concepto, definición y proceso y se exponen las diferentes formas de representación intermedia del texto que pueden resultar "adecuadas" para trabajar con el lenguaje natural en el que está escrito. Igualmente, se repasan las técnicas de minería existentes y se enumeran algunas de las aplicaciones más frecuentes de la Minería de Textos.
  
  Por otro lado, se discuten una serie de retos de futuro dentro de este área de investigación y se presenta el innovador paradigma "Text Knowledge Mining" como complemento a la Minería de Textos tradicional o "basada en datos". Sustentaremos nuestro estudio aportando una técnica de Minería de Textos basada en la localización de contradicciones en textos, atenderemos a su implementación, y a la demostración experimental de que es una técnica factible y con requisitos computacionales razonables.
  
  A partir de aquí, abrimos un área de investigación apasionante de la que se pueden esperar muchas contribuciones importantes en un futuro próximo.