Ir al contenido

Documat


Resumen de Método de adquisición de modelos de dominio a partir de corpus textuales y su aplicación en la integración de bases de datos y fuentes de información

Miguel García Remesal Árbol académico

  • LA LLAMADA "SOCIEDAD DE LA INFORMACIÓN" Y EL RÁPIDO CRECIMIENTO DE LA WEB HAN FAVORECIDO LA APARICIÓN DE NUMEROSAS FUENTES "ON-LINE'' QUE CONTIENEN GRANDES CANTIDADES DE DATOS E INFORMACIÓN, ES POR ELLO QUE SE HACE NECESARIA LA CREACIÓN DE NUEVOS MÉTODOS Y HERRAMIENTAS PARA FACILITAR EL ACCESO INTEGRADO A TODOS ESTOS RECURSOS A TRAVÉS DE INTERNET. EN ESTA TESIS DOCTORAL SE PRESENTAN UNA SERIE DE MÉTODOS Y HERRAMIENTAS CUYO PROPÓSITO ES LLEVAR A CABO LA INTEGRACIÓN DE FUENTES ESTRUCTURADAS (NORMALMENTE BASES DE DATOS RELACIONALES) CON FUENTES NO ESTRUCTURADAS (COMO COLECCIONES DE DOCUMENTOS DE TEXTO "PLANO''). PARA ELLO, SE PARTE DEL TRABAJO PREVIO REALIZADO POR EL AUTOR DE ESTA TESIS EN EL DESARROLLO DE ONTOFUSION, UN SISTEMA QUE PERMITE LLEVAR A CABO LA INTEGRACIÓN DE FUENTES ESTRUCTURADAS SIGUIENDO UN ENFOQUE BASADO EN REPOSITORIOS VIRTUALES Y EL USO DE MODELOS DE DOMINIO. A PRIORI, LOS MÉTODOS Y HERRAMIENTAS PROPORCIONADOS POR ONTOFUSION NO PUEDEN SER UTILIZADOS PARA INTEGRAR AMBOS TIPOS DE FUENTES, YA QUE LAS FUENTES NO ESTRUCTURADAS CARECEN DE 1) UN MODELO DE DATOS FÍSICO QUE LAS DESCRIBA, Y 2) UN MECANISMO DE RECUPERACIÓN DE INFORMACIÓN QUE PERMITA EJECUTAR PREGUNTAS FORMULADAS EN BASE AL MODELO DE DATOS. PARA SOLUCIONAR ESTOS PROBLEMAS, EN ESTE TRABAJO SE PROPONE: 1) CREAR UN MÉTODO QUE PERMITA OBTENER, A PARTIR DE UNA FUENTE NO ESTRUCTURADA, UN MODELO DE DOMINIO QUE DESCRIBA SU CONTENIDO, Y 2) DEFINIR UN MODELO DE RECUPERACIÓN DE INFORMACIÓN PARA FUENTES NO ESTRUCTURADAS QUE PUEDA INTEGRARSE CON LA RECUPERACIÓN DE DATOS EN FUENTES ESTRUCTURADAS.

    ESTE MODELO DE RECUPERACIÓN, DENOMINADO ``MODELO DE ÍNDICES ONTOLÓGICOS'' O MIO ESTÁ BASADO EN EL MODELO DE RECUPERACIÓN MÁS UTILIZADO DURANTE LAS ÚLTIMAS DÉCADAS: EL MODELO DEL ESPACIO VECTORIAL (MEV). LA UTILIZACIÓN CONJUNTA DE ESTOS DOS COMPONENTES, Y DE LOS MÉTODOS Y HERRAMIENTAS DESARROLLADOS EN EL CONTEXTO DE INFOGENMED, SUGIERE QUE ES POSIBLE LOGRAR LA INT


Fundación Dialnet

Mi Documat