Skip to main content
Resumen Los lenguajes de anotación basados en SGML/XML han propiciado un cambio revolucionario en los métodos de edición tradicional y constituyen el fundamento de la edición digital moderna. El artículo define los conceptos de metadato y... more
Resumen Los lenguajes de anotación basados en SGML/XML han propiciado un cambio revolucionario en los métodos de edición tradicional y constituyen el fundamento de la edición digital moderna. El artículo define los conceptos de metadato y metacontenido y reseña las principales iniciativas actuales de gestión de metacontenidos. En el campo filológico se introduce TEI; en el área de Internet se habla de DCMI, RDF, así como de la web semántica; en el terreno de la traducción se citan TMX y XLIFF; y, por último, en el ...
Resumen: SARE-Bi es un gestor de corpus multilingües que permite la importación, exportación, actualización, alimentación y consulta directa de documentos originales y traducidos en un entorno de web. Los documentos pueden seguir tanto el... more
Resumen: SARE-Bi es un gestor de corpus multilingües que permite la importación, exportación, actualización, alimentación y consulta directa de documentos originales y traducidos en un entorno de web. Los documentos pueden seguir tanto el estándar TEI como el estándar TMX, lo que aporta una gran flexibilidad. Se ha desarrollado con ayuda del servidor Zope y la herramienta Localizer. Palabras clave: corpus multilíngües, gestión documental
Resumen: El principal inconveniente de los sistemas de memorias de traducción es que para que lleguen a ser productivos requieren un costoso proceso previo de alimentación manual. XTRA-Bi desarrolla métodos de extracción y alimentación... more
Resumen: El principal inconveniente de los sistemas de memorias de traducción es que para que lleguen a ser productivos requieren un costoso proceso previo de alimentación manual. XTRA-Bi desarrolla métodos de extracción y alimentación automática de segmentos bilingües a partir de corpora paralelos. La clave del método radica en la utilización del formato TMX para la importación de corpus previamente segmentados y alineados.
Información del artículo La gestión de documentación bilingüe (euskara y español) mediante estándares XML de traducción y lingüística de corpus.
Resumen Los objetivos del proyecto XemGrid son tres: a) estudiar y desarrollar una ontología que defina y represente adecuadamente los Grid services que puedan existir en la Grid, utilizando información semántica para mejorar su... more
Resumen Los objetivos del proyecto XemGrid son tres: a) estudiar y desarrollar una ontología que defina y represente adecuadamente los Grid services que puedan existir en la Grid, utilizando información semántica para mejorar su descubrimiento, b) plantear la arquitectura del registro de Grid services que servirá para indexarlos, yc) diseñar el descubridor de servicios necesario para realizar búsquedas en el registro.
This paper describes a multilingual document managing system, SARE-Bi, that is based on the use of metadata. In this system, metadata have the role of controlling all phases of a document's life cycle, from the drafting of the first... more
This paper describes a multilingual document managing system, SARE-Bi, that is based on the use of metadata. In this system, metadata have the role of controlling all phases of a document's life cycle, from the drafting of the first version up to the reutilization of published material, including all intermediate phases of translation, post-edition, validation, publication, and others. The system has been implemented in the web application server Zope and metadata are based on two XML proposals: TEI, for structural mark-up, and ...
Research Interests:
Research Interests:
Partiendo de la hipótesis de que las enumeraciones sintagmáticas nominales (ESN) que se encuentran en los textos médicos se componen de términos específicos del dominio, presentamos un método de reconocimiento de dichas enumeraciones con... more
Partiendo de la hipótesis de que las enumeraciones sintagmáticas nominales (ESN) que se encuentran en los textos médicos se componen de términos específicos del dominio, presentamos un método de reconocimiento de dichas enumeraciones con el objetivo de contribuir a la extracción automática. La metodología se conforma de tres etapas: (i) reconocimiento de enumeraciones sintagmáticas nominales, aquí se utiliza exclusivamente información lingüística, a partir de la cual se elaboran reglas de análisis sintáctico; (ii) extracción automática de los candidatos a términos que se correspondían con unigramas y bigramas, y (iii) evaluación de los candidatos extraídos con el asesoramiento de expertos del área médica. Los experimentos fueron realizados en el corpus IULA, conformado por textos médicos en español. Los resultados obtenidos fueron alentadores, ya que se logró un 67% y 68% de precisión en las enumeraciones detectadas para unigramas y bigramas respectivamente.
Research Interests:
Información del artículo La gestión de documentación bilingüe (euskara y español) mediante estándares XML de traducción y lingüística de corpus.