Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1320
Título: | Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts |
---|---|
Autor/es: | Caseli, Helena de Medeiros | Nunes, Maria das Graças Volpe | Forcada, Mikel L. |
Palabras clave: | Alineamiento de palabras | Lengua portuguesa | Lengua española | Lengua vasca | Lexical alignment | Portuguese language | Spanish language | Basque language |
Fecha de publicación: | sep-2005 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | CASELI, Helena de Medeiros; NUNES, Maria das Graças Volpe; FORCADA ZUBIZARRETA, Mikel L. “Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 237-244 |
Resumen: | El alineamiento de palabras y de unidades multipalabra desempeña un papel importante en muchas aplicaciones del procesamiento de lenguaje natural, tales como la traducción automática basada en ejemplos, la inducción de reglas de transferencia para la traducción automática, la lexicografía bilingüe, la desambiguación de la polisemia, etc. En esta comunicación describimos LIHLA, un alineador de palabras que utiliza léxicos probabilísticos bilingües generados por un paquete de herramientas libremente disponible (NATools) y heurísticas independientes del idioma para encontrar alineamientos entre palabras y unidades multipalabra en textos paralelos alineados por oraciones. El método ha alcanzado una precisión de un 92.44% y un 85.09% y una cobertura de un 91.13% y un 64.66% en textos paralelos escritos en portugués brasileño–español y español–euskera, respectivamente. | Alignment of words and multiword units plays an important role in many natural language processing applications, such as example-based machine translation, transfer rule learning for machine translation, bilingual lexicography, word sense disambiguation, etc. In this paper we describe LIHLA, a lexical aligner which uses bilingual probabilistic lexicons generated by a freely available set of tools (NATools) and language-independent heuristics to find links between single words and multiword units in sentence-aligned parallel texts. The method has achieved a precision of 92.44% and 85.09% and a recall of 91.13% and 64.66% on Brazilian Portuguese–Spanish and Spanish–Basque parallel texts, respectively. |
Patrocinador/es: | FAPESP, CAPES, CNPq and the Spanish Ministry of Science & Technology (Project TIC2003-08681-C02-01). |
URI: | http://hdl.handle.net/10045/1320 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005) INV - TRANSDUCENS - Artículos de Revistas |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_35_29.pdf | 208,67 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.