Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts

Caseli, Helena de Medeiros; Nunes, Maria das Graças Volpe; Forcada, Mikel L.

Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1320

Información del item - Informació de l'item - Item information
Título:	Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts
Autor/es:	Caseli, Helena de Medeiros \| Nunes, Maria das Graças Volpe \| Forcada, Mikel L.
Palabras clave:	Alineamiento de palabras \| Lengua portuguesa \| Lengua española \| Lengua vasca \| Lexical alignment \| Portuguese language \| Spanish language \| Basque language
Fecha de publicación:	sep-2005
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	CASELI, Helena de Medeiros; NUNES, Maria das Graças Volpe; FORCADA ZUBIZARRETA, Mikel L. “Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 237-244
Resumen:	El alineamiento de palabras y de unidades multipalabra desempeña un papel importante en muchas aplicaciones del procesamiento de lenguaje natural, tales como la traducción automática basada en ejemplos, la inducción de reglas de transferencia para la traducción automática, la lexicografía bilingüe, la desambiguación de la polisemia, etc. En esta comunicación describimos LIHLA, un alineador de palabras que utiliza léxicos probabilísticos bilingües generados por un paquete de herramientas libremente disponible (NATools) y heurísticas independientes del idioma para encontrar alineamientos entre palabras y unidades multipalabra en textos paralelos alineados por oraciones. El método ha alcanzado una precisión de un 92.44% y un 85.09% y una cobertura de un 91.13% y un 64.66% en textos paralelos escritos en portugués brasileño–español y español–euskera, respectivamente. \| Alignment of words and multiword units plays an important role in many natural language processing applications, such as example-based machine translation, transfer rule learning for machine translation, bilingual lexicography, word sense disambiguation, etc. In this paper we describe LIHLA, a lexical aligner which uses bilingual probabilistic lexicons generated by a freely available set of tools (NATools) and language-independent heuristics to find links between single words and multiword units in sentence-aligned parallel texts. The method has achieved a precision of 92.44% and 85.09% and a recall of 91.13% and 64.66% on Brazilian Portuguese–Spanish and Spanish–Basque parallel texts, respectively.
Patrocinador/es:	FAPESP, CAPES, CNPq and the Spanish Ministry of Science & Technology (Project TIC2003-08681-C02-01).
URI:	http://hdl.handle.net/10045/1320
ISSN:	1135-5948
Idioma:	eng
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005) INV - TRANSDUCENS - Artículos de Revistas

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_35_29.pdf		208,67 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo