Ángela Almela Sánchez-Lafuente
El objetivo principal de esta tesis doctoral es el análisis de las características lingüísticas de la mentira en el lenguaje escrito en inglés y en español, para lo cual se ha llevado a cabo un análisis contrastivo entre ambas lenguas. Se han realizado diversos experimentos de clasificación automática sobre dos corpora ad-hoc para testar la clasificación de los textos según su valor de verdad. En el primer experimento se han aplicado técnicas de aprendizaje automático y se han comparado los resultados con un modelo Bag-of-Words, obteniendo una tasa de éxito máxima de 78,5% para inglés y de 84,5% para español. El segundo experimento ha incluido dos técnicas estadísticas: análisis discriminante y regresión logística binaria, siendo los resultados de clasificación igualmente satisfactorios. Además de ello, se ha confirmado el papel fundamental en la configuración de la mentira escrita de parámetros tales como la longitud del texto, referencias propias, entendimiento y exclusiones.
Palabras clave: lingüística computacional, detección de la mentira, análisis contrastivo, clasificación automática.
The main aim of this PhD thesis is to analyse the linguistic cues to deception in written language both in English and Spanish, performing a contrastive analysis between both languages. For this purpose, several automatic classification experiments have been performed on two ad-hoc corpora in both languages, in order to check whether the texts could be successfully classified on the basis of their truth value. In the first set of experiments, a machine learning technique has been applied on the data and compared to a Bag-of-Words model, obtaining a maximum rate of 78.5% for English and 84.5% for Spanish. The second experiment involved statistical techniques, namely discriminant function analysis and binary logistic regression, and the results obtained proved remarkably successful too. In addition, they confirm the leading role in deception detection of parameters such as text length, self-references, insight and exclusive words.
Keywords: computational linguistics, deception detection, contrastive analysis, automatic classification.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados