Resumen de Calificación del test oral EEE-4: Análisis del discurso basado basado en redes complejas

Ge Li

  • español

    Con el desarrollo de la informática, en la investigación del lenguaje se introdujo la teoría y metodología de redes complejas, que transforma el sistema de la lengua en las redes complejas compuestas de nodos y enlaces para hacer un análisis cuantitativo de la estructura de la lengua. El desarrollo de la gramática de dependencias proporciona un apoyo teórico a la construcción del corpus anotado (treebank), por lo que el análisis estadístico con las redes complejas se hace posible. Este artículo presenta la teoría y metodología de las redes complejas y construye las redes sintácticas de dependencia a base del corpus anotado (treebank) de las expresiones orales del examen EEE-4 (Examen del Español como Especialidad - Nivel 4). Mediante el análisis de las características generales de las redes, incluyendo el número de nodos, los enlaces, el grado medio, la longitud media de los caminos, la distribución de grados y la centralización, tiene como objetivo descubrir la diferencia y similitud potencial entre las expresiones orales de distintos niveles. Además, con el análisis de conglomerados, esta investigación pretende demostrar la capacidad discriminatoria de las variables de las redes complejas y proporcionar una referencia potencial para el trabajo de calificación.

  • English

    With the development of information technology, the theory and methodology of complex network has been introduced to the language research, which transforms the system of language in a complex networks composed of nodes and edges for the quantitative analysis about the language structure. The development of dependency grammar provides theoretical support for the construction of a treebank corpus, making possible a statistic analysis of complex networks. This paper introduces the theory and methodology of the complex network and builds dependency syntactic networks based on the treebank of speeches from the EEE-4 oral test. According to the analysis of the overall characteristics of the networks, including the number of edges, the number of the nodes, the average degree, the average path length, the network centrality and the degree distribution, it aims to find in the networks potential difference and similarity between various grades of speaking performance. Through clustering analysis, this research intends to prove the network parameters’ discriminating feature and provide potential reference for scoring speaking performance.

  • 中文

    基于语言复杂网络的话语分析在EEE-4口语测试评分中的应用。随着计算机科学的发展,语言研究领域开始引入“复杂网络”的理论和方法,将语言系统转化为由节点和边构成的复杂网络,对语言结构进行周密的量化统计分析。而依存语法的提出和发展,为依存树库的建立提供了理论支持,使得复杂网络这一研究理念成为现实。本研究引入 “复杂网络” 的理论和方法,以“依存语法”为理论基础,选取EEE-4口头作文作为研究对象,创建口头作文树库,构建各个等级的口头作文复杂网络,对这些网络的边数、节点数、节点平均度、平均路径长度、网络中心势以及度分布等特征进行对比分析,研究各个等级的考生口试表现的差异,并通过聚类分析,研究网络参数对不同等级的口试表现所具有的区分能力,为评分员分级评分提供参考。

