El origen del análisis de datos textuales se remonta a los análisis realizados sobre obras literarias, destacándose un recuento de las palabras de la Biblia y el primer catálogo de clasificación de libros de una biblioteca. A principios de 1900 estas ideas se extienden dando lugar a la generación de resúmenes de largos textos, mediante análisis de frecuencias y medidas de significación relativa de cada término dentro de un texto. Desde una perspectiva estadística, el tratamiento de datos textuales se afianza cuando surge el Análisis Factorial de Correspondencias, desarrollado para el trato de datos lingüísticos. Actualmente, el análisis estadístico de textos se ha expendido y ha ido incrementando su implementación, dejando de lado las aplicaciones únicamente a obras literarias. Los principales ámbitos de aplicación son: análisis de mercado, búsquedas web, periodismo, psicología y educación, sociología y politología. Los textos analizados se estructuran de forma conjunta en un único elemento. Así, el análisis estadístico de datos textuales se define como el proceso de extraer información de dicho elemento. En este trabajo se realiza un análisis, desde esta perspectiva, de cuatro discursos presidenciales de Uruguay, correspondientes a Julio María Sanguinetti y Tabaré Vázquez. Ambos provienen de sectores ideológicos/políticos distintos, tradicionalmente opuestos/rivales y cada uno ha formado parte del gobierno como oposición, durante el mandato del otro. Los resultados son de carácter descriptivo multidimensional y se complementan con elementos de visualización. Los principales resultados obtenidos ponen de manifiesto la diferencia que existe en los discursos, a nivel tanto de candidato como de período.
The textual data analysis origin is based on the analyzes carried out mainly on literary works, which include a recount of all Bible’s words and the presentation of the first catalog of book classification of a library. At the beginning of 1900 these ideas are extended, giving rise to summaries generation of long texts, based on the analysis of frequencies and measures of relative significance of each term within a given text. From a formal statistical perspective, the text data processing takes hold when the Factorial Correspondence Analysis arises, developed for linguistic databases treatment. Now a day, the textual data statistical analysis has been sold and has increased its implementation. Among the main fields of application are: market analysis, web searches and journalistic studies, studies of psychology, education and sociology. The analyzed texts are organized and structured together in a single element. Thus, the textual data statistical analysis is defined as the process of extracting information from that element. This paper analyzes, from this perspective, of four presidential speeches in Uruguay, corresponding to Julio María Sanguinetti and Tabaré Vázquez. Both come from different ideological / political sectors, traditionally opposed / rivals and each has been part of the opposition government, during the mandate of each other. The presented results are multidimensional descriptive and are complemented by visualization elements, a tool typically used in textual data statistical analysis. The main results obtained show the difference that exists in the speeches, both at the level of the candidate and the period.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados