Maite Oronoz Anchordoqui
, Sara Gracia, Jose Mari González Hidalgo, Alicia Pérez Ramírez 
This research work is in the field of artificial intelligence called language processing and our goal is to analyse psycho-linguistic characteristics related to suicide in social networks. Intelligent systems have the ability to automatically extract this kind of characteristics associated with suicide ideation. In this work we investigate some suicide related characteristics mentioned in the antecedents (length of messages, verb tenses etc.) in two social networks in two languages: in Reddit in English and in Twitter in Spanish. We compare psycho-linguistics features in the suicide and non-suicide classes and also between languages. Re-garding the results, in both languages we found that in suicide related messages more first singular person pronoums are used. In the English dataset the length of the messages is higher but not in the Spanish one due to the length restrictions in Twitter. The number of question-marks and the use of verb tenses are not significant to distinguish both classes.
Lan hau adimen artifizialeko hizkuntzaren prozesamendua izeneko alorrean kokatzen da, eta sare sozialetako testuetan suizidioarekin zerikusia duten ezaugarri psikolinguistikoak aztertzea du hel-buru. Sistema adimentsuek badute gaitasuna suizidio-ideiagintzarekin lotutako ezaugarriok automatikoki erauzteko, eta, lan honetan, aurrekariek aipatutako ezaugarri horietako batzuk (mezuen luzera, aditzen den-borak, etab.) aztertu ditugu bi sare sozialetan eta bi hizkuntzatan: ingelesez, Reddit-en, eta, gaztelaniaz, Twitter-en. Ezaugarri psikolinguistikoak «suizidioa» eta «ez-suizidioa» klaseetako mezuetan alderatu ditugu, baita hizkuntzen artean ere. Emaitzei dagokienez, bi hizkuntzetan egiaztatu dugu lehen pertsona singularreko izenordain gehiago erabiltzen dela suizidioarekin zerikusia duten mezuetan. Ingelesez idatzitako datu sortan ondorioztatu dugu suizidio-ideiagintzaren zantzuak erakusten dituzten mezuak luzeagoak direla, baina ez da hala gertatu gaztelaniazko bilduman, segur aski Twitter-en luzera-muga dela-eta. Galdera-marka kopurua eta aditzen denboren erabilera, aurrekarietan ez bezala, ez dira esanguratsuak bi klaseak bereizteko.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados