Oviedo, España
Logroño, España
El presente trabajo describe una metodología basada en la captura y el procesamiento de datos filtrados que han sido puestos a la venta en la Dark Web, una zona de internet con una alta prevalencia de contenido criminal. Uno de los principales desafíos en la recopilación y procesamiento de datos críticos vendidos en la Dark Web es la volatilidad del contenido y su falta de estructura. Por esta razón, se propone una metodología basada en técnicas de Web Scraping y procesamiento del lenguaje natural (PNL) para la detección de datos sensibles publicados en el mercado negro de Internet, con el objetivo de prevenir su uso en casos de extorsión, robo de identidad, divulgación de secretos y otro tipo de ciberdelitos.El software desarrollado representa un gran avance para el bienestar social, ya que permite la monitorización y la interpretación automática de datos filtrados en la Dark Web (por ejemplo, tarjetas de crédito, números de identificación personal, etc.) salvaguardando, de esta manera, la privacidad de los individuos y los organismos afectados. Además, al proporcionar un enfoque más rápido y preciso para abordar estas amenazas, la adopción de la arquitectura propuesta en este trabajo promueve un entorno en línea más seguro para todos los usuarios.
This paper sets out a methodology for the capture and processing of data that has been leaked and made available for sale on the Dark Web, a part of the internet that is known for its high prevalence of criminal content. A significant challenge in the collection and processing of critical data sold on the Dark Web is the volatility of the content and its lack of structure. To address these challenges, a methodology employing Web Scraping and Natural Language Processing (NLP) techniques is proposed for the detection of sensitive data published on the Internet black market. The aim is to prevent its use in cases of extortion, identity theft, disclosure of secrets and other types of cybercrime.The developed software represents a significant advancement in terms of social welfare, as it facilitates the automated monitoring and interpretation of data leaked on the Dark Web (e.g. credit card details, personal identification numbers, etc.), thereby ensuring the privacy of the individuals and organisations concerned. Moreover, by offering a more efficient and precise approach to address these threats, the adoption of the architecture proposed in this work contributes to the creation of a safer online environment for all users.
© 2008-2025 Fundación Dialnet · Todos los derechos reservados