Detección automática de Spam utilizando Regresión Logística Bayesiana

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1307
Información del item - Informació de l'item - Item information
Título: Detección automática de Spam utilizando Regresión Logística Bayesiana
Autor/es: Ortiz Martos, Antonio Jesús | Martín Valdivia, María Teresa | Ureña López, Luis Alfonso | García Cumbreras, Miguel Ángel
Palabras clave: Filtrado de correo | Spam | SPAMBASE | Regresión Logística Bayesiana | E-mail filter | Bayesian Logistic Regression
Fecha de publicación: sep-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: ORTIZ MARTOS, Antonio Jesús, et al. “Detección automática de Spam utilizando Regresión Logística Bayesiana”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 127-133
Resumen: Este artículo presenta un sistema de detección automática de Spam, o correo no deseado, aplicando Regresión Logística Bayesiana (BBR) como técnica de aprendizaje automático, sobre la colección de correos electrónicos SPAMBASE. A modo de comparativa se han aplicado otros dos algoritmos de aprendizaje: el algoritmo SVM (Support Vector Machine), y el algoritmo PLAUM (Perceptron Algorithm with Uneven Margins). La finalidad de este estudio es comprobar la eficiencia y efectividad del algoritmo BBR en la tarea concreta de filtrado de Spam. Como muestran los experimentos, el algoritmo BBR no solo obtiene unos resultados satisfactorios en cuanto a precisión y recall, sino que además es el algoritmo más rápido de los estudiados. | This paper presents an Spam automatic detection system using Bayesian Logistic Regression (BBR) as machine learning algorithm, over the SPAMBASE collection. We have also used two machine learning algorithms: SVM and PLAUM, in order to compare the results. Our aim is to check the efficiency and effectiveness of the BBR method. The obtained results show good results in terms of precision and recall. We have also noticed that BBR is the faster algorithm.
Patrocinador/es: Este trabajo ha sido financiado con el proyecto (MCYT) TIC-2003-07158-C04-04.
URI: http://hdl.handle.net/10045/1307
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_35_16.pdf224,37 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.