Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1484
Título: | Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet |
---|---|
Autor/es: | Gómez Hidalgo, José María | Puertas Sanz, Enrique | Carrero García, Francisco | Buenaga Rodríguez, Manuel de |
Palabras clave: | Categorización automática de texto | Filtrado de Internet | Aprendizaje sensible al coste | Receiver Operating Characteristic | Automated text categorization | Internet filtering | Cost sensitive learning |
Fecha de publicación: | sep-2003 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | GÓMEZ HIDALGO, José María, et al. “Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 13-20 |
Resumen: | El creciente problema del acceso a contenidos inapropiados de Internet se puede abordar como un problema de categorización automática de texto sensible al coste. En este artículo presentamos la evaluación comparativa de un rango representativo de algoritmos de aprendizaje y métodos de sensibilización al coste, sobre dos colecciones de páginas Web en español e inglés. Los resultados de nuestros experimentos son prometedores. | The access to inapropiate Internet content is an increasing problem that can be approached as a cost-sensitive Automated Text Categorization task. In this paper, we report a series of experiments that compare a representative range of learning algorithms and methods for making them cost-sensitive, on two Web pages collections in Spanish and English. The results of our experiments are promising. |
Patrocinador/es: | Esta investigación ha sido financiada parcialmente por la Comisión Europea a través del Safe Internet Action Plan (POESIA - SIAP-2117) y por el Ministerio de Ciencia y Tecnología a través del programa PROFIT (FIT-070000-2002-861). |
URI: | http://hdl.handle.net/10045/1484 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_31_02.pdf | 128,55 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.