语言工程与计算实验室
广外首页 | 管理入口
 首页  实验室简介  实验室动态  研究人员  学术成果  人才招聘  文档下载  联系我们 

 项目 
 论著 
 知识产权 
 荣誉奖励 


当前位置: 首页>>学术成果>>论著>>论文>>正文


一种垃圾邮件快速识别方法
 

【作者】李霞;蒋盛益;

【摘要】k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇进行再聚类,最终聚类簇被看成是可以增量更新的分类模型,最后使用经典k最近邻分类算法在该分类模型上对未知邮件进行分类.在公开语料Ling-Spam上的实验结果表明,本文提出的垃圾邮件识别算法不仅具有较高的垃圾邮件识别精度,而且还具有较低的时间复杂度.

【关键词】垃圾邮件过滤;K最近邻分类算法;共享最近邻图聚类算法;

上一条:考察重音与韵律的英语句子客观评价系统研究
下一条:适用于大规模文本处理的动态密度聚类算法



中国广州市白云区白云大道北2 510420 (北校区)  |  中国广州市番禺区小谷围广州大学城 510006 (南校区)