语言工程与计算实验室
广外首页 | 管理入口
 首页  实验室简介  实验室动态  研究人员  学术成果  人才招聘  文档下载  联系我们 

 项目 
 论著 
 知识产权 
 荣誉奖励 


当前位置: 首页>>学术成果>>论著>>论文>>正文


适用于大规模文本处理的动态密度聚类算法
 

【作者】李霞;蒋盛益;张倩生;朱靖;

【摘要】针对传统的基于密度的聚类算法对海量数据处理时,存在参数输入复杂及时间复杂度高的问题,给出新的密度定义方法,并在此基础上提出一种只需一个简单输入参数就能动态识别密度不均匀聚类簇的聚类算法,同时将其扩充为可以处理海量数据的两阶段动态密度聚类算法。在人造数据集、大规模数据集以及中英文文本语料数据集上的实验表明,所提出的算法具有输入参数简单和聚类效率高的特点,可以应用于海量文本数据的聚类处理。

【关键词】文本挖掘;聚类;海量数据;动态密度;

上一条:一种垃圾邮件快速识别方法
下一条:Speech Recognition Approach Basedon Speech Feature Clustering and HMM



中国广州市白云区白云大道北2 510420 (北校区)  |  中国广州市番禺区小谷围广州大学城 510006 (南校区)