国家高技术研究发展计划(2007AA012455)
- 作品数:3 被引量:8H指数:2
- 相关作者:张月国李生红陈远翔董莉莉李燕更多>>
- 相关机构:上海交通大学更多>>
- 发文基金:上海市教育发展基金会“曙光计划”项目教育部“新世纪优秀人才支持计划”国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于知网语义相似度计算的文本特征提取被引量:5
- 2009年
- 互联网中存在着大量的文本信息,而对于这些文本信息的监管还存在着很大的盲区,如何从互联网的大量信息中进行相关舆情分析、预测及管控是信息安全领域中的新课题,其中文本特征的有效提取是研究内容之一。文章基于知网中语义词语语义相似度的计算方法提出一套建立在之上的语句语义相似度的计算方法,并用此方法提取出文本的特征。
- 陈远翔张月国李生红董莉莉
- 关键词:知网语义相似度
- 基于概念网的本征特征提取被引量:1
- 2010年
- 随着网络技术的发展,网络舆情分析越来越受到人们的重视。长期以来,应用于网络舆情分析中的文本分类和聚类技术都是以词作为最小的分析单位,很难把握词语之间的关系。介绍了舆情分析的核心体系,即基于概念网络提取文本本征特征,可以有效提高网络舆情分析准确度,利用概念消歧的方法,将文本映射成为概念网络中的概念,以义元作为最小的表达概念的单位,利用统计方法将高权重的义元集合作为文本本征特征。
- 梁昆张月国李生红
- 关键词:概念网
- 基于蚁群算法的文本分类和聚类被引量:2
- 2009年
- 为了研究并提高文本的分类和聚类算法的性能,笔者根据蚁群算法在TSP问题中的应用方法,将其改进引用到文本的分聚类中。在文本聚类中,改变蚂蚁的信息素释放机制,道路节点的聚合方式,最终将相似文本进行聚合。在文本的分类中,将所需要的分类信息装入蚂蚁,蚂蚁根据系统外部所希望的方式将文本分类。实验结果证明,这种新的算法可以使文本分类和聚类的准确度提高,蚁群算法在文本分类聚类中的应用是可行的。
- 李燕张月国李生红
- 关键词:蚁群算法文本分类文本聚类