范恒亮
作品数: 8被引量:4H指数:1
  • 所属机构:南京邮电大学
  • 所在地区:江苏省 南京市
  • 研究方向:自动化与计算机技术
  • 发文基金:江苏省自然科学基金

相关作者

成卫青
作品数:85被引量:235H指数:7
供职机构:南京邮电大学
研究主题:文本分类 网页 网络 标签 文本特征
杨庚
作品数:477被引量:1,531H指数:16
供职机构:南京邮电大学
研究主题:无线传感器网络 隐私保护 云计算 密文 隐私
黄卫东
作品数:168被引量:694H指数:13
供职机构:南京邮电大学
研究主题:物联网 商业模式 网络舆情 应急管理 信息消费
梁胜
作品数:7被引量:3H指数:1
供职机构:南京邮电大学
研究主题:文本分类 策略性 KNN 基于网页 结点
卢艳红
作品数:5被引量:45H指数:2
供职机构:南京邮电大学
研究主题:词性 聚类分析 文本分类 网络热点事件 特征词
一种基于文本分类和聚类分析的网络热点事件发现方法
本发明公开了一种基于文本分类和聚类分析的网络热点事件发现方法,该方法解决了已有的基于聚类分析的热点事件发现方法存在的效率和准确率有待进一步提高的问题。该方法首先利用训练语料库通过特征词提取和特征选择为各类别文本分别选取特...
成卫青范恒亮卢艳红
文献传递
一种基于关联分析和KNN的文本分类方法
本发明提供一种基于关联分析和KNN的文本分类方法,用于解决基于传统KNN的文本分类方法存在的效率和准确率有待进一步提高的问题;本发明是一种策略性方法考虑到被测文档与近邻文档向量的特征属性会重合较多,本发明提出一种基于关联...
成卫青范恒亮杨庚黄卫东梁胜
文献传递
一种基于改进互信息和熵的文本分类特征提取方法
本发明提供一种用于文本分类的特征提取方法,用于解决文本分类存在的准确率和召回率有待进一步提高的问题。本发明是一种策略性方法。考虑到统计热力学中熵的概念,熵用来描述体系的混乱程度,它在控制论、概率论、数论、天体物理、生命科...
成卫青唐旋范恒亮杨庚梁胜
文献传递
一种基于关联分析和KNN的文本分类方法
本发明提供一种基于关联分析和KNN的文本分类方法,用于解决基于传统KNN的文本分类方法存在的效率和准确率有待进一步提高的问题;本发明是一种策略性方法考虑到被测文档与近邻文档向量的特征属性会重合较多,本发明提出一种基于关联...
成卫青范恒亮杨庚黄卫东梁胜
文献传递
一种基于主客观语义的双层次文本相似度计算方法
基于主客观语义的双层次文本相似度计算方法具有如下特征:本发明将文本分为题目和正文两个层次,通过过滤构建题目-词语向量,通过提取关键词构建较低维度的正文-词语向量,并将主客观结合的词语语义相似度计算方法用于词语向量相似度的...
成卫青吴旭东黄卫东范恒亮
文献传递
一种基于关联分析的KNN文本分类方法被引量:4
2014年
KNN算法在数据挖掘的分支-文本分类中有重要的应用。在分析了传统KNN方法不足的基础上,提出了一种基于关联分析的KNN改进算法。该方法首先针对不同类别的训练文本提取每个类别的频繁特征集及其关联的文本,然后基于对各个类别文本的关联分析结果,为未知类别文本确定适当的近邻数k,并在已知类别的训练文本中快速选取k个近邻,进而根据近邻的类别确定未知文本的类别。相比于基于传统KNN的文本分类方法,改进方法能够较好地确定k值,并能降低时间复杂度。实验结果表明,文中提出的基于改进KNN的文本分类方法提高了文本分类的效率和准确率。
范恒亮成卫青
关键词:数据挖掘文本分类KNN
一种基于文本分类和聚类分析的网络热点事件发现方法
本发明公开了一种基于文本分类和聚类分析的网络热点事件发现方法,该方法解决了已有的基于聚类分析的热点事件发现方法存在的效率和准确率有待进一步提高的问题。该方法首先利用训练语料库通过特征词提取和特征选择为各类别文本分别选取特...
成卫青范恒亮卢艳红
文献传递
文本分类的研究及其在网络热点事件识别中的应用
从上个世纪90年代中期起,互联网进入了快速发展的阶段,电子文本信息与服务站点数量呈指数级增长,人们可以更加方便快捷地在互联网上获取信息。互联网上存储着海量的网络文本信息,其中中文文本占了相当一部分比重,由于中文本身所具有...
范恒亮
关键词:文本分类APRIORI算法
文献传递