国家自然科学基金(60973040) 作品数:21 被引量:124 H指数:7 相关作者: 左万利 王俊华 王英 彭涛 赫枫龄 更多>> 相关机构: 吉林大学 长春工业大学 长春工程学院 更多>> 发文基金: 国家自然科学基金 吉林省重大科技攻关项目 中央级公益性科研院所基本科研业务费专项 更多>> 相关领域: 自动化与计算机技术 更多>>
采用词向量注意力机制的双路卷积神经网络句子分类模型 被引量:9 2018年 针对句子中不同的词对分类结果影响不同以及每个词对应的词向量受限于单一词向量训练模型的特点,提出一种基于词向量注意力机制的双路卷积神经网络句子分类模型(AT-DouCNN).该模型将注意力机制和卷积神经网络相结合,以不同训练算法得到的词向量同时作为输入,分别进行卷积和池化,并在全连接层进行融合,不仅能够使得具体分类任务下句子中的关键信息更易被提取,还能够有效地利用不同种类的词向量得到更加丰富的句子特征,进而提高分类的准确率.实验结果表明:所提出的模型在3个公开数据集上的分类准确率分别达到50.6%、88.6%和95.4%,具有良好的句子分类效果. 郭宝震 左万利 王英基于清晰有理数均值的新匹配聚类算法 2018年 通过改进清晰有理数均值的方法,提出一种新匹配聚类算法.首先计算每条数据的清晰有理数均值,然后与匹配项比较,得出聚类结果,解决了人工标注型数据的聚类问题.将该方法在反欺诈网页领域中进行了检测和验证,并与使用同一名称但不同类型数据集的K最近邻算法进行比较,实验结果表明,该方法在反欺诈网页领域中比K最近邻算法更有效,同时也证明了新匹配聚类算法在人工标注型数据上聚类具有合理性. 尚靖博 左万利关键词:聚类 数据挖掘 基于多分类器的Deep Web入口发现 Deep Web入口发现是Deep Web数据集成的关键问题之一,本文应用主题爬行技术和本体技术,构造网页分类器(WPC)、表单结构分类器(FSC)和表单内容分类器(FCC),实现特定领域Deep Web入口表单的自动发... 王英 左万利 王鑫 彭涛关键词:本体 主题爬行 决策树 文献传递 基于隶属度的社会化网络重叠社区发现及动态集群演化分析 被引量:6 2016年 社会化网络中节点的复合属性可能为临时或过时状态,并且节点拥有一定能力维持固有状态,所以不可单纯依据新增数据或节点现有特征确定社区划分.本文提出可重叠社区发现算法及集群动态更新方案,根据网络历史数据分析节点对原始集群的隶属程度,并结合新增数据确定节点变化趋势,实现网络结构分析及社区动态更新.本文分别在不同数据集中测试聚类效果,实验结果证明算法既保持对新增数据的敏感度,也防止了节点短暂特征或节点维持固有状态的能力对划分结果的负面影响. 国琳 左万利 彭涛关键词:社会化网络 聚类 自适应算法 Deep Web查询转换研究 由于Web数据库具有自治性和异构性的特点,造成了各查询接口在内容、形式以及查询能力上都不尽相同,使得用户的查询请求受限于其给定的查询接口的表达能力,这给查询转换的准确性带来了更大的挑战。因此,对Deep Web查询转换进... 王英 左万利 王鑫 彭涛关键词:本体 查询转换 文献传递 基于本体的Deep Web查询接口集成 被引量:3 2012年 Deep Web中的海量信息只能通过查询接口访问获得,为了能够同时访问同一领域多个Web数据库,需要对多个Web数据库的查询接口进行集成.因此,引入本体技术,提出基于本体的Deep Web查询接口集成方法.Deep Web查询接口集成主要完成两个方面的工作:模式匹配与模式融合.模式匹配采用本体的"Bridge(桥接)"效应建立不同接口模式间的属性映射关系,以准确发现不同接口属性间的语义关联.模式融合根据模式匹配的结果,合并DeepWeb数据库查询接口集合中表示同一语义的属性,并尽可能地保持该领域查询接口的结构特征和属性顺序,以获得集成查询接口.通过实验分析,基于本体的DeepWeb查询接口集成方法不仅简化了模式匹配的复杂过程,而且很大程度上提高了模式集成的精度.因此,基于本体的Deep Web查询接口集成方法是高效可行的. 王英 左祥麟 左万利 王鑫关键词:本体 DEEP WEB 接口集成 基于主观Bayes方法的用户信任关系判别 被引量:2 2016年 基于主观Bayes方法的信任关系判别方法,对社会网络中的用户信任关系进行预测.该方法综合利用现有的信任关系以及用户之间的评分关系,以用户对另一用户的评分记录为证据,基于监督学习得到的规则集,通过证据合取产生对"信任"和"不信任"的量化表示,利用多值逻辑方法推测并传播用户之间的信任关系.对比实验结果表明,该方法能以较高的准确率解决社会网络中的用户信任关系预测问题. 王泊 王俊华 左万利关键词:信任关系 主观BAYES方法 社会网络 一种基于本体的文本聚类方法 被引量:13 2010年 基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释.实验结果表明,该方法有效地减少了文本特征向量的维数,提高了文本聚类效果以及聚类结果的可解释性. 朱会峰 左万利 赫枫龄 彭涛 纪文彦关键词:本体 WORDNET 基于相似度投票的社区划分改进算法 被引量:2 2018年 为快速、准确地对日益复杂的大规模社会网络进行社区划分,提出一种基于相似度投票的改进算法替代Louvain算法的底层划分,解决了Louvain算法在底层划分收敛速度较慢,并出现大量重复计算的缺点,使社区划分更迅速.由真实社会网络数据实验结果可见,与Louvain算法相比,改进算法在保持模块度基本不变的情况下,效率显著提高,划分的社区数更少、社区结构更紧凑. 冯成强 左万利 王英关键词:社会网络 模块度 免疫算法优化的大气质量评价模型及其应用 被引量:9 2011年 针对传统免疫克隆选择算法搜索精度不高的不足,提出了一种改进的免疫克隆选择算法,即引入疫苗接种策略和局部高斯变异算子的免疫克隆选择算法.在疫苗提取、选取和接种过程中引入轮盘赌选择、二进制位基因位选取和接种策略,克服了传统免疫克隆选择算法没有抗体基因交叉的现象,提高了产生优良抗体的比率;通过引入局部高斯变异算子,利用高斯变异的小步长不断地自适应调整,提高了算法的局部搜索能力.此外,算法还采用了扩大搜索空间策略,避免算法陷入局部极值,提高了算法的全局搜索能力.在此基础上,提出了基于免疫克隆选择算法的大气质量评价模型,并将其应用于大气质量评价领域.实验结果表明,该算法有效地提高了求解问题的精度和执行效率,提出的评价模型具有较好的实用性和应用前景. 韩旭明 左万利 王丽敏 时小虎关键词:免疫克隆选择算法 疫苗接种 参数优化