国家自然科学基金(61003031) 作品数:41 被引量:208 H指数:8 相关作者: 霍欢 彭敦陆 刘亮 徐亚 奚金金 更多>> 相关机构: 上海理工大学 复旦大学 悉尼科技大学 更多>> 发文基金: 国家自然科学基金 上海市自然科学基金 浦东新区科技发展基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
一种支持非度量空间中近似查询的索引技术 2014年 多媒体信息系统通常使用索引技术加快检索,现有索引技术绝大多数都是基于度量空间建立的,其中广泛应用度量空间的三角不等性。在非度量空间中,面向度量空间的索引技术难以快速而准确地完成检索任务。针对多媒体数据对象进行研究,发现其具有非度量空间的属性,在建立多媒体数据索引时,采用非度量空间中的计算方法使得所建索引更加有效。结合聚类和pivots技术,提出一种支持非度量空间中的对象索引结构——M+-tree。给出了M+-tree的建立、维护及采用M+-tree进行快速KNN检索的相关算法。实验表明,M+-tree在检索性能和检索效果上比现有的非度量空间的索引结构具有明显优势。 彭敦陆 徐文杰 霍欢 江平关键词:索引结构 树结构 聚类 基于位置的社交主题推荐模型 2016年 针对社交网络以及社交用户关注主题,分析用户所在位置,在社交网络的基础上提出主题推荐模型即location-themesocial model(LTS M odel).文章主要从三个方面进行了分析,首先对主题进行分类,运用余弦相似性算法构建向量空间主题模型.其次,在MapReduce框架下根据位置快速构建R*-tree索引,建立空间模型,在此基础上找到基于位置和主题的社交网络模型.最后,使用标准数据集对算法进行测试,并根据准确率、召回率和F1值对其效果进行评价.R*-tree索引算法采用抽样方法快速确定空间划分函数,保证了数据对象均匀地划分到各个分区.余弦相似性算法能够快速准确地找到相似主题,并且敏感识别度较强.实验证明基于LTS Model的位置—主题推荐算法(LTRA)能够快速找到满足用户兴趣的主题并进行推荐. 王艳冰 彭敦陆 邹萌萍关键词:LTS MODEL MAPREDUCE 一种在矩阵空间中识别文本蕴涵的动态交互网络 2019年 针对文本蕴涵问题提出一种动态交互网络(dynamic interactive network,DIN)进行识别。不同于已有交互模型,DIN将两句词向量投射到二维矩阵空间中进行交互,然后利用输出矩阵为同时处理上下文信息和控制信息流动的GRU编码器生成动态权重。前者通过更高阶形式的信息交互挖掘深层逻辑片段,后者通过改变交互信息与上下文信息的结合模式帮助编码器有效区分两者的重要性差异。模型在SNLI测试集上获得了88.0%的识别准确度,超过已有的最佳模型,且使用的训练参数仅为它的一半。 霍欢 刘亮关键词:交互网络 矩阵空间 领域文本信息抽取中的短语相似度计算方法 被引量:1 2017年 随着信息化的深入发展,各应用领域积累了大量采用半结构化方式记录的文本数据。为了快速有效地从大规模面向领域的半结构化文本中抽取有用信息,信息抽取技术应运而生。文本信息抽取的核心算法之一是计算词或短语的相似度,针对面向领域的半结构化文本中的中文短语相似度计算,先采用模式匹配算法从原始半结构化文本中抽取中文短语,然后结合领域语义依存关系,对基于公共子串的短语相似度计算方法进行改进,以此提高短语相似度计算的可靠性。实验结果表明,所提算法具有较好的计算效果。 沈洁 彭敦陆基于非盲去模糊算法的图像复原 2014年 在图像复原中,对降质图像失真的点扩散函数求逆是研究难点之一。现根据先验概率将贝叶斯理论的函数关系化,提出遗传算法的种群繁殖模型,通过逐步演化来执行变换、调整和集成。同时,为了获取更高效的效果,构建Jenkins持续集成平台进行集成和测试模型参数。最后,从决策支持系统的角度阐述整个系统的框架。 朱侃逸 霍欢 龚如宾 徐亚 奚金金关键词:贝叶斯理论 遗传算法 决策支持系统 一种针对句法树的混合神经网络模型 被引量:4 2017年 在多数神经网络模型仍然将目光放在顺序结构上时,近期出现的两种基于句法树的模型TreeLSTMs和TBCNNs由于加入了结构信息而在多个自然语言处理任务上表现出色。考虑到TreeLSTMs因计算空间关联性使其训练效率不高,该文提出一种针对句法树的混合神经网络模型,借助TBCNNs的树卷积和池化方法实现了类似TreeLSTMs的计算,故将此模型命名为Quasi-TreeLSTMs。该文在依存树和支持树上分别构建了模型的两种版本Dependency Quasi-TreeLSTMs和Constituency Quasi-TreeLSTMs,实验结果表明,在情感分类和语义相似性两类任务上Quasi-TreeLSTMs表现优异。 霍欢 张薇 张薇 刘亮关键词:句法树 并行性 混合模型 面向DBWorld数据挖掘的学术社区发现算法 被引量:3 2017年 针对传统社区发现算法多数是基于单一关系的同构学术社会网络,而包含多种关系的异构学术网络社区发现算法还不多的情况,提出一种基于FCM(fuzzy C-means)和结构洞的学术社区发现算法——HAFCD算法。从构建基于DBWorld邮件数据的异构学术网络出发,通过分析异构网络中的多种关联关系和节点内容的相似性,提出改进的语义路径模型,计算评审人间的相似度。基于此,该算法根据结构洞越少、网络闭合性越高这一事实,将结构洞理论融入FCM算法进行异构学术社区发现。通过与现有的谱聚类和路径选择聚类算法进行实验比较表明,该算法具有较好的计算效果。 高苌婕 彭敦陆关键词:异构网络 相似度 ZDC-tree:一种支持面向数据流Skyline查询的高效索引结构 2013年 数据流上的Skyline查询是近年来数据管理与数据挖掘领域的研究热点.该文针对数据流场景下基于滑动窗口Skyline查询问题,采用基于剪枝策略和分而治之思想,并结合Z-order曲线的性质,提出一种可以在一个分支上进行查询和更新操作的ZDC-tree索引结构,并给出可有效维护Skyline查询计算的ZDCSK算法.算法采用自底向上的方式,归并递归返回Skyline结果集,具备较好的Skyline查询效率.论文从理论和实验上证明了在ZDC-tree上进行Skylike查询的高效性、稳定性及可扩展性. 彭敦陆 衣少君 段凯 霍欢关键词:SKYLINE计算 剪枝策略 数据流 一种应用于填空型阅读理解的句式注意力网络 被引量:3 2019年 机器阅读理解是针对问题、文章、答案这个元组的建模问题,目的是根据问题中的关键词和关键词间的关系,给出问题答案.本文研究填空型阅读理解中候选答案与问题句式结构的对齐问题,提出一种基于注意力机制的序列学习模型,句式注意力网络SAN.首先,SAN的词嵌入层后添加一个前向GRU网络实现问题对文章句子的全局筛选,缩小候选文章内容范围.之后参照问题与文章句子的内容与结构确定答案,使用句式注意力结构对文章与问题进行实体对齐,再依据实体间的相似性获取问题答案.实验通过人工数据集Children's BookTest进行验证,结果表明SAN模型回答问题的准确程度和速度都比AOA模型好. 霍欢 邹依婷 周澄睿 薛瑶环 黄君扬 金轩城数据耕耘技术支持下的大规模驾驶行为数据分析仿真技术 被引量:1 2016年 大数据相关问题已成为当今数据科学领域的研究热点,在研究中需要有足够多的数据来验证相关研究成果.由于各种条件限制,研究人员难以得到足够体量的源数据,给研究带来了很大的困难.论文运用数据耕耘技术研究出一种用于大数据系统仿真的方法.该方法首先对被研究对象属性特征进行分析,确定属性之间的依附关系.然后选择合适的数据耕耘方法建立仿真系统,最后对仿真系统进行验证,并以大规模驾驶行为数据分析为例,说明如何利用该技术建立大数据分析及仿真的过程. 王磊 彭敦陆关键词:数据耕耘 大数据 仿真系统 驾驶行为