何盈捷
所属机构: 中国人民大学信息学院 所在地区: 北京市 研究方向: 自动化与计算机技术 发文基金: 国家自然科学基金
相关作者
王珊 作品数:303 被引量:3,223 H指数:27 供职机构:中国人民大学 研究主题:数据库 OLAP 内存 数据仓库 查询处理 冯月利 作品数:4 被引量:8 H指数:2 供职机构:中国人民大学信息学院 研究主题:TOP-K查询 P2P环境 PEER-TO-PEER POSTGRESQL 中文分词 刘惟一 作品数:109 被引量:248 H指数:8 供职机构:云南大学 研究主题:贝叶斯网 不确定性 遗传算法 图模型 数据库 文继军 作品数:6 被引量:56 H指数:2 供职机构:中国人民大学信息学院 研究主题:TOP-K查询 关键词查询 关系数据库 信息检索 基于关键词 杜小勇 作品数:246 被引量:2,605 H指数:28 供职机构:中国人民大学 研究主题:大数据 数据库 本体 关系数据库 领域本体
Peer-to-Peer环境下基于内容的智能搜索 目前大多数P2P系统只支持基于文件标识的搜索,大大限制了P2P的应用范围.纯P2P网络所采用的广播式搜索盲目低效,浪费网络带宽.提出了P2P环境下基于内容的智能搜索算法.利用向量空间模型进行基于相似度的查询.结点对以往的... 何盈捷 冯月利 王珊关键词:P2P 相似度 聚类 智能搜索 文献传递 SQL实现Bayesian网的不确定性推理 被引量:5 2001年 不确定性推理是人们常用的一种推理 ,Bayesian网是进行不确定性推理的有力工具 .提出了扩展关系模型 ,并在扩展关系模型中用SQL(结构询问语言 ) 何盈捷 刘惟一关键词:BAYESIAN网 扩展关系模型 SQL 从DTD映射到关系模式:一种保持数据依赖的映射方法 被引量:30 2004年 XML正迅速成为互联网上数据表示和交换的标准 用关系数据库存储XML数据是XML存储策略之一 为了将XML数据存储到关系数据库中 ,人们研究了从DTD到关系模式的映射方法 提出了一种保持数据依赖的映射方法PDD 与已有的Shared Inlining方法相比 ,PDD方法充分考虑了DTD蕴涵的数据依赖关系 ,保证了XML文档的完整性 通过对泛关系进行模式分解 ,得到的关系模式保持函数依赖 ,并且满足 2NF 可以证明 。 何盈捷 王珊关键词:XML DTD 关系数据库 函数依赖 纯Peer to Peer环境下有效的Top-k查询 被引量:35 2005年 目前大多数的Peer-to-Peer(P2P)系统只支持基于文件标识的搜索,用户不能根据文件的内容进行搜索.Top-k查询被广泛地应用于搜索引擎中,获得了巨大的成功.可是,由于P2P系统是一个动态的、分散的系统,在纯的P2P环境下进行top-k查询是具有挑战性的.提出了一种基于直方图的分层top-k查询算法.首先,采用层次化的方法实现分布式的top-k查询,将结果的合并和排序分散到P2P网络中的各个节点上,充分利用了网络中的资源.其次,根据节点返回的结果为节点构建直方图,利用直方图估计节点可能的分数上限,对节点进行选择,提高了查询效率.实验证明,top-k查询提高了查询效果,而直方图则提高了查询效率. 何盈捷 王珊 杜小勇关键词:P2P网络 TOP-K查询 搜索 直方图 P2P环境下数据管理系统上的Top-k查询 被引量:2 2005年 目前大多数P2P系统只提供文件的共享,缺乏数据管理能力。基于关系数据库上的关键搜索,本文提出了一种在P2P环境下共享数据库的新框架,其中每个节点上的数据库被看成是一个文档集,用户不用考虑数据库的模式结构信念,简化了不同节点数据库模式间的映射过程,能更好地适应P2P的分散和动态特性。将基于直方图的分层Top-k查询算法扩展到P2P环境下的数据库管理系统上,文档集和数据库的查询被统一起来,一致对待。在查询处理期间,直方图可以自动更新,同时根据查询结果,邻居节点可以自调整,具有自适应性。实验结果表明,基于关键词的数据库共享突破了传统的数据库共享模式,简化了数据访问方式,而基于直方图的Top-k查询算法提高了查询效率。 何盈捷 文继军 冯月利 王珊关键词:数据库共享 关键词查询 TOP-K查询 P2P系统 数据管理系统 数据库共享 由Markov网到Bayesian网 被引量:24 2002年 Markov网 (马尔可夫网 )是类似于 Bayesian网 (贝叶斯网 )的另一种进行不确定性推理的有力工具 .Markov网是一个无向图 ,而 Bayesian网是一个有向无环图 .发现 Markov网不需要发现边的方向 ,因此要比发现Bayesian网容易得多 .提出了一种通过发现 Markov网得到等价的 Bayesian网的方法 .首先利用信息论中验证信息独立的一个重要结论 ,提出了一个基于依赖分析的边删除算法发现 Markov网 .该算法需 O(n2 )次 CI(条件独立 )测试 ,CI测试的时间复杂度取决于由样本数据得到的联合概率函数表的大小 .经证明 ,假如由样本数据得到的联合概率函数严格为正 ,则该算法发现的 Markov网一定是样本的最小 I图 .由发现的 Markov网 ,根据表示的联合概率函数相等 ,得到与其等价的 何盈捷 刘惟一关键词:MARKOV网 BAYESIAN网 人工智能 基于边界的Markov网的发现 被引量:2 2001年 Markov network ts an another powerful tool besides Bayesian network which can be used to do uncertain inference. A method of learning Markov network automaticly from mass data based on boundary has been discussed in this paper. Taking advantage of an important conclusion in information theory ,we present an efficient boundary based Markov network learning algorithm. This algorithm only demands O(N2) times CI (conditional independence) test. We prove if the joint probability is strictly positive,then the found Markov network must be the minimal I_map of the sample. 何盈捷 刘惟一关键词:MARKOV网 学习算法 人工智能 多版本并发控制方法比较研究 1引言并发控制是数据库管理系统的关键技术。目前大多数商业数据库(DB2,SQL Server)的并发控制采用的是2PL(两阶段锁)协议,2PL保证了并发事务执行的可串行化。但2PL在对任何数据进行读、 何盈捷 王珊 史大治关键词:ORACLE 文献传递 基于扩展关系模型的Bayesian网的发现 首先,该文提出了两个有效 的Markov网的发现算法:基于边界的Markov网发现算法和基于扩展关系模型的Markov网发现算法.该文利用MSBN(Multiple Sectioned bayesian Network)... 何盈捷关键词:扩展关系模型 MARKOV网 文献传递 P2P环境下数据管理系统上的Top-k查询(英文) Most of existing peer-to-peer(P2P) systems only provide coarsely granular file-level sharing and lack of data ... 何盈捷 文继军 冯月利 王珊关键词:PEER-TO-PEER HISTOGRAM 文献传递