搜索到193篇“ 倒排文件“的相关文章
- 倒排文件页式存储方法被引量:1
- 2015年
- 页是磁盘与内存进行数据交换的基本单位,它在操作系统、数据库管理系统以及倒排文件的数据组织中占据十分重要的地位.为减少倒排索引的磁盘I/O读写开销,提出了一种倒排文件按页存储的构建方法,实现了按页读写文件.该方法主要包括磁盘I/O层设计、页管理器设计以及堆文件管理器设计三个部分,实现了页大小可变的分块式数据文件管理,支持页内定长记录、变长记录的组装以及超长数据记录的跨页存储.经实验测试,结果表明该方法是行之有效的,可以将其应用到实际的垂直搜索引擎中.
- 时亚南束文杰于国欣
- 关键词:倒排文件
- 基于分布式和倒排文件的室外大规模物体识别方法和系统
- 本发明公开了一种基于分布式处理和倒排文件的室外大规模物体识别方案,该方案预先对城市版图进行区域划分,针对每个区域采集图像、存储区域的词典、IDF权值和样本权值向量;识别时,终端将拍摄的图像和当前GPS信息打包发送给调度处...
- 王涌天桂振文陈靖刘越
- 文献传递
- 倒排文件索引缓存机制的优化被引量:3
- 2012年
- 为了有效提高搜索引擎检索服务系统的整体性能,提出了一种基于倒排文件索引的缓存机制优化方法。具体研究过程是:首先分析倒排文件缓存的体系结构和数据加载,接着讨论负载数据对倒排文件缓存和缓存替换算法的影响,最后通过设计仿真实验研究倒排文件的缓存优化。研究结果表明,采用倒排文件索引的缓存机制优化方法可以明显减少磁盘系统I/O访问次数,提高磁盘系统带宽的利用率。
- 杨晓波
- 关键词:倒排索引缓存优化负载特性
- 基于倒排文件中一种性能模型的研究
- 2012年
- 倒排文件作为现代大规模搜索引擎工作的一个核心技术,其原理简单,具备灵活高效的特点,具体体现在其根据需要可做到适当的变通。本文通过在给定搜索引擎系统内部参数的前提下对其吞吐率的研究,建立一种倒排文件性能模型,该模型有效地提高了倒排文件的运行效率。
- 陈浩
- 关键词:倒排文件搜索引擎信息检索
- 基于分布式和倒排文件的室外大规模物体识别方法和系统
- 本发明公开了一种基于分布式处理和倒排文件的室外大规模物体识别方案,该方案预先对城市版图进行区域划分,针对每个区域采集图像、存储区域的词典、IDF权值和样本权值向量;识别时,终端将拍摄的图像和当前GPS信息打包发送给调度处...
- 王涌天桂振文陈靖刘越
- 文献传递
- 倒排文件技术设计被引量:2
- 2011年
- Maze系统是基于P2P,采用集中式架构管理用户和资源的内容交换系统。文章对Maze检索系统的性能问题进行了研究,讨论检索效率的影响因素,并提出改进的方法和途径。
- 严浪
- 关键词:P2P倒排文件
- 高效的随机访问分块倒排文件自索引技术被引量:14
- 2010年
- 针对倒排索引空间开销大、查询时间效率低以及难以同时支持连接布尔查询和排序查询的问题,提出了一种同时提高空间效率与查询时间效率的高效随机访问分块倒排文件自索引RABIF.为了在降低空间消耗的同时支持连接布尔查询与排序查询,RABIF将倒排列表进行合理地分块,然后对每个子块的不同部分采用相应的压缩方式,在不需要插入任何附加辅助信息的前提下实现压缩索引的快速定位与随机访问.理论分析及实验结果表明,与忽略倒排文件自索引SIF相比,提出的RABIF空间开销平均减少5.3%,布尔查询时间平均减少17.8%;对于0.2%与1%排序查询,查询时间分别平均减少34.4%与27.5%.
- 刘小珠彭智勇陈旭
- 关键词:倒排文件
- 一种基于关键词倒排文件的移动搜索模型
- 随着3G手机网络时代的到来,移动互联网和互联网必将融合到一起,移动终端的Web搜索也已成为一个新的研究、开发领域。针对在互联网下进行移动搜索的特点,设计出一种适用于3G网的移动搜索模型。模型中,采用基于关键词倒排文件的检...
- 王远定梁久祯
- 关键词:移动搜索倒排文件网页分割WEB搜索
- 文献传递
- 基于压缩倒排文件的中文全文检索仿真系统被引量:2
- 2008年
- 探讨基于压缩倒排文件的中文全文检索技术,包括数据压缩方法、存储、检索与排名机制。借助中科院的高精度ICTCLAS中文分词系统,采用C++/STL语言仿真实现了一个中文全文检索系统。该文列出部分关键代码,利用搜狗实验室提供的数据进行实验。通过改进压缩算法,系统的磁盘利用率提高了近80%。
- 宋懿国德峰
- 关键词:中文全文检索排名
- 基于倒排文件的索引模型综述
- 1引言文本索引中一般存放着文本库词典,记录着相应索引项的出现位置及其一些统计信息。经典的索引模型包括倒排文件,签名文件,位图,PatriciaTrie等。文[9]中考察了倒排文件与签名文件在索引文本数据方面的性能,结果表...
- 孙琦牛军钰
- 关键词:INDEX
- 文献传递
相关作者
- 薛蕾

- 作品数:10被引量:46H指数:3
- 供职机构:中国农业大学信息与电气工程学院
- 研究主题:倒排文件 配电网 索引方法 散列表 系统开发
- 张晓东

- 作品数:218被引量:1,283H指数:17
- 供职机构:中国农业大学
- 研究主题:玉米 玉米果穗 玉米品种 地震 考种
- 杨庚

- 作品数:483被引量:1,547H指数:16
- 供职机构:南京邮电大学
- 研究主题:无线传感器网络 隐私保护 云计算 密文 加密
- 王宏志

- 作品数:256被引量:666H指数:15
- 供职机构:哈尔滨工业大学
- 研究主题:大数据 XML 数据库 数据质量 XML数据
- 李未

- 作品数:175被引量:439H指数:12
- 供职机构:北京航空航天大学计算机学院
- 研究主题:人工智能 移动IP 移动IPV6 逻辑系统 超协调逻辑