您的位置: 专家智库 > >

房俊华

作品数:7 被引量:16H指数:3
供职机构:华东师范大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 1篇学位论文

领域

  • 7篇自动化与计算...

主题

  • 4篇分布式
  • 3篇数据流
  • 2篇闪存
  • 2篇闪存数据库
  • 2篇数据库
  • 2篇索引
  • 2篇索引结构
  • 2篇分布式计算
  • 2篇高性能
  • 1篇影响因素
  • 1篇容错
  • 1篇容错机制
  • 1篇实时数据
  • 1篇实时数据处理
  • 1篇数据处理
  • 1篇数据划分
  • 1篇数据流处理
  • 1篇通信
  • 1篇通信数据
  • 1篇自适

机构

  • 4篇华东师范大学
  • 3篇贵州大学

作者

  • 7篇房俊华
  • 3篇张蓉
  • 2篇王翰虎
  • 2篇马丹
  • 2篇陈梅
  • 2篇王晓桐
  • 1篇张小平
  • 1篇周傲英
  • 1篇林维勇

传媒

  • 2篇华东师范大学...
  • 1篇计算机应用与...
  • 1篇计算机应用
  • 1篇软件学报
  • 1篇微型机与应用

年份

  • 2篇2017
  • 1篇2016
  • 1篇2014
  • 2篇2013
  • 1篇2012
7 条 记 录,以下是 1-7
排序方式:
分布式数据流系统中负载均衡技术研究
随着人们对大数据潜在价值的重视,数据分析的实时性在实际应用中发挥着越来越重要的作用。实时流式大数据的典型代表如3G/4G通信流数据、网络监控数据、传感器数据等。Twitter的推文产生速度为10万条/分钟;上海电信客户数...
房俊华
关键词:负载均衡矩阵模型容错机制
分布式数据流上的高性能分发策略被引量:4
2017年
随着大数据应用的普及,高效可扩展的数据流操作在实时分析处理中扮演着越来越重要的角色.分布式并行处理架构是应对大流量、低延时数据流处理任务的一种有效解决方案.然而在Key-based分组并行处理中,由于数据的倾斜分布及数据流本身的实时、动态和数据规模不可预知等特性,使得数据流分布并行处理系统存在持续且动态负载不均衡现象,这会造成系统时效性降低、硬件资源浪费等问题.现有的研究工作处理均衡负载有两种方案:(1)基于key粒度的迁移,使得并行处理节点负载达到均衡;(2)基于元组粒度级别的拆分,采用随机分发使系统均衡.前者将系统调整至给定的均衡容忍范围内,类似于一维装箱的NP问题;后者对key的拆分势必带来新的为维护Key-based操作的正确性而增加的额外代价,如内存及网络通信成本.综合两种方法,提出对key按需拆分、尽量合并的方法,通过轻量级均衡调整算法以及保证Key-based操作特性的拆分方法,使系统既能达到后者的均衡,又能减少细粒度均衡所带来的额外代价.
房俊华王晓桐张蓉周傲英
关键词:分布式数据流
支持通信数据查询分析的分布式计算系统被引量:1
2014年
本文详细介绍一种基于分布式内存的通信数据管理平台,可以有效支持针对通信数据的实时处理以及在线查询分析任务.首先,通过对分布式技术、内存技术进行分析,依据通信业务的特点进行技术选型;然后,基于高性能的分布式内存计算环境,设计、实现针对通信数据的实时处理与在线查询分析平台;最后,利用内存技术对平台实现方案进行技术优化.实验结果表明,基于内存的分布式计算系统在查询响应速度、实时数据处理效率、系统资源利用率以及数据吞吐量上较基于硬盘的系统较大的性能提升.
晁平复郑芷凌房俊华张蓉
关键词:分布式系统实时数据处理
分布式可扩展数据流连接算法
2016年
Join-Matrix是一种高性能的连接矩阵模型,方便部署于分布式环境下,支持任意连接谓词的数据流连接操作.由于采取随机分发元组作为路由策略,Join-Matrix可利用对元组内容的不敏感性来有效抵御数据倾斜.为了实现工作节点的负载均衡以及网络传输代价的最小化,基于连接矩阵模型设计一种高效的数据划分方案尤为重要.针对数据流连接处理,本文设计并实现了一种新颖的连接算子,可灵活地进行划分方案的自适应调整,以应对实时动态变化的数据分布.具体来说,我们根据数据流流量的采样信息和系统额定负载,通过一个轻量级的决策器制定出一个数据划分方案和相应的数据迁移计划,在保证输出结果完整性与正确性的情况下,实现迁移代价的最小化.本文在多种不同的数据集上进行了大量对比实验,结果证明,在资源利用率、系统吞吐率与时间延迟等方面,该连接算子较对比系统具有更高的性能体现.
王晓桐房俊华张蓉
关键词:数据划分分布式计算
DB-Tree:一种高性能的闪存数据库索引结构被引量:5
2013年
闪存性能的优势使得闪存数据库系统成为目前研究的一个热点,索引是提高闪存数据库效率的一个重要手段。基于B+树索引结构,提出一种适用于闪存数据库的索引方法:DB-Tree。该方法将更新操作以一棵"伪B+树"的结构形式存储来避免检索时扫描整个更新日志区;以分支合并的方式使更新操作有针对性地聚集于闪存页;引入更新缓冲区大小及合并频率的自适应机制使闪存数据库适用于不同的读写负载。通过与经典的日志更新IPL B+TREE及无日志的μ-Tree索引方法的实验比较,证明所提出的DB-Tree在有效降低更新代价的同时大幅度提高了索引的查询性能。
房俊华王翰虎陈梅马丹
关键词:闪存数据库索引结构
一种具有自适应机制的闪存数据库索引结构被引量:2
2013年
针对闪存数据库系统索引技术中基于日志更新策略存在的检索效率低、日志空间分配不合理及合并带来的高昂更新代价等问题,提出一种具有自适应机制的索引结构LM-B+TREE。LM-B+TREE将索引的更新缓冲页映射于传统B+TREE的相应节点,并根据闪存索引的读写负载及读写代价差异,动态地分配缓冲更新区,自适应地调整索引架构。实验证明LM-B+TREE能够动态地调整索引架构来适应索引的读写负载代价,在减少索引更新代价的同时,有效地提高了索引的查询性能。
房俊华王翰虎陈梅马丹
关键词:闪存数据库索引结构自适应机制
基于改进灰关联分析的专利影响因素评估模型
2012年
采用改进的灰关联分析方法,构建了专利发展影响因素评估模型。研究并发现对贵州省专利发展影响较大的因素,为相关部门或人员决策提供了科学的参考依据。
林维勇张小平房俊华
关键词:灰关联分析影响因素
共1页<1>
聚类工具0