李征宇
- 作品数:84 被引量:73H指数:4
- 供职机构:沈阳建筑大学更多>>
- 发文基金:辽宁省自然科学基金国家自然科学基金住房和城乡建设部科学技术计划项目更多>>
- 相关领域:自动化与计算机技术经济管理文化科学理学更多>>
- 一种基于云架构的Deep Web数据挖掘及应用系统
- Deep Web网站中包含了海量有价值的结构化数据,通过对Deep Web数据挖掘,可以实现Web数据的增值应用,但是,Web数据挖掘是十分耗费计算资源和网络资源的活动;基于云架构的Deep Web结构化数据抽取与应用服...
- 韩子扬李征宇杜利明孙平
- 关键词:网络资源数据挖掘云计算调度算法
- Web数据集成中缺失数据处理方法研究
- 2021年
- 数据预处理是web数据集成中的一个重要步骤,修复缺失数据是数据预处理的重要组成部分。在web数据集成中修复缺失数据的关键问题是缺失点没有可直接提供参考的观察值,这导致用户不能使用估算和推理的方法,只能依靠有经验的用户或领域专家通过制定规则才能填充数据。然而,对于具有成千上万个缺失点的大型数据库,由用户理解数据并制定有效的填充规则是不可行的。因为在修复缺失数据时,用户需要了解哪些候选子集对缺失点填充概率和覆盖程度最大。然而,给用户推荐填充概率和覆盖程度最大的候选子集计算量非常大。为了解决这个问题,本文提出了一种基于信息熵的生成候选子集算法,通过用户对初始候选子集的编辑,使用该算法计算出缺失点填充概率和覆盖程度最大的候选子集。通过用户选择的候选子集并依据数据集中一对多的关联关系生成并推荐缺失点覆盖程度更高的规则,并将用户选择的规则通过数据集中一对多的关联关系泛化至更多的缺失点中。经过原型系统实现结果表明,用该方法修复的数据具有较高的精度,同时,实验表明普通用户在短时间内便可修复大量缺失数据,有效地提高了数据修复的效果。
- 袁辉英李贵李征宇韩子扬曹科研
- 关键词:数据预处理WEB数据集成信息熵
- 一种基于树模型的关联实体解析方法
- 2021年
- 在大数据时代,Web数据呈现多样性和关联性,在实体解析(Entity Resolution)中体现为解析的数据集往往包含多个实体集,实体集之间具有关联关系。这种关系导致解析一个实体集的结果可以使另一个实体集的解析受益,这种具有关联关系的实体解析称为关联实体解析(Related Entity Resolution)。本文针对一对多类型关联实体的实体解析问题提出了关联树模型,并引申出相似节点、相似树、相似性传递等概念。我们提出了一种基于树的一对多关联实体解析方法。初始时依据关联实体的关联关系构建关联树;将本节点的属性相似度和关联子节点的部分属性相似度结合起来判断节点是否匹配;基于深度优先原则遍历关联树的每一个节点,依据节点的实体解析结果筛选出满足相似传递性的部分子节点,在遍历完叶子节点的过程中,生成部分相似子树,再对根节点的子节点集中节点进行相似匹配,寻找其他相似子树。本文提出一种相似树索引来表示关联树的匹配结果。用房地产大数据通过实验验证文中提出的关联树搜索算法比已有的关联实体识别算法在一对多关联实体上效率更高。
- 王泽龙李贵李征宇韩子扬曹科研
- 加气混凝土木框板
- 本项实用新型提供一种加气混凝土木框板,木底梁、木顶梁、木侧柱围成矩形的木外框;在木外框内部设置横纵交错的竖向加强筋、水平加强筋;在木外框内浇筑内填加气混凝土;木侧柱与转角加强连接板的木侧柱、转角加强木板连接,连接方式优先...
- 张延年李征宇汪青杰丁晓雯
- 电商直播平台行为用户群体画像研究——以蘑菇街直播为例被引量:3
- 2021年
- 为电商直播平台更精细运营提供建议。以蘑菇街电商直播间动作用户作为研究对象,通过爬虫程序,获取直播间截图、分享、加购物车、加关注、弹幕、时间等和动作用户个人主页的粉丝数、关注数、种草力数、身高、体重等,提出并使用二次聚类的群体画像方法。结论表明该平台存在9类典型群体,对聚类中心点对比,识别各群体特征,提出精准运营策略和建议。
- 丁文文李征宇李贵
- 基于分布式结构的Deep Web结构化数据抽取系统
- Deep Web网站提供了大量的专业领域数据,单机系统抽取Deep Web数据效率低,抽取周期长,不能保证数据的时效性;本文提出了一种基于分布式结构的Deep Web结构化数据抽取系统,采用服务器/客户端架构搭建系统,设...
- 韩子扬李贵李征宇王凤英
- 关键词:分布式任务调度
- 一种地热管线定位板
- 一种地热管线定位板,在基板板体上均布设有若干地热管线定位片,其一端固连于基板板体上,另一端为自由端;在基板板体上均布设有若干基板定位齿,其齿根端固连于基板板体上,其齿顶端为自由端。地热管线定位板的使用方法步骤为:将基板上...
- 张延年李征宇汪青杰李希
- 分布对象管理的联邦交易模型被引量:1
- 2007年
- 分布对象管理是实现分布对象互操作的一个重点。该文通过扩展ODP中的基本交易模型,实现了对象服务的局部管理,提出了一种新的联邦交易模型,使用联邦交易空间和信任度的概念实现了大规模互操作环境中的对象服务的全局管理,给出了分布对象服务的联邦搜索过程和联邦搜索规则,以及联邦查询的最佳搜索路径选择算法,研究并提出了联邦交易的实现结构模型和建立联邦和约的协商协议。
- 李贵李征宇韩子阳栾方军王国仁
- 关键词:信任度
- 基于XML和本体的城市住宅信息集成研究
- 2013年
- 针对目前城市住宅信息现状,提出了一种基于XML和本体的城市住宅信息集成架构。通过本体全局映射表和局部映射表解决了XML集成模式在语义上的不足。该方法增强了城市住宅信息系统建设的可维护性和可扩展性。
- 李征宇孙平高春阳
- 关键词:XML本体数据集成
- 基于概率模型的个性化推荐
- 个性化推荐正成为当前Web推荐领域中主要研究问题之一,针对个性化推荐,利用特征匹配方法建立匹配概率模型,计算用户与每个物品之间的相关性概率。然后根据个性化推荐的排名策略,对用户与每个物品的相关性概率值进行排序,生成用户的...
- 李贵王雪李征宇韩子扬孙平
- 关键词:特征向量个性化推荐