您的位置: 专家智库 > >

茹立云

作品数:41 被引量:253H指数:9
供职机构:清华大学更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 30篇期刊文章
  • 8篇会议论文
  • 2篇科技成果
  • 1篇学位论文

领域

  • 39篇自动化与计算...
  • 3篇文化科学

主题

  • 21篇用户
  • 19篇用户行为
  • 14篇用户行为分析
  • 10篇搜索
  • 9篇引擎
  • 9篇搜索引擎
  • 9篇索引
  • 8篇中文
  • 7篇日志
  • 7篇基于用户
  • 6篇计算机
  • 6篇查询
  • 5篇信息处理
  • 5篇中文信息
  • 5篇中文信息处理
  • 5篇浏览
  • 5篇计算机应用
  • 4篇信息检索
  • 4篇图像
  • 4篇排序

机构

  • 40篇清华大学
  • 5篇清华信息科学...
  • 2篇搜狐公司
  • 2篇北京搜狗科技...
  • 1篇香港城市大学

作者

  • 41篇茹立云
  • 38篇马少平
  • 31篇刘奕群
  • 23篇张敏
  • 7篇岑荣伟
  • 5篇张阔
  • 4篇金奕江
  • 4篇花贵春
  • 4篇王倩
  • 3篇方奇
  • 3篇路晶
  • 2篇唐杰
  • 2篇王灿辉
  • 2篇许丹青
  • 2篇李涓子
  • 2篇许斌
  • 2篇杨磊
  • 2篇闫兴龙
  • 2篇张静
  • 2篇刘健

传媒

  • 12篇中文信息学报
  • 6篇计算机研究与...
  • 3篇软件学报
  • 2篇模式识别与人...
  • 2篇智能系统学报
  • 2篇第五届全国信...
  • 1篇广西师范大学...
  • 1篇计算机工程与...
  • 1篇中国科技成果
  • 1篇中国图象图形...
  • 1篇计算机科学与...
  • 1篇第五届全国青...
  • 1篇全国第八届计...
  • 1篇第五届全国信...
  • 1篇全国第八届计...

年份

  • 1篇2018
  • 1篇2016
  • 1篇2015
  • 4篇2014
  • 2篇2013
  • 5篇2012
  • 5篇2011
  • 7篇2010
  • 5篇2009
  • 3篇2008
  • 2篇2006
  • 4篇2005
  • 1篇2003
41 条 记 录,以下是 1-10
排序方式:
基于伪反馈与分类的文本检索
查询空间与文档空间的不匹配是文本检索中的一大难题,在句子级别的检索中表现尤为突出。为解决这个问题而提出的查询扩展方法本身存在着难以解决的困扰。基于分类的方法绕过了这一难题,成为实现句子检索的一个可行方法。实际中使用分类方...
王灿辉茹立云张敏马少平
关键词:文本检索
文献传递
基于群体智慧的Web访问日志会话主题识别研究被引量:5
2011年
Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况。为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法。在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果。
方奇刘奕群张敏茹立云马少平
关键词:WEB访问日志
基于用户浏览图的网页质量评估方法的比较分析
面对海量繁杂的网络数据环境,网页质量评估成为互联网搜索引擎面临的主要技术挑战之一,当前针对互联网网页评估的主要研究思路是基于网络超链接结构的分析完成。然而,Web2.0、搜索引擎结果优化(SEO),网络作弊等现象的出现严...
薛宇飞刘奕群张敏马少平茹立云
关键词:PAGERANK
文献传递
面向用户互联网访问日志的异常点击分析
随着互联网用户量的爆炸性增长,用户行为分析已经成为互联网技术领域广泛应用的研究方法,如信息检索,网络安全,电子商务,广告投放等等。在这些不同的领域里,用户行为分析都有一个共同的目的:即通过用户行为日志分析来挖掘用户行为蕴...
王倩刘奕群马少平茹立云
关键词:用户行为分析
文献传递
基于用户日志挖掘的搜索引擎广告效果分析被引量:17
2008年
随着搜索引擎市场的飞速发展,竞价排名广告以其有效、低风险、灵活等特点逐渐受到中小企业用户的青睐,成为搜索引擎稳定的收益增长点。然而竞价排名广告是否会影响用户体验,从而削弱其宣传效果并且影响用户对于搜索引擎的忠实度成为了企业及搜索引擎所担忧的问题。该文从网络用户日志中挖掘出网络用户对于广告的实际交互行为,并给出了各大搜索引擎竞价排名广告方面的统计数据。对于企业用户如何更有效地利用竞价排名广告以及搜索引擎如何平衡广告的经济效益和用户体验之间的关系都有较高的指导意义。
陈磊刘奕群茹立云马少平
关键词:计算机应用中文信息处理搜索引擎用户行为分析
面向浏览推荐的网页关键词提取被引量:4
2012年
在网页浏览推荐任务中,如何利用网页内容选取合适的推荐关键词是具有挑战性的研究热点.为了实现有效的关键词推荐方法,利用大规模的真实网络用户浏览行为数据,以及相关提取算法和新词发现算法实现并比较了基于领域关键词提取技术和基于查询词候选集合的关键词推荐方法.实验结果证明,2种方法都能够有效地表征用户信息需求,而第1种推荐方法的准确率更高,具有更好的推荐性能.
闫兴龙刘奕群马少平张敏茹立云
关键词:关键词提取网页关键词
基于用户行为的长查询用户满意度分析被引量:5
2012年
搜索引擎性能评估是信息检索界一个重要课题.长查询具有较为丰富的信息内容,能更加准确地描述用户的信息需求.在此基础上文中提出长查询用户满意度分析的整体框架,定义用户满意度的概念,并在用户日志中提取相关用户行为特征,应用决策树和SVM两种分类算法评测用户满意度.在大规模商业搜索引擎日志上完成的实验结果证明了这套评价体系的有效性.结果表明,用户对于查询满意和不满意的分类准确率分别达到86%和70%.
朱彤刘奕群茹立云马少平
关键词:用户行为分析用户满意度学习算法
科技情报大数据挖掘及服务平台
唐杰李涓子张阔张静茹立云许斌
科技大数据的深度挖掘对于掌握科技发展动态,让科技成果服务于国家安全、经济发展和人民生活,占领科技信息知识服务的技术制高点具有重要意义。然而IDC和Gartner等权威机构的分析报告指出大数据中仅3%的数据包含语义标注信息...
关键词:
关键词:数据挖掘科技信息服务平台
低频查询的用户行为分析和类别研究被引量:8
2012年
低频查询是用户提交查询频次非常低的查询.它们占了搜索引擎独立查询的很大比例且对用户体验影响巨大,但由于数据稀疏性,现有的搜索引擎用户行为分析及相关研究中对低频查询涉及很少.结合前人的相关工作,使用商业搜索引擎的大规模用户日志,在会话级别上进行低频查询的用户行为分析以及类别研究.基于目标查询行为、后续相关查询行为、整体会话行为3个方面的12个特征进行了低频查询的用户行为特征分析,首次提出了低频查询类别分析框架,并进一步使用改进的AdaBoost算法对低频查询会话进行分类.实验对2000个随机的低频查询会话样例进行分类,AUC值达到了83%以上.低频查询的用户行为分析和类别研究,将为搜索引擎用户行为分析等网络检索研究提供重要基础.
姚婷张敏刘奕群马少平茹立云
关键词:用户行为日志分析
基于Boosting学习的图片自动语义标注被引量:10
2006年
图片自动语义标注是基于内容图像检索中很重要且很有挑战性的工作。本文提出了一种基于Boosting学习的图片自动语义标注方法,建立了一个图片语义标注系统BLIR(boosting for lingu istic indexing im age retrievalsystem)。假设一组具有同一语义的图像能够用一个由一组特征组合而成的视觉模型来表示。2D-MHMM(2维多分辨率隐马尔科夫模型)实际上就是一种颜色和纹理特殊组合的模板。BLIR系统首先生成大量的2D-MHMM模型,然后用Boosting算法来实现关键词与2D-MHMM模型的关联。在一个包含60 000张图像的图库上实现并测试了这个系统。结果表明,对这些测试图像,BLIR方法比其他方法具有更高的检索正确率。
茹立云马少平路晶
关键词:基于内容图像检索图像语义标注BOOSTING算法
共5页<12345>
聚类工具0