康为
- 作品数:5 被引量:5H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Web弱指导的本体概念实例及属性的同步提取
- 本文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,本文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选...
- 康为穗志方
- 关键词:WEB
- 文献传递
- 中文术语自动提取系统及方法
- 本发明涉及一种中文术语自动提取方法,包括以下步骤:对输入语料进行切分及频率统计,得到其中任意长度字串的候选术语频率信息;根据频率信息,利用指定的单元度算法进行计算,得到候选术语的单元度;利用领域术语词典提取术语部件,并统...
- 穗志方康为
- 文献传递
- 基于Web弱指导的本体概念实例及属性的同步提取被引量:5
- 2010年
- 该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。
- 康为穗志方
- 关键词:计算机应用中文信息处理WEB
- 中文术语自动提取系统及方法
- 本发明涉及一种中文术语自动提取方法,包括以下步骤:对输入语料进行切分及频率统计,得到其中任意长度字串的候选术语频率信息;根据频率信息,利用指定的单元度算法进行计算,得到候选术语的单元度;利用领域术语词典提取术语部件,并统...
- 穗志方康为
- 文献传递
- 概念实例自动提取方法研究与实现
- 概念是知识表示的核心要素。因此,概念的提取是知识提取中最核心的任务。如何有效地从各类资源中挖掘概念实例是知识提取研究中的一个关键问题。本文分别针对特定领域文本的概念实例提取和基于Web的概念实例提取进行了研究。
具...
- 康为