曲维光
- 作品数:102 被引量:393H指数:13
- 供职机构:南京师范大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金江苏省社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 基于转发图的微博事件主题摘要方法被引量:2
- 2014年
- 自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.
- 赵斌吉根林曲维光顾彦慧
- 关键词:可视化
- CLUCENE在语料库建设中的应用
- 2008年
- 深入分析了现有语料库的构建模式和语料库应具备的功能模块,提出基于文件系统和Clucene全文检索引擎工具包的语料库建设方案.实验证明,Clucene具有丰富的接口设计和良好的扩展性,为语料库建设提供了一种较好的技术实现方式.
- 贺胜曲维光卢亚军
- 关键词:CLUCENE语料库语料库建设
- 基于机器学习与语义知识的动词隐喻识别被引量:2
- 2011年
- 在自然语言中,动词的用法主要包含3种:字面、转喻和隐喻.动词的隐喻用法在隐喻的研究中占有重要的地位.动词的隐喻计算包含两个子任务:隐喻识别和隐喻理解.本文采用条件随机场、最大熵模型来识别动词的隐喻搭配,并在此基础上,加入了两种语义信:息《同义词词林》的同义词信息和《知网》的语义信息来识别动词的隐喻表达,实验识别正确率可达94.47%.
- 赵红艳曲维光张芬周俊生
- 关键词:知网同义词词林
- 词向量和语义知识相结合的汉语未登录词语义预测研究被引量:2
- 2020年
- 【目的】将词向量和语义知识相结合,提高未登录词语义预测的准确性。【方法】抓取含有未登录词网页的语料,利用Word2Vec等模型得到词语的分布式表示信息,再结合构词语义知识对候选词进行中心词和词性过滤,实现未登录词的语义预测。【结果】在人民日报语料未登录词测试集上的实验结果表明,模型预测正确率可达87.5%,高于只使用词语内部知识的模型和只使用外部分布信息的词向量模型。【局限】无法预测语义不透明的未登录词。【结论】将携带词语外部信息的词向量与词语内部特征相结合,显著提高了未登录词语义预测的正确率,说明词语内、外部信息对于语义的组成有重要作用。
- 魏庭新柏文雷曲维光
- 关键词:未登录词语义知识
- 一种基于神经网络的三维催化材料催化特性筛选系统
- 本发明公开了一种基于神经网络的三维催化材料催化特性筛选系统,包括催化剂材料浅层特性采样模块、催化剂材料结构信息嵌入模块、催化材料性质学习模块、催化材料隐层信息表示模块和催化材料多任务筛选模块,所述催化剂材料浅层特性采样模...
- 顾彦慧李亚飞顾敏卢新宇曲维光王金兰周俊生张先锋
- 文献传递
- 《论语》与其注疏文献对齐语料库的构建被引量:8
- 2012年
- 文章讲述构建《论语》与其注疏文献对齐语料库的必要性、设计思路和基本方法,并说明采用这种新途径研究《论语》的初步成果,以及该项研究在《论语》的教学和训诂学研究中所起到的巨大作用。
- 马创新陈小荷曲维光陆鹏飞
- 关键词:《论语》语料库教学
- 经典古籍注疏文献的知识网络研究与设计被引量:7
- 2013年
- 注疏文献中蕴含着丰富的知识,为了能够利用计算机分析经典古籍和注疏文献中的信息,实现知识的自动重组和聚类,分析注疏文献中存在的问题,提出使用结构化的知识表示方法组织经典古籍和注疏文献中的知识。并结合经典古籍注疏文献知识网络的基础框架结构,探讨经典古籍注疏文献知识网络中的知识组织方式和应用价值。
- 马创新陈小荷曲维光
- 关键词:古籍数字化知识网络知识表示知识组织
- 基于深度学习的中文零代词识别
- 2021年
- 针对中文零代词识别任务,提出了一种基于深度神经网络的中文零代词识别模型.首先,通过注意力机制利用零代词的上下文来帮助表示缺省的语义信息.然后,利用Tree-LSTM挖掘零代词上下文的句法结构信息.最后,利用语义信息和句法结构信息的融合特征识别零代词.实验结果表明,相对于以往的零代词识别方法,该方法能够有效提升识别效果,在中文OntoNotes5.0数据集上的F1值达到63.7%.
- 王立凯曲维光魏庭新周俊生顾彦慧李斌
- 基于仙人掌模型的动词“吃”的隐喻分类体系被引量:1
- 2009年
- 动词“吃”是一个高频性的常用词,表示动物尤其是人类的基本生理功能。本文以动词“吃”组成的短语为隐喻考察对象,通过隐喻现象的形式化描写,探求语义规律.并基于隐喻性词义生成和演变的仙人掌发展模型,尝试构建动词“吃”的隐喻体系。
- 李惠曲维光
- 关键词:隐喻
- 基于改进孪生网络结构的相似法律案例检索研究
- 针对现有的基于孪生网络结构的文档相似度计算方法大多将整个文档看成模型的输入序列,易导致数据稀疏的问题,提出利用层级注意力机制来改进孪生网络结构中的文档表示。针对基于层级注意力机制的孪生网络计算模型在输入时有可能忽略文档中...
- 李兰君周俊生顾颜慧曲维光