张润延
- 作品数:3 被引量:3H指数:1
- 供职机构:厦门大学更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于混合方法的中文命名实体识别
- 本文针对四种主要的命名实体,即人名,地名,组织名以及时间表达式,进行研究,介绍了一个条件随机场(CRFs)和规则相结合的汉语命名实体识别系统。该系统融合了统计和规则两种方法,先用条件随机场模型进行词性标注,然后利用具有优...
- 陈禹史晓东向晓雯张润延
- 关键词:条件随机场
- 文献传递
- 对IRSTLM的分析和改进被引量:3
- 2008年
- 随着自然语言处理技术的发展和大规模语料库的出现,各类自然语言应用中使用的语言模型规模也越来越大。IRSTLM①在训练语言模型时采用了划分词典分块训练快速合并的方式,从而在训练大规模语料时取得了优异的性能。但它受限于训练方式,难以估算精确概率。本文在分析和重实现IRSTLM的基础上提出了一种方法,可以用来修正合并后的语言模型。在机器翻译上的实验表明,该方案有助于改进生成的语言模型的质量。同时,本项实验还填补了java平台上语言模型训练和使用工具的空白。
- 张润延史晓东陈毅东
- 关键词:语言模型机器翻译JAVA
- 海量语言模型的研究及其在机器翻译中的应用
- 近年来,随着自然语言处理技术的发展和大规模语料库的出现,各类自然语言应用中使用的语言模型规模也越来越大。机器翻译是大规模语言模型的主要应用领域之一,语言模型有助于机器翻译时选择更符合目标语言习惯的翻译项,研究结果表明,语...
- 张润延
- 关键词:统计语言模型机器翻译
- 文献传递