潘华山
- 作品数:6 被引量:13H指数:3
- 供职机构:昆明理工大学信息工程与自动化学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 融合实体特性的柬埔寨语命名实体识别方法
- 针对柬埔寨语命名实体的识别问题,提出一种在采用通用特征模板的基础上融合柬语实体特性的命名实体识别方法.对于时间、数字表达式等构成较固定的实体,通过人工制定规则进行识别;对于人名、地名、组织机构名等构成较复杂的实体,利用条...
- 潘华山严馨余正涛郭剑毅
- 关键词:柬埔寨语命名实体识别条件随机场
- 文献传递
- 基于层叠条件随机场的高棉语分词及词性标注方法被引量:2
- 2016年
- 针对高棉语分词及词性标注问题,提出一种基于层叠条件随机场模型的自动分词及词性标注方法。该方法由三层条件随机场模型构成:第一层是分词模型,该模型以字符簇为粒度,结合上下文信息与高棉语的构词特点构建特征模板,实现对高棉语句子的自动分词;第二层是分词结果修正模型,该模型以词语为粒度,结合上下文信息与高棉语中命名实体的构成特点构建特征模板,实现对第一层分词结果的修正;第三层是词性标注模型,该模型以词语为粒度,结合上下文信息与高棉语丰富的词缀信息构建特征模板,实现对高棉语句子中的词语进行自动标注词性。基于该模型进行开放测试实验,最终准确率为95.44%,结果表明该方法能有效解决高棉语的分词和词性标注问题。
- 潘华山严馨周枫余正涛郭剑毅
- 关键词:高棉语层叠条件随机场分词词性标注
- 基于条件随机场的柬埔寨语词法分析方法研究
- 柬埔寨语词法分析是柬埔寨语信息处理的一项基础性工作,词法分析结果的好坏将直接影响柬埔寨语信息处理上层应用的效果。由于语言之间存在的差异性,传统的汉英词法分析技术无法直接移植到柬埔寨语上。为了丰富柬埔寨语词法分析的理论研究...
- 潘华山
- 关键词:柬埔寨语分词词性标注命名实体识别条件随机场
- 文献传递
- 融合实体特性的柬埔寨语命名实体识别方法
- 针对柬埔寨语命名实体的识别问题,提出一种在采用通用特征模板的基础上融合柬语实体特性的命名实体识别方法,对于时间、数字表达式等构成较固定的实体,通过人工制定规则进行识别;对于人名、地名、组织机构名等构成较复杂的实体,利用条...
- 潘华山严馨余正涛郭剑毅
- 关键词:柬埔寨语命名实体识别条件随机场
- 基于特征映射的微博用户标签兴趣聚类方法被引量:5
- 2015年
- 针对现有的用户兴趣聚类方法没有考虑用户标签之间存在的语义相关性问题,提出了一种基于特征映射的微博用户标签兴趣聚类方法。首先,获取待分析用户及其所关注用户的用户标签,选取出现频数高于设定阈值的标签构建模糊矩阵的特征维;然后,考虑标签之间的语义相关性,利用特征映射的思想将用户标签根据其与特征维标签之间的语义相似度映射到每个特征维下,计算每个特征维所对应的特征值;最后,利用模糊聚类得到了不同阈值下的用户兴趣聚类结果。实验结果表明,本文提出的基于特征映射的微博用户标签兴趣聚类方法有效地改善了用户兴趣聚类效果。
- 秦雨余正涛王炎冰石林宾潘华山
- 关键词:特征映射模糊聚类语义相似度