吴桂兴
- 作品数:14 被引量:15H指数:2
- 供职机构:中国科学技术大学软件学院更多>>
- 发文基金:江苏省自然科学基金江苏省科技厅基金苏州市科技计划项目(应用基础研究计划)更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 基于介词向量的英语真词错误检查算法
- 2015年
- 在基于Winnow算法的基础上引入混淆词和介词搭配的方法.首先通过混淆集获得训练集,对训练集进行预处理后利用文本特征提取方法获得特征词集,然后对特征词集进行Winnow训练得到带有权重的特征词集并把出现在混淆词后的介词提取出来生成介词向量,最后从测试集提取特征并进行结合Winnow算法和混淆词与介词搭配方法的测试得到真词错误检查的结果.混淆词与介词搭配方法的加入使得某些混淆词的正确率、召回率以及F1测度提高了10%~20%,有的甚至提高到了100%.
- 霍娟娟吴敏吴桂兴郭燕陈朝才杜一民
- 关键词:介词WINNOW
- 一种基于加密域可逆水印的H.265视频认证加密方案
- 2017年
- 轻量级视频加密技术和近年来兴起的加密域可逆水印技术为视频的认证加密提供了新的技术支撑,但现有的加密域可逆水印技术大多数局限于静态图像,而视频的认证加密不能直接使用传统静态图像的数字水印方案。在此背景下,提出一种加密域可逆数字水印方案,并利用它实现视频的认证加密。该方案基于H.265/HEVC视频编码标准,通过在DCT域对变换系数进行操作,能够把加密和可逆水印嵌入进行分离,进而可以实现在已经加密的视频中可逆地嵌入消息认证码(Message Authentication Code,MAC),最终同时实现内容安全性保护与完整性认证。实验表明该方案不仅能在加密的视频中嵌入可逆水印,还能对视频的篡改进行定位。
- 项煜东吴桂兴
- 关键词:视频加密认证加密
- 基于回归模型的中央监控平台设计与实现
- 2024年
- 中央监控平台是一个以数据为中心的服务器保护平台。该平台通过组合服务器上的哨兵来防止数据免受泄露和攻击,同时对系统的运行状态进行全面的监测。通过数据分析,并运用数理统计的方法,在可提供的计算力与系统资源利用率之间建立线性回归模型。该模型解释了在某一资源消耗状态下,系统可提供的计算力估算值,在可允许误差为0.1的情况下,其准确率可以达到97%以上,为当前系统运行状态做出精准的评估。
- 张国经吴桂兴黄婷
- 关键词:TPM
- 基于最大熵模型的冠词错误纠正系统
- 2015年
- 研究了英语语法中冠词错误的计算机自动纠正.首先对冠词使用的错误进行定义分类,并考虑到可能出现冠词缺失的情况,通过采用基于最大熵模型的分类器,选择包含上下文、上下文词性、短语结构等特征,在训练集上进行模型预的训练,然后使用模型对于输入句子进行预测并纠正存在的使用错误.在NUCLE语料的实验中,给出了语料处理、模型特点、训练语料的大小对于测试集效果的影响,并且比较了自然语言处理中非常通用的朴素贝叶斯模型的结果,还根据英语语法中存在的错误特点对模型进行改进,最后在测试数据达到35.48%的F值,相较于CoNLL2013的shared task中最好结果有小幅提升.
- 陈朝才吴敏吴桂兴郭燕
- 关键词:最大熵模型
- 工程硕士“可编程器件应用”课程的教学探索
- 2015年
- 随着可编程技术的发展,可编程器件的应用越来越广泛,对人才的需求也越来越迫切。"可编程器件应用"课程已成为电子信息类课程体系的重要组成部分。结合工程硕士的特点,从合理安排教学内容、灵活组织教学过程和分层次设计实验环节三方面,探讨工程型人才培养过程中提高教学质量的途径。
- 袁宇丹吴桂兴李曦
- 关键词:可编程器件FPGA
- 基于大语言模型的命名实体识别被引量:1
- 2024年
- 虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现,但其在序列识别任务,如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型.针对这一点,本文探究性的通过将现有的中文命名实体识别问题改造成机器阅读理解问题,提出并设计了基于情境学习和模型微调的新方法,使NLG语言模型在识别命名实体达到了更好的效果,并且该方法不同于其他方法需要改变基层模型的预训练参数.同时,由于命名实体是模型生成的结果而不是对原始数据的分类,不存在边界问题.为了验证新框架在命名实体识别任务上的有效性,本文在多个中文命名实体识别数据集上进行了实验.其中,在Resume和Weibo数据集上的F1分数分别达到了96.04%和67.87%,相较于SOTA模型分别提高了0.4和2.7个百分点,从而验证了新框架能有效利用NLG语言模型在文本生成上的优势完成命名实体识别任务.
- 叶名玮汤嘉郭燕吴桂兴
- 关键词:命名实体识别情境学习
- 基于最大熵模型的介词纠错系统
- 2016年
- 英语介词纠错系统,针对英语学习者英语语言中常见的介词错误进行计算机自动纠正.首先,对标注过得语料库中介词错误进行了分类统计,总结出21种常见介词,在英语wiki语料库中利用计算机自动错误插值算法获得训练集合.然后在训练集合基础之上,通过使用基于最大熵模型的分类器,选择了包括上下文、介词补足语等特征,在训练集上进行模型的训练,最后使用模型对于输入句子进行预测并纠正存在的使用错误.在NUCLE语料的实验中,给出了语料处理、模型特点、训练语料的大小、迭代次数对于测试集效果的影响,并且比较了朴素贝叶斯模型的结果,最后在测试数据达到27.68的F值,相对于Co NLL2013的shared task中最好结果有小幅提升.
- 李悦吴敏吴桂兴郭燕
- 关键词:最大熵模型
- 基于层次语言模型的英语动名词搭配纠错策略被引量:1
- 2017年
- 搭配的正确使用是区分地道英语使用者和普通学习者的一个重要特征.通过分析中国英语学习者语料库(CLEC),可以发现动名词搭配错误是英语学习者易犯的错误.本文提出一种可用于纠正英语学习者动名词搭配错误的层次语言模型.该语言模型考虑到了句子内部词语之间的依赖关系,将句子处理为不同的层次的子句,同一个句子内部的单词高度相关,不同子句内的单词相关性弱.该语言模型对于句子成分的变化得到的结果更加稳定,而且搭配信息得到浓缩,得到的语言模型更加精确.本文将模型用于生成分类器特征和结果排序.这种层次语言模型应用到英语动名词搭配的检错纠错中,对比传统语言模型,会有更好的效果.
- 李灿润吴桂兴吴敏
- 基于骨架模态的多级门控图卷积动作识别网络被引量:1
- 2022年
- 人类动作识别是一个极具挑战性的研究课题,广泛应用于安全监控、人机交互和自动驾驶等领域。近年来,图卷积网络在建模非欧几里德结构数据上取得了巨大成功,为骨架模态动作识别提供了新思路。由于骨架预定义图包含大量噪声,现有方法多使用高阶空域特征对空间依赖性进行建模。然而,仅关注高阶子集并不能在全局上反映顶点之间的动态相关性。此外,主流方法中模拟时间依赖性使用的卷积神经网络或循环神经网络也无法捕获多范围的时序关系。为了解决这些问题,文中提出了一种基于骨架模态的多级门控图卷积动作识别网络框架。具体地,提出了门控时序卷积模块来提取时域顶点之间的多时期依赖关系;同时,通过多维注意力机制来增强图的全局表征。为了验证所提方法的有效性,在NTU-RGB+D和Kinetics两个大型视频行为识别基准数据集上进行了实验。结果表明,所提方法的性能优于目前最先进的方法。
- 干创吴桂兴詹庆原王鹏焜彭志磊
- 关键词:视频分类计算机视觉
- 一种解决英语动名词搭配错误的模型被引量:2
- 2016年
- 英语学习者易犯动名词搭配错误。通过分析CLEC中的动名词搭配错误,提出一种纠正中国学习者的动名词搭配错误的模型。首先构建了一个动名词搭配库,接着提出了一种度量搭配间的相似度的方法,通过计算目标搭配和搭配库的相似度得到粗略的相似搭配集,使用分类的方法过滤掉相似搭配集中不能将测试句划为正确类的搭配,得到候选结果集,最后使用语言模型对候选结果集打分排序,得到最终的纠正建议。在使用BNC构造的测试集上,这种综合相似性推理和上下文特征的方法对动名词搭配纠错具有显著效果。
- 杜一民吴桂兴吴敏
- 关键词:搭配错误语言模型