您的位置: 专家智库 > >

朱聪慧

作品数:116 被引量:40H指数:4
供职机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学语言文字更多>>

文献类型

  • 104篇专利
  • 11篇期刊文章
  • 1篇学位论文

领域

  • 38篇自动化与计算...
  • 12篇文化科学
  • 5篇语言文字

主题

  • 35篇翻译
  • 25篇机器翻译
  • 18篇语言
  • 18篇文本
  • 16篇向量
  • 14篇语料
  • 14篇句子
  • 13篇自然语言
  • 11篇网络
  • 10篇中文
  • 9篇多语
  • 9篇语言模型
  • 9篇源语
  • 9篇源语言
  • 8篇语言处理
  • 8篇自然语言处理
  • 8篇文档
  • 8篇目标语
  • 7篇舆情
  • 7篇神经网

机构

  • 115篇哈尔滨工业大...
  • 2篇黑龙江大学
  • 2篇教育部
  • 2篇全国组织机构...

作者

  • 116篇朱聪慧
  • 107篇赵铁军
  • 104篇曹海龙
  • 103篇徐冰
  • 99篇杨沐昀
  • 40篇郑德权
  • 5篇黄辉
  • 5篇朱俊国
  • 4篇张越
  • 4篇李生
  • 3篇刘乐茂
  • 2篇朱晓宁
  • 2篇张业
  • 2篇张文文
  • 2篇薛永增
  • 2篇韩习武
  • 2篇李振
  • 2篇韩雪
  • 2篇王亚楠
  • 2篇刘笛

传媒

  • 3篇智能计算机与...
  • 2篇中文信息学报
  • 2篇标准科学
  • 1篇电子与信息学...
  • 1篇高技术通讯
  • 1篇软件学报
  • 1篇指挥信息系统...

年份

  • 5篇2025
  • 24篇2024
  • 11篇2023
  • 16篇2022
  • 10篇2021
  • 9篇2020
  • 9篇2019
  • 7篇2018
  • 9篇2017
  • 2篇2016
  • 2篇2015
  • 4篇2014
  • 1篇2013
  • 3篇2012
  • 3篇2010
  • 1篇2009
116 条 记 录,以下是 1-10
排序方式:
基于无向图序列标注模型的中文分词词性标注一体化系统被引量:12
2010年
在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标注有机地统一在一个序列标注模型中。由于可以采用更深层次的依赖关系作为特征,一体化系统在1998年人民日报语料上取得了97.19%的分词精确率和95.34%的词性标注精确率,是目前同类系统,在这一语料上取得的最好结果。
朱聪慧赵铁军郑德权
关键词:中文分词词性标注
基于对比学习和多头自注意力机制的多模态情感分析方法
本发明提出了一种基于对比学习和多头自注意力机制的多模态情感分析方法,本发明采用预训练模型,对文本和图片进行序列特征提取,之后针对图像采用基于多头自注意力机制的Transformer‑Encoder结构进行二次序列特征提取...
徐冰曹海龙朱聪慧杨沐昀赵铁军李振
一种基于自学习策略的专利成果转化推荐方法及装置
一种基于自学习策略的专利成果转化推荐方法及装置,方法包括:获取专利数据集;从每个企业的专利中各抽取一件专利,组成训练集;采用多种方法计算所述训练集中每件专利的摘要文本与所述数据集中剩余专利的摘要文本的相似度;根据采用预设...
杨沐昀 吴禹橦徐冰曹海龙朱聪慧赵铁军
面向长文本场景的大语言模型安全风险评估方法、系统和设备
面向长文本场景的大语言模型安全风险评估方法、系统和设备,属于大语言模型技术领域,解决大语言模型在长文本场景的安全性保障严重不足,存在着极大的安全评估方法的缺口问题。本发明方法包括:大模型在面对长文本输入时,针对同一有害任...
杨沐昀胥卜凡徐冰曹海龙朱聪慧赵铁军
基于外部检索提高大语言模型在财务查询问题上准确率的方法及其系统
本发明属于计算机技术领域,具体涉及一种基于外部检索提高大语言模型在财务查询问题上准确率的方法及其系统。步骤1:对财务问题进行总结;步骤2:基于步骤1财务查询问题的总结对大语言模型进行训练;步骤3:对财务问题的复杂度进行判...
赵铁军徐冰朱聪慧杨沐昀曹海龙智和露钟俊深夏赫绅
一种基于深度学习面向公检法领域的相关事件识别方法
本发明公开一种基于深度学习面向公检法领域的相关事件识别方法。步骤1:采集网络上各种热点信息标题,进行非中文、非英文、非数字字符的清理并存储在数据库中;步骤2:对步骤1数据库中的热点信息标题采用文本分类技术及深度学习进行识...
赵铁军徐冰杨沐昀郭常江朱聪慧曹海龙
一种面向多语言大模型的词语表示学习方法
本发明提出一种面向多语言大模型的词语表示学习方法。所述方法在表示能力上能够显著高于主流的静态和动态词向量模型。本发明突破性地将单语词的向量表示改进为多点的流形表示。这种新的框架有望增加词向量空间的整体容量,更好地应对一词...
曹海龙杨沐昀朱聪慧赵铁军徐冰傅畅
基于多任务学习的篇章级文本连贯性分类方法
本发明提出基于多任务学习的篇章级文本连贯性分类方法,所述方法包括:步骤1、使用预训练模型得到篇章级文本中每一句话的句子向量表示;步骤2、将句子向量作为输入,使用Transformer模型,得到篇章级文本的整体向量表示;步...
赵铁军夏名宏朱聪慧徐冰杨沐昀曹海龙
文献传递
一种面向法律文本的多关系中主要关系的抽取方法
本发明公开了一种面向法律文本的多关系中主要关系的抽取方法。步骤1:根据选定的法律条文文本进行实体及实体间关系的定义;步骤2:根据步骤1的法律实体定义和关系定义,确定对法律原文的序列标注方式;步骤3:根据步骤2对法律原文的...
赵铁军杨沐昀徐冰徐家豫朱聪慧曹海龙
文献传递
一种基于翻译简易度的数据筛选方法
一种基于翻译简易度的数据筛选方法,它涉及一种数据筛选方法。本发明为了解决机器翻译数据增强过程中数据质量不佳的问题。本发明将扩增后的所有平行句对作为筛选的对象,首先,利用原有数据集训练得到一个语言模型,该语言模型用于后续的...
曹海龙杨沐昀徐冰 翁兆辰朱聪慧
共12页<12345678910>
聚类工具0