方全
- 作品数:33 被引量:44H指数:4
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家科技攻关计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术机械工程航空宇航科学技术理学更多>>
- 问题加注标签方法、装置、电子设备和存储介质
- 本发明提供一种问题加注标签方法、装置、电子设备和存储介质,其中方法包括:获取目标问题和标签集合,标签集合内包含多个候选标签;对目标问题和各候选标签分别进行特征提取,得到目标问题的问题语义特征和各候选标签的标签语义特征;基...
- 徐常胜许诺佳钱胜胜方全胡骏
- 热点话题检测方法及装置
- 本发明涉及计算机技术领域,具体涉及一种热点话题检测方法。本发明的热点话题检测方法包括:基于预设实体知识库提取目标文本的关键句作为目标文本的摘要;使用LSH算法计算摘要的文档指纹;基于KNN算法对文档指纹进行聚类分析以确定...
- 徐常胜方全李泳锡
- 文献传递
- 基于知识图谱的用户建模方法、序列推荐方法
- 本发明属于用户建模与推荐系统领域,具体涉及一种基于知识图谱的用户建模方法、序列推荐方法,旨在为了解决现有用户建模方法无法有效提取用户动态访问信息的特征,准确捕捉用户兴趣;现有序列推荐系统推荐准确率不高,用户体验较差的问题...
- 徐常胜黄晓雯方全钱胜胜桑基韬
- 文献传递
- 虚假新闻检测方法、装置、电子设备和存储介质
- 本发明提供一种虚假新闻检测方法、装置、电子设备和存储介质,所述方法包括:将待检测新闻数据输入至新闻检测模型中,得到新闻检测模型输出的新闻检测结果;其中,新闻检测模型用于提取待检测新闻数据的多个文本特征和图像特征,基于自注...
- 徐常胜 钱胜胜方全
- 基于有监督对比的跨模态检索方法、系统及设备
- 本发明属于跨模态检索领域,具体涉及了一种基于有监督对比的跨模态检索方法、系统及设备,旨在解决现有的监督式跨模态学习方法一般通过线性投影捕获数据相关性,且通常聚集于最大化成对相关性或分类准确性,InfoNCE损失平等对待所...
- 徐常胜钱胜胜方全
- 文献传递
- 基于图对比注意力网络的知识图谱补全被引量:4
- 2022年
- 知识图谱(KG)补全旨在通过知识库中已知三元组来预测缺失的链接。由于大多数方法都是独立地处理三元组,而忽略了知识图谱所具有的异质结构和相邻节点中固有的丰富的信息,导致不能充分挖掘三元组的特征。考虑基于端到端的知识图谱补全任务,提出了一种图对比注意力网络(GCAT),通过注意力机制同时捕获局部邻域内实体和关系的特征,并封装实体邻域上下文信息。为了有效封装三元组特征,引入一个子图级别的对比训练对象用于增强生成的实体嵌入的质量。为了验证GCAT的有效性,在链接预测任务上评估了所提方法,实验结果表明,在数据集FB15k-237中,MRR比InteractE提高0.005,比A2N模型提高0.042;在数据集WN18RR中,MRR比InteractE提高0.019,比A2N模型提高0.032。实验证明提出的GCAT模型能够有效预测知识图谱中缺失的链接。
- 刘丹阳方全张晓伟胡骏钱胜胜徐常胜
- 关键词:链接预测
- 基于图对比的上下位关系检测
- 2022年
- 上下位关系是自然语言处理(NLP)下游任务的基础,因此上下位关系检测是自然语言处理领域备受关注的问题。针对现有词嵌入方法采用随机初始化词向量,不能很好地捕获上下位关系不对称和可传递的特性,且现有模型没有充分利用预测向量与真实投影之间关系的局限性,提出了一种基于图对比学习的上下位关系检测(HyperCL)方法。引入图对比学习进行数据增强,基于最大化局部和全局表示的互信息,学习具有鲁棒性的词特征表示。所提方法学习了将下位词的词向量投影到上位词和非上位词,同时能够更好地区分嵌入空间中的上位词和非上位词,从而提高了检测精度。在2个基准数据集上的实验结果表明,所提模型比现有方法在准确率上提升了0.03以上。
- 张雅丽方全王允鑫胡骏钱胜胜徐常胜
- 命名实体识别方法、装置、电子设备及存储介质
- 本发明提供一种命名实体识别方法、装置、电子设备及存储介质,其中命名实体识别方法包括:获取待识别医学文本及与待识别医学文本关联的医学图像;将医学文本及医学图像输入至命名实体识别模型的编码器,得到多层文本编码特征及多层图像编...
- 徐常胜张凡李泳锡方全
- 文本链接嵌入方法
- 本发明涉及互联网文本分析技术领域,具体涉及一种文本链接嵌入方法,所述方法是根据预设的字符级特征向量进行向量拼接得出待检测文本的目标词条和知识实体库中实体的特征向量,然后计算实体和目标词条的特征向量相似度以找到与目标词条对...
- 徐常胜方全李泳锡
- 文献传递
- 多模态多层次事件网络的谣言检测被引量:3
- 2021年
- 目的自动检测谣言至关重要,目前已有多种谣言检测方法,但存在以下两点局限:1)只考虑文本内容,忽略了可用于判断谣言的辅助多模态信息;2)只关注时间序列模型捕捉谣言事件的时间特征,没有很好地研究事件的局部信息和全局信息。为了克服这些局限性,有效利用多模态帖子信息并联合多种编码策略构建每个新闻事件的表示,本文提出一种新颖的基于多模态多层次事件网络的社交媒体谣言检测方法。方法通过一个多模态的帖子嵌入层,同时利用文本内容和视觉内容;将多模态的帖子嵌入向量送入多层次事件编码网络,联合使用多种编码策略,以由粗到细的方式描述事件特征。结果在Twitter和Pheme数据集上的大量实验表明,本文提出的多模态多层次事件网络模型比现有的SVM-TS(support vector machine—time structure)、CNN(convolutional neural network)、GRU(gated recurrent unit)、CallAtRumors和MKEMN(multimodal knowledge-aware event memory network)等方法在准确率上提升了4%以上。结论本文提出的谣言检测模型,对每个事件的全局、时间和局部信息进行建模,提升了谣言检测的性能。
- 李莎张怀文钱胜胜方全徐常胜
- 关键词:多模态社交媒体