搜索到5831篇“ 文本相似度“的相关文章
- 语义文本相似度计算方法研究综述
- 2024年
- 语义文本相似度计算是自然语言处理领域一个关键任务,旨在衡量两个文本之间的语义相似程度。对以往经典和当前主流的语义文本相似度计算方法进行归纳和总结,将这些方法划分为传统的方法和基于深度学习的方法两大类。传统的方法又划分为基于字面匹配、基于统计和基于规则的方法。基于深度学习的方法又划分为基于词嵌入、基于句向量和基于预训练模型的方法。在进一步细分每个类别的基础上,详细介绍了各子类的典型方法,并对各种方法的基本思想、优点和局限性进行了深入分析和总结。最后,对语义文本相似度计算方法可能的发展方向进行了展望。
- 李莹伍胜徐聪尹刚张锦
- 关键词:文本相似度语义相似度自然语言处理
- 一种文本相似度确定方法及装置
- 本申请实施例公开了一种文本相似度确定方法及装置,该方法包括:将第一文本和第二文本分别进行分句处理,得到由第一文本中分句组成的第一句子集合以及由第二文本中分句组成的第二句子集合,并将第一句子集合与第二句子集合中的一个确定为...
- 张静军韩青姜琳
- 一种基于OCR的文本相似度计算系统
- 本发明公开了一种基于OCR的文本相似度计算系统,涉及人工智能技术领域。本发明包括文件预处理、OCR识别和文本相似度计算,文件预处理的输出端和OCR识别的输入端电性连接,OCR识别的输入端和文本相似度计算的输入端电性连接,...
- 姚娟邓小远胡龙湘韵黄胜张於
- 文本相似度计算方法、装置和电子设备
- 本发明实施例公开了一种文本相似度计算方法、装置和电子设备。获取第一文本和第二文本,对所述第一文本和第二文本进行分段处理以获取第一文本对应的第一分段和第二文本对应的第二分段,根据所述第一分段和所述第二分段的第一相似度确定相...
- 李林钦冯小琴李维丁辉吴玉虎
- 文本相似度的计算方法、装置、电子设备
- 本申请涉及一种文本相似度的计算方法、装置、电子设备。该方法包括:获取待处理文本,将待处理文本预处理,得到文本关键词;根据每一文本关键词在待处理文本中出现的概率,确定待处理文本的文本信息熵;根据待处理文本,确定对比文本,将...
- 张沛林苏同章骏李响洪荣芳
- 深度学习中文本相似度计算研究综述
- 2024年
- 文本相似度计算是自然语言处理的重要任务之一,通过总结分析学术界提出的经典方法和最新进展,对深度学习中文本相似度计算的文本表示和相似度计算两个模块进行分类整理和全面综述。社交网络的发展衍生出了短文本相似度计算这一重要子任务,因此针对每一模块,梳理文本相似度计算相关技术与理论基础,总结其在短文本中的具体应用及改进;整理文本相似度计算领域的常用数据集及评价指标;讨论文本相似度计算未来可能的发展方向。
- 徐传丽周世杰吴春江
- 关键词:文本表示文本相似度自然语言处理神经网络
- 一种文本相似度的确定方法及相关设备
- 本发明实施例公开了一种文本相似度的确定方法及相关设备,所述方法应用于数据处理技术领域,包括:调用主题词识别模型确定出第一文本对应的至少一个第一主题词和第二文本对应的至少一个第二主题词,并获取至少一个第一主题词中各个第一主...
- 刘念慈 李世武
- 文本相似度计算方法、装置、设备及存储介质
- 本申请适用于自然语言处理技术领域,提供一种文本相似度计算方法、装置、设备及存储介质,方法包括:对第一文本和第二文本分别进行维度学习,获取第一文本的文本特征和第二文本的文本特征,其中,文本特征中包含有多个词特征,各词特征均...
- 刘志慧陆林炳金培根林加新李炫
- 文本相似度学习方法、装置、设备以及存储介质
- 本申请公开了文本相似度学习方法、装置、设备以及存储介质,涉及自然语言处理和深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取文本对,其中,文本对包括第一文本和第二文本;获取第一文本对应的第一文本特征和第二文本对...
- 潘禄陈玉光
- 一种多特征融合的文本相似度判定方法
- 本发明提供了一种文本相似度判定方法,该方法在综合考虑文本的文本余弦相似度、编辑最短距离相似度、最长公共子序列相似度和杰卡德相似度等多个维度的相似度特征,在基于Sentence‑BERT模型的网络结构下,实现了多特征融合的...
- 沈永珞林泽禧
相关作者
- 余正涛

- 作品数:855被引量:1,218H指数:15
- 供职机构:昆明理工大学
- 研究主题:自然语言处理技术 越南语 机器翻译 跨语言 语料
- 龙华

- 作品数:571被引量:463H指数:9
- 供职机构:昆明理工大学信息工程与自动化学院
- 研究主题:语种识别 包装盒 相似度 语音 文本
- 张鹏程

- 作品数:334被引量:350H指数:8
- 供职机构:河海大学
- 研究主题:控制流图 神经网络 图像 X射线图像 测试用例生成
- 张涛

- 作品数:171被引量:110H指数:6
- 供职机构:哈尔滨工程大学
- 研究主题:光纤 镁合金 三轴磁强计 毛细管 多芯光纤
- 马海群

- 作品数:566被引量:4,502H指数:32
- 供职机构:黑龙江大学信息管理学院信息资源管理研究中心
- 研究主题:开放数据 知识产权 数字图书馆 信息公开 情报