搜索到984篇“ 主题特征“的相关文章
基于三维主题特征测度的新兴主题识别研究被引量:1
2024年
识别领域新兴主题有利于及时跟踪领域发展的最新动态,为科研工作者的选题以及科研管理者的决策提供情报支撑。本文提出一种基于三维主题特征测度的新兴主题识别方法,基于BERTopic对领域语义知识进行主题建模,以文献为基本单位进行主题表示,构建基于时间、引用和关联的三维主题特征指标框架,用于新兴主题识别;并以文本分类领域为例,验证本文方法的可行性与有效性。研究发现,以文献为基本单位表示主题能辅助主题深入挖掘,三维主题特征指标框架具有较好的适应性与扩展性,本文提出的新兴主题识别方法存在泛化应用的参考价值。在理论层面,能为新兴主题识别的相关研究提供一种可参考的方法和思路;在实践层面,可作为一种参考工具应用于科技情报分析、领域发展态势分析等场景。
郑德俊程为
关键词:主题建模文本分类
一种融合主题特征的短文本分类方法
本发明公开了计算机自然语言处理领域的一种融合主题特征的短文本分类方法。该方法首先从短文本中提取主题特征,通过将LDA模型获取的主题特征与Word2vec生成的词向量进行加权求和来捕捉短文本的核心主题。其次,再将短文本数据...
章超李波
一种基于LDA主题特征的日志异常检测方法
本发明是一种基于LDA主题特征的日志异常检测方法。该方法包含模型训练和异常检测两个阶段。在模型训练阶段,利用日志解析器将系统日志解析为日志模板集合和日志三元组集合,日志模板集合用以训练LDA模型,得到日志模板主题分类模型...
戴华 孙雪奎周建国周倩杨庚陈燕俐
在线健康社区中睡眠障碍疾病描述文本主题特征研究
2024年
目的/意义通过挖掘睡眠障碍疾病描述文本,深入了解睡眠障碍线上问诊的现状与睡眠障碍用户的在线问诊信息主题特征。方法/过程以“好大夫在线”平台为数据源,利用网络爬虫获取睡眠障碍相关医患信息,使用隐含狄利克雷分布模型识别患者疾病描述的主题。结果/结论睡眠障碍涉及科室较分散、治疗方式以药物为主,线上问诊能改善83.2%患者病情。用户疾病描述主题包括用药情况与咨询、外界环境、症状描述、代问与病因。建议平台与医生关注患者用药预后情况、心理健康状况,注重共病科普工作。
庞盼杏何彩荣张磊陈景信石荣丽徐中岳翁开源
关键词:睡眠障碍主题特征
融合主题特征和交叉注意力的级联信息传播预测方法
本发明公开了一种融合主题特征和交叉注意力的级联信息传播预测方法,包括如下步骤:S1,根据级联信息间的差异性进行不同主题特征的划分,并对不同主题特征进行特征提取;S2,根据交叉注意力机制融合用户表示和级联表示以学习特征表达...
刘小洋王浩田
融合多层次主题特征的文本摘要自动生成方法及装置
本发明属于文本数据处理技术领域,特别涉及一种融合多层次主题特征的文本摘要自动生成方法及装置,该方法包括首先基于平均词嵌入方法,将源文本对应的词向量映射成固定长度的句向量;然后将源文本对应的句向量输入到编码器中的双向GRU...
何欣陈永超刘红阳于俊洋王光辉
一种基于主题特征和内容语义的网页去重方法
本发明提供了一种基于主题特征和内容语义的网页去重方法,其特征在于,包括:利用HTML网页标签分类模型自动抽取目标网页的网页正文;基于网页正文进行主题计算和限定;网页相似度计算。本发明提供的方法能够一定程度地解决相关技术中...
朱海峰颜小君赵立为
技术交叉主题特征识别研究进展
2024年
技术交叉主题识别研究对于技术创新研究意义重大。本文首先分析了技术交叉的内涵,随后对技术交叉主题识别主要方法进行了系统调研、归纳与分析,最后总结现有研究特点及优劣。研究发现,当前技术交叉主题识别主要方法有信息计量、引文分析、网络分析、文本挖掘、知识图谱、机器学习,涉及弱信号、突破性、颠覆性识别。主要特点包括:1)由形态特征层面的计量测度转向内容特征层面的文本主题挖掘;2)基于技术交叉特性的关联分析、文本挖掘方法等成为主流;3)多种方法与技术结合运用。技术交叉主题识别的未来研究方向包括:深入微观层面主题特征识别;多种方法的综合性创新运用;多元数据融汇;多领域异构大数据融合与应用关键技术。
张娴李嘉晖
关键词:主题识别网络分析文本挖掘
融合主题特征的文本情感分析模型
2024年
随着大型语言模型的快速发展,如何在保证模型性能的同时减少模型参数量,成为了自然语言处理领的一个重要挑战。然而,现有的参数压缩技术往往难以兼顾模型的稳定性和泛化能力。为此,提出了一种融合主题特征的情感分析新架构,旨在利用主题信息增强模型对文本情感极性的判断能力。具体而言,采用一种结合LDA和K-means的方法来提取文本的主题特征,并将其作为固定维度的向量与词嵌入进行拼接,得到新的词向量表示。随后使用平均池化技术构建句子级别的表征向量,并输入到一个全连接层进行情感分类。为了验证所提模型的有效性,在公开的情感分析数据集上与多个基准算法进行了对比实验。实验结果表明,所提模型在多个数据集上明显优于ALBERT,准确率提高了约3.5%,在参数量仅有微小增加的情况下维持了较高的稳定性和泛化能力。
杨俊哲宋莹陈逸菲
关键词:情感分析LDA模型主题特征
图情档论文主题特征挖掘:基金论文与非基金论文比较分析被引量:1
2024年
[目的/意义]“图书情报与档案管理”一级学科更名为“信息资源管理”意味着图情档学科的发展迈入了新的阶段。在图情档学科研究稳步推进的过程中,科研基金的资助极大地促进了学科的科研产出。[方法/过程]该文基于关键词共现网络、主题社区划分以及可视化的方法,以CSSCI收录的文献为样本,揭示了图情档学科基金论文与非基金论文的主题结构,归纳和比较了其发展态势。[结果/结论]无基金资助的研究更聚焦图书馆发展理论与具体文化服务、信息服务项目建设,而基金资助的研究则更多关注大数据环境下的新兴计算机技术在图情档学科领域的具体应用。
游晟奕张子恒李杰赵艳
关键词:基金论文主题结构

相关作者

余正涛
作品数:855被引量:1,218H指数:15
供职机构:昆明理工大学
研究主题:自然语言处理技术 越南语 机器翻译 跨语言 语料
相艳
作品数:230被引量:246H指数:9
供职机构:昆明理工大学
研究主题:自然语言处理技术 越南语 注意力 情感分析 抽取方法
徐俊
作品数:180被引量:137H指数:7
供职机构:浙江工业大学
研究主题:语义 聚类方法 WEB服务 矩阵 单词
肖刚
作品数:616被引量:822H指数:14
供职机构:浙江工业大学
研究主题:图像 WEB服务 电梯 车牌 向量表示
陆佳炜
作品数:357被引量:225H指数:8
供职机构:浙江工业大学
研究主题:WEB服务 向量表示 语义 聚类方法 图像